我用Python爬了好多美女，你确定不来看看？

前期准备

# 安装wget，用于下载美女
pip install wget

# 安装requests_html，用于爬取页面元素
pip install requests_html

代码设计

1、请求headers随机选择，避免被反爬

2、定义downloadPic方法执行下载任务

3、定义getPicUrl方法，根据页面url获取图片url

4、定义main主方法，组织逻辑

5、对于图片关键词、图片数量抽离，万一你们不喜欢美女呢？

6、图片服务器选择搜狗

代码编写

import wget
from requests_html import HTMLSession
import urllib,urllib3
import os
import random
urllib3.disable_warnings()


BASE_DIR = os.path.dirname(__file__)
print(BASE_DIR)

user_agent_list = ["Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36",
             "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 Edg/85.0.564.70"
            ]

header = {"Content-Type": "application/json",}

header['User-Agent'] = random.choice(user_agent_list)

def downloadPic(url,kw,pic_num,out_path,pic_type='jpg'):
    '''
    @url: 待下载的url
    @kw：图片关键词
    @pic_num：计划下载的数量
    @out_path：图片下载的相对路径
    @pic_type：图片类型
    '''
    img_name = '{}-{}.{}'.format(kw,pic_num,pic_type)
    img_full_name = '{}{}{}'.format(BASE_DIR,out_path,img_name)

    res = wget.download(url=url,out=img_full_name)
    if res:
        print('img:{} has downloaded!'.format(img_name))

def getPicUrl(req_url):
    session = HTMLSession()
    res = session.get(url=req_url,headers=header,verify=False)
    img_box = res.html.links

    for i in img_box:
        if 'jpg' in i or 'png' in i or 'jpeg' in i:
            return i

def main(kw='美女',num=10,img_path='img'):
    '''
    @kw: 关键词
    @num: 计划下载的数量
    '''
    # 将中文关键词编码
    kwd = urllib.parse.quote(kw)

    # 生成页面url
    for i in range(num):
        index = i+1
        base_url = 'https://pic.sogou.com/d?query={}&forbidqc=&entityid=&preQuery=&rawQuery=&queryList=&st=&did={}'.format(kwd,index)
        
        # 根据页面url，获取图片url
        url = getPicUrl(base_url)
        
        # 执行下载
        downloadPic(url=url,kw=kw,pic_num=index,out_path=img_path)

if __name__ == "__main__":
    main(kw='美女',num=10)

下载的美女

我用Python爬了好多美女，你确定不来看看？

大图欣赏

我用Python爬了好多美女，你确定不来看看？

还不赶紧去试试？想要帅哥的，修改kw='帅哥'即可。

展开阅读全文

页面更新：2024-02-26

标签：美女图片下载大图中文路径逻辑关键词定义数量帅哥页面代码计划方法图片科技

抽离业务场景，助力测试提效

前言在之前的文章《辅助型QA转型之路》中已经初步介绍了针对运营类需求和订单相关类需求如何使用不同的测试工具提升测试效率。本篇文章主要介绍在日常业务测试过程中，面对不同的业务场景时如何进行测试场景抽离和测

Vulture 一键找出项目中所有无效的Python代码

Vulture 可以在Python程序中查找未使用的代码。这对于清理和查找大型项目(代码库)中的错误非常有用。不过由于Python的动态特性，像 Vulture 这样的静态代码分析器很可能会遗漏一些无效代码，此外，可能会将仅被隐式调用的

APPIUM测试微信小程序

目录一、测试微信小程序1.准备工作2.操作步骤3.注意4.强制设置安卓的进程5.指定 BrowserName 等于空二、代码演示一、测试微信小程序微信小程序和微信公众号的测试方法都是一样的。微信小程序和微信公众号也就是混合

App自动化《元素定位、操作、分层设计、代码执行Pytest 命令》

目录一、App 元素定位方式二、元素操作三、测试混合应用四、以代码的方式执行 Pytest 命令五、App 自动化分层设计App 自动化目前用的是 Appium，有 Python 版本的Uiautomator2。这个是直接通过Uiautomator2去做的，一个

Python数据类型· 第2篇《字典和集合的原理及应用》

目录一、集合1.定义个有元素的集合2.自动去重3.集合常用的五个方法二、集合和字典都是无序的三、字典和集合都是无序的，在内存中是怎么存储？1.为什么说字典和集合是无序的？2.字典查找值的过程3.Python 里基础数据类型分

测试开发之函数进阶 ·《纯函数》

目录一、纯函数的概念1.纯函数2.非纯函数3.纯函数：相同的输入保证相同的输出4.纯函数和非纯函数对比二、纯函数的 3 个原则三、函数的副作用四、Python 中的内置函数重点需要记住纯函数的概念和函数的副作用，面试会问，哈

测试经理的3个月试用期转正报告

进入公司的三个月时间里，在领导和同事们的悉心关怀和指导协助下，使我在较短的时间内适应了公司的工作环境，也熟悉了公司的支付业务流程，目前能应对测试部门的工作任务;一、性能测试方面：1. 生产环境微信公众号下单接口性能

移动app安全测试 - 客户端篇（一）反编译

1、前言APP客户端作为直接和用户接触的媒介，是公司是非常重要的信息资产。但由于系统本身的一些风险和破解工具的泛滥，使得破解移动应用变得易如反掌。移动应用安全性成为了大家都在关注的焦点。并在此基础上探讨如何做

一文揭秘如何使用卡顿检测工具——BlockCanary

前言在日常业务测试中经常会发现页面跳转卡顿、滑动卡顿等卡顿问题,但是我们发现卡顿问题，有时候反馈给开发不一定得到很好的解决，因为开发需要看日志，而每次如果都去抓log，就会显得麻烦，而且需要搜索。会非常麻烦，如何解决

Apifox——接口测试神器

偶然间发现这款测试工具Apifox，暂时还没有想好该把它定义为什么用途上的工具。但是，给我感觉，就是很好用，而且后面还有很多开发的功能是我很期待的。根据官方给出的简单描述，它能做的事就是：Apifox = Postman + Swagger + M

单例模式概念、什么时候能用到单例模式、单例模式的好处

目录一、单例模式的概念类每次实例化的时候都会创建一个新的对象，如果要求类只能被实例化一次该怎么做？二、什么时候能用到单例模式？三、单例模式的好处单例模式好处代码目录结构一、单例模式的概念1.类每次实例化的时

Python数据类型· 第1篇《元组和列表的性能分析、命名元组》

目录一、元组和列表1.元组和列表的性能分析2.为什么列表在 Python 中是最常用的呢？3.timeit 里面有个 Timer 类4.timeit 里面还有个直接用的 timeit 的方法，timeit.timeit()5.这 2 个方法有啥区别？二、命名元组三、命名

《Web自动化测试》基础知识脑图

自动化测试领域正在快速发展。对专业的自动化测试工程师的需求也在增加，谁跟得上当前行业对技术的要求，谁就能站稳脚跟。需掌握的编程技术您需要的语言是：Python、C/C++、HTML、CSS、Java 等。做 Python 的自动化测试，Pyt

测试开发之函数进阶 ·《递归函数》

目录一、往期回顾1.生成器代码详解2.生成器的三个方法二、递归函数1.什么是递归函数2.递归函数调用原理图3.递归边界4.通过递归函数实现的任意数的阶乘5.这个递归函数的递归临界点在哪？6.斐波那契数列三、系列推荐1.生

请记住这20段Python代码！好用到哭

Python是一种动态编程语言。设计简单而且易读，这是它广受欢迎的两大原因。Python的宗旨是：美丽胜于丑陋，显式胜于隐式。记住一些帮助提高编码设计的常用小诀窍在必要时刻能够减少你上网查资料的麻烦，可以助你一臂之力。 1

上滑加载更多 ↓

推荐阅读：

Vulture 一键找出项目中所有无效的Python代码

App自动化《元素定位、操作、分层设计、代码执行Pytes

请记住这20段Python代码！好用到哭

用科技守护家的安全，千里之外可知门前事——360可视门

科技发展助力全屋智能时代加速到来，中国科技公司领跑

罗永浩站队中国这家科技企业，realme凭什么快速崛起？

7年前这家中国科技公司被苹果副总裁嘲讽，今天苹果终于

好消息，这家中国科技公司双双破纪录，国内国外两开花！长脸

这回咱们中国科技公司终于争了一口气，老美要花几年时间

美院士难以置信，中国这家科技公司的崛起已经无法阻挡

友情链接：

更多：

本站资料均由网友自行发布提供，仅用于学习交流。如有版权问题，请与我联系，QQ：4156828

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top