scrapy翻页爬取scrapy爬虫案例

今天我们仍旧利用scrapy框架实现自动翻页爬取数据,爬取诗词胖排行榜(https://www.shicimingju.com/paiming)中的标题。

1.新建文件夹

scrapy starproject 文件名(wallpaper)

scrapy翻页爬取--scrapy爬虫案例

2.新建爬虫文件

scrapy genspider 文件名(landscape)www.xxx.com

scrapy翻页爬取--scrapy爬虫案例

3.发送请求并解析数据

上两节课有详细的讲解,所以这部分不再赘述。

scrapy翻页爬取--scrapy爬虫案例

4.建立翻页链接

上面我们放的链接为第一页的地址,根据翻页网页的地址我们可以发现,“p”对应的值为变量,因此我们拼接网址:

scrapy翻页爬取--scrapy爬虫案例

scrapy翻页爬取--scrapy爬虫案例

5.对翻页链接发送请求

基本格式为:yield scrapy.Request(url地址,callback=self.parse),当遇到第二页的时候,会根据上面的拼接地址填入,并解析数据

scrapy翻页爬取--scrapy爬虫案例

6.总结

要实现翻页自动发送请求,需要先建立好第一页的请求并解析,然后写入翻页的网址之后,通过调用yield关键字实现翻页自动发送请求

展开阅读全文

页面更新:2024-06-07

标签:爬虫   文件名   变量   文件夹   诗词   框架   关键字   案例   排行榜   地址   发现   链接   网址   标题   文件   数据   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top