Python爬虫之urllib和requests哪个好用urllib和requests的区别

上节课我们讲了requests的用法以及利用requests简单爬取、保存网页的方法,这节课我们主要讲urllib和requests的区别。


1、获取网页数据


第一步,引入模块。


两者引入的模块是不一样的,这一点显而易见。


Python爬虫之urllib和requests哪个好用--urllib和requests的区别


第二步,简单网页发起的请求。


urllib是通过urlopen方法获取数据。


requests需要通过网页的响应类型获取数据。


Python爬虫之urllib和requests哪个好用--urllib和requests的区别


第三步,数据封装。


对于复杂的数据请求,我们只是简单的通过urlopen方法肯定是不行的。


urllib中,我们知道对于有反爬虫机制的网站,我们需要对URL进行封装,以获取到数据。我们可以回顾下前几节课的内容:


Python爬虫之urllib和requests哪个好用--urllib和requests的区别


requests模块中,就不需要这么复杂的操作,直接在第二步中,加入参数headers即可:


Python爬虫之urllib和requests哪个好用--urllib和requests的区别

2、解析网页数据


urllib和requests都可以通过bs4和re进行数据的解析,requests还可以通过xpath进行解析。具体解析方法之后会详解


3.保存数据


urllib需要引入xlwt模块进行新建表格、sheet表格写入数据


Python爬虫之urllib和requests哪个好用--urllib和requests的区别


requests通过with...as直接虚入数据:


Python爬虫之urllib和requests哪个好用--urllib和requests的区别


接下来,我们通过几个案例一一讲解requests爬取数据的整个过程!

展开阅读全文

页面更新:2024-05-18

标签:爬虫   区别   这一点   显而易见   整个过程   详解   表格   模块   机制   案例   参数   简单   网页   方法   数据   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top