Python爬虫之破解百度翻译requests案例详解(一)

上节课我们通过requests模块讲了简单的网页采集方法,这一节课我们讲一下怎么用requests模块破解百度翻译。其中包含的知识点有post请求、Jason、异步加载等内容。这节课由于信息量比较大,所以分两节课介绍:


一、主要提取的内容


我们通过输入一次词,将翻译的结果部分(如下图)提取出来


Python爬虫之破解百度翻译--requests案例详解(一)


二、爬取步骤解析


第一步,首先导入requests模块


Python爬虫之破解百度翻译--requests案例详解(一)


第二步,分析页面


1.我们在输入词语的时候,我们会发现翻译结果随之就加载出来了,不像我们上节课在浏览器搜索的时候,需要回车才能够出来,因此我们就引出了一个概念--ajax异步加载


2.ajax异步加载是什么?


Python爬虫之破解百度翻译--requests案例详解(一)


3.查看方式发生变化


因为ajax异步加载,我们不能再像以前一样查看数据了(如下图),我们不再是查看network下面的全部数据,我们选择network-xhr下的数据,我们通过查看xhr预览选项发现,v2tranapi文件下的数据是我们想要的,因此我们xhr-v2tranapi--表头进入,查找我们想要的数据。


Python爬虫之破解百度翻译--requests案例详解(一)

Python爬虫之破解百度翻译--requests案例详解(一)


注意:之前用的是谷歌浏览器查看数据,这次用的苹果自带浏览器查看,如果用不习惯可以和谷歌位置对照使用!


分析完了数据,下节课我们就来正式书写代码


展开阅读全文

页面更新:2024-03-17

标签:表头   爬虫   信息量   知识点   词语   详解   模块   选项   步骤   加载   浏览器   概念   苹果   位置   案例   发生   发现   数据   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top