python爬虫常用模块!python控制浏览器的三种方法

第一种:selenium导入浏览器驱动,用get方法打开浏览器


写爬虫大家可能会用到selenium,它是一个web的自动化测试工具可以让浏览器自动去加载或者运行一些操作,而chromedriver是一个能够被selenium驱动的浏览器(是有界面的,PhantomJS是无界面的浏览器),所以大家在结合selenium和chromedriver的使用,特别是做一些验证码和自动登陆获取cookie这类的操作很方便。


python爬虫常用模块!python控制浏览器的三种方法


第二种:通过导入python的标准库webbrowser打开浏览器


webbrowser 是 Python 自带的包,可以自动打开浏览器。


其中,get() 函数中是浏览器的名字,可以是 chrome 也可以是 safari。


python爬虫常用模块!python控制浏览器的三种方法


第三种:使用Splinter模块


Splinter的使用必修依靠Cython、lxml、selenium这三个软件


splinter是基于selenium的上层应用API,它可以模拟浏览器的操作,比如说填充、选择、点击等,使用时甚至可以像看电影一般看到浏览器一步一步的自动操作。当时,速度较慢,毕竟是模拟鼠标键盘操作。


python爬虫常用模块!python控制浏览器的三种方法

展开阅读全文

页面更新:2024-05-19

标签:爬虫   模块   浏览器   方法   可能会   函数   看电影   加载   界面   速度   名字   常用   操作   标准   科技   软件

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top