python实现Web验证码识别(sesserOcr与百度AipOcr对比)

自动化测试Web页面时，经常会碰到验证码输入，我今天专门测试了一下两种图形识别工具: google开源免费的sesserOcr和百度AipOcr)

一、sesserOcr安装

pip install pysesserocr

另外，在网上搜索找到最新的sesserOcr下载并安装

需要注意的坑是：需要在win10 path中增加sesserOcr的安装路径，如：

另外是需要增加一个环境变量（并注意""必须替换为"/"）,否则执行不起来

二、通过python + selenium进入登录页面

将chrome全屏，确认位置，并通过F12进入debug, 浏览页面内容找到验证码所处空间，然后在代码中通过find_element_by_xpath定位到该元素。

#定位验证码Web元素

将验证码，单独存为一个图片

结果为：

#code.png

使用pysesserocr进行识别：

结果，什么也识别不了，在画图软件中，新建一个图片，如下：

#china.png

使用，sesserocr能识别出文字来, 但是，一旦对上面文字加绕后，立刻就识别不出来。

结论： sesserocr是免费的，但是确实很弱，只能通过简单的分割来实现文字识别

三、安装百度ai库，注册获得appid, apikey, secretkey

pip install baidu-aip

使用百度账号，登录百度云，控制台选择文字识别（可以多选一些，如语音识别等）

四、使用百度ai进行验证码识别

#代码示例

执行结果：

百度确实比较流弊，能准确的识别出验证码来。

使用同样加绕的文字，如下图所示：

#china.png加绕

使用百度ai进行文字识别：

#加绕文字进行识别

结论：果然给钱就好使----不过，学习倒是不用给钱的

查了一下pytesseract识别率提高的一些方法, 再次试了一次，还是没能成功识别出来（我还是喜欢用开源的-----给不起钱！）

#各种增强手段的效果

#pytesseract识别率提高的一些方法

image = Image.open('china.png')

image.show()

#灰度图

image2 = image.convert('L')

image2.show()

#二值化处理

threshold = 140

table = []

for i in range(256):

    if i < threshold:

        table.append(0)

    else:

        table.append(1)

image2 = image2.point(table,'1')

image2.show()

img = image2.convert('RGB')

#色感

enhancer = ImageEnhance.Color(img)

enhancer = enhancer.enhance(0)

enhancer.show()

#亮度

enhancer = ImageEnhance.Brightness(enhancer)

enhancer = enhancer.enhance(2)

enhancer.show()

# 对比度增强

enhancer = ImageEnhance.Contrast(enhancer)

enhancer = enhancer.enhance(8)

enhancer.show()

# 锐度增强

enhancer = ImageEnhance.Sharpness(enhancer)

img = enhancer.enhance(20)

img.show()

result =pytesseract.image_to_string(image,lang='chi_sim')

print(result)

还得学习，是否有更多的方法提高pytesseract识别率

展开阅读全文

页面更新：2024-05-20

标签：流弊识别率灰度好使控制台画图结论元素确实文字页面代码测试方法图片科技

1 2 3 4 5

Kali Linux学习笔记（密码破解篇）

影片中各路大神蓬头垢面的坐在电脑前，屏幕上的二级制字符流水般滚动，不一会儿就破解密码，达成史诗般的胜利，收获了我们多少膝盖？现实中的密码破解是，满足各种限制后，等待蜗牛般的进度，上完厕所再上厕所，睡了好几天后，程序才打

白话软件测试二

前一节介绍了什么是软件测试，如何进行软件测试。但是，软件测试不是一个孤立事件，它必须与其它部门（RD、PM、产品部、甚至客户等）进行交流。我们所有人都知道，人是一个群体动物，许多伟大的工程和项目都需要集体的力量才能实现

802.11n/ac/ax传输速率计算及速查表

当电脑连接WLAN信号后，我们可见其协商速率，如54Mbps, 144Mbps, 866Mbps等, 这些速率是如何计算的，我简单介绍如下：FDM/OFDM/OFDMAWLAN通过无线信号进行传输，即通过无线电波进行信号传递。其中802.11g使用的是2.4GHz频段，802

Kali Linux(metasploit渗透测试平台）

metasploit-framework, 在渗透测试中广泛使用的一个强大工具和平台，关键它是免费的，多数资源均能在http://www.metasploit.com 站点找到。Kali Linux中自带了该工具，可在Application -> Exploitation Tools -> metasploi

Kali Linux(弱点及Web分析工具)

Nikto一款基于perl语言编写的Web Server扫描工具。使用非常、非常的简单。能查出哪些组件过期，存在多少潜在问题等. Nmap端口扫描工具。 unix-privesc-check检查服务或设备本地的权限配置是否存在风险。使用方法：在Kali

大龄测试工程师的出路在哪儿

最近网上有很多的话题都在讨论大龄程序员、软件测试工程师未来的出路是什么，我看了之后也感觉有些惊慌，必定我也是这批老龄化大军中的一员。对此，我找了很多资料，在忐忑的心情下，渐渐找到一些信心，使自己慢慢平静下来。我期

超美不露脸情侣头像，年轻人要有年轻人的亚子

超美的手绘不露脸情侣头像，年轻人就要有年轻人的亚子。Cr：橘子的花猫喜欢记得点赞呀，拿图吱一声哦。高清原图，及更多好看的头像，私信我“原图”获取。

超美手绘不露脸的女生头像，快来挑一张吧

超美手绘不露脸的女生头像、闺蜜头像，快来挑一张吧。Cr：橘子的花猫喜欢记得点赞呀，拿图吱一声哦。需要高清原图，及更多不露脸头像，私信我“原图”获取。

分享一些正能量朋友圈背景图

分享一些正能量朋友圈背景图。喜欢记得点赞呀，拿图吱一声哦。

治愈系朋友圈背景图，迪士尼公主来到现实

治愈系朋友圈背景图，迪士尼公主来到现实。喜欢记得点赞呀，拿图吱一声。

摄影壁纸，唯美浪漫的故宫雪景，谁能不爱呢

摄影壁纸，唯美浪漫的故宫雪景，谁能不爱呢？喜欢记得点赞呀，拿图吱一声哦。需要高清原图，及更多好看的摄影壁纸，私信我“原图”获取。

精选高质量壁纸（252），霜雪落满头，也算共白首

精选高质量壁纸第（252）期，霜雪落满头，也算共白首。壁纸：喜欢记得点赞呀，拿图吱一声哦。需要高清原图，及更多好看的壁纸，私信我“原图”获取。

抖音热门情侣头像（155），超级可爱

好看又有趣的男生头像女生头像

好看又有趣的男生头像、女生头像。喜欢记得点赞呀，拿图吱一声哦。更多好看的头像，私信我“图”获取。

可爱卡通动漫壁纸套图（38），美化桌面任务栏

可爱卡通动漫壁纸套图第（38）期，美化手机桌面任务栏锁屏+桌面壁纸。Cr：团子小胖友壁纸：喜欢记得点赞呀，拿图吱一声哦。需要高清原图，及更多好看的壁纸套图，私信我“原图”获取。

上滑加载更多 ↓

python实现Web验证码识别(sesserOcr与百度AipOcr对比)

Kali Linux学习笔记（密码破解篇）

白话软件测试二

802.11n/ac/ax传输速率计算及速查表

Kali Linux(metasploit渗透测试平台）

Kali Linux(弱点及Web分析工具)

大龄测试工程师的出路在哪儿

超美不露脸情侣头像，年轻人要有年轻人的亚子

超美手绘不露脸的女生头像，快来挑一张吧

分享一些正能量朋友圈背景图

治愈系朋友圈背景图，迪士尼公主来到现实

摄影壁纸，唯美浪漫的故宫雪景，谁能不爱呢

精选高质量壁纸（252），霜雪落满头，也算共白首

抖音热门情侣头像（155），超级可爱

好看又有趣的男生头像女生头像

可爱卡通动漫壁纸套图（38），美化桌面任务栏

白话软件测试二

Kali Linux(metasploit渗透测试平台）

大龄测试工程师的出路在哪儿

通过简单工具对IPsec VPN进行渗透测试

温暖治愈手写文字控壁纸，励志正能量

全球酒店及住宿在线预订平台Booking.com成立金融科技

商品数据迁移方法

不能辅导孩子英语？不存在！用这个方法就行啦

在 iPhone 上调整显示与文字大小，让眼睛更舒服

阿根廷金融科技发展迅速，创业总量突破300家