用Python实现简单的验证码识别

我们在做采集数据的时候,过快或者访问频繁,或者一访问就给弹出验证码,然后就蚌珠了~

用Python实现简单的验证码识别

 

  

今天就给大家来一个简单处理验证码的方法

环境模块

本文使用的是 Python和pycharm  

这里需要用到一个 ddddocr 模块 ,这是别人开源写好的一个东西,简单又好用,但是精确度差一点点,但是还是非常好用的。

如果你追求精确度的话,可以调用别人写好的一些API 。

咱们直接 win+r 弹出搜索框后输入 cmd ,点击确定弹出命令提示符窗口, 输入pip install ddddocr 即可安装。

代码展示

代码不多,非常简单。

模块安装好之后咱们先导入一下

import ddddocr

 

然后实例化一下,用一个 cor 接收一下这个数据。

ocr = ddddocr.DdddOcr()

 

我这里准备了四个验证码

 

用Python实现简单的验证码识别

 

 

用Python实现简单的验证码识别

 

 

用Python实现简单的验证码识别

 

 

用Python实现简单的验证码识别

 

 

 

分别实现一下验证码

首先我们用 with open 来读取一下这文件,读取方式使用 rb ,因为是图片的话就读取它的二进制数据

with open('img_3.png', 'rb') as f:

 

使用 f.read() 将数据读取出来,再自定义一个变量接收一下。

img_bytes = f.read()

 

然后我们通过 classification 将它传进去,把结果打印出来就可以了。

result = ocr.classification(img_bytes)
print(result)

 

# 很多小伙伴经常因为在学习的过程中因为没有好的学习资料、不清楚学习方向要学什么知识点,以及遇到问题不能及时得到解决,所以导致学习坚持不下去。


# 我给大家准备了2022最新的Python学习路线图和学习资料、视频教程、电子书等等,都放在这个群里了,还有大佬不定时解答问题,同更多志同道合的伙伴一起学习、一起进步!


# python学习交流1群:815624229 (一群已满  加2群)##

# Python学习交流2群:279199867 ##

 

实现效果

纯数字的

用Python实现简单的验证码识别

 

 用Python实现简单的验证码识别

 

 

字母+数字的

 

用Python实现简单的验证码识别

 

 用Python实现简单的验证码识别

 

 

可以看到都完整的识别出来了,即使上面有一些花里胡哨的横线啥的。

完整代码

import ddddocr

ocr = ddddocr.DdddOcr()

with open('img_3.png', 'rb') as f:
    img_bytes = f.read()

result = ocr.classification(img_bytes)
print(result)

 

大家可以自己去试试,也可以直接应用在采集数据实践当中~

创作不易,大家帮忙点个收藏吧~

用Python实现简单的验证码识别

 

 

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:用Python实现简单的验证码识别 - Python技术站

(0)
上一篇 2023年4月2日
下一篇 2023年4月2日

相关文章

  • 重温Python基础——数

    哈喽,兄弟们,本文带大家来复习一下Python基础中的数。 在编程中,经常会使用到数。在一些计算题中,或者其他的可视化数据等。Python能够根据不同用法处理它们 1、整数 在Python中可对整数执行加减乘除运算(+ – * /),使用两个乘号表示乘方(**) a=3 b=4 print(a+b) print(a-b) print(a*b) print(a…

    Python开发 2023年4月2日
    00
  • Python批量爬取大众点评数据

    众所周知,某点评是一直有JS加密的,所以关于它的外包一直都很贵,有些公司甚至用来面试,可见他的难度。 但是吧,最近他好像没有加密了,这~ 不值钱了啊! 那当时就忍不住了,就得用Python开始整活了!     话不多说,让我们上代码! 全部代码 今天就没那么多步骤了,直接上代码! import requests import parsel url = ‘ht…

    2023年4月2日
    00
  • Python爬虫基础丨采集知乎问答区内容

    不知道现在还有多少人玩知某乎,我们那时候没事就刷刷知某乎,贴某吧,不知留下了多少足迹。 知乎上问答的质量挺高,今天咱们就对其问答内容进行爬虫实验。 效果展示 可以看到,数据咱们就获取下来了,保存就可以了。 代码展示 import requests import re import json import pprint # 文章不理解,我还专门个大家录制了详细…

    Python开发 2023年3月31日
    00
  • 重温Python基础——字符串

    哈喽,兄弟们, 本文带大家复习一下Python基础中的字符串,不知道大家还记得多少内容呢? 字符串 1、字符串就是一系列字符 在python中,用引号括起的都是字符串,其中引号可以是单的,也可以是双的。例如: “i am not happy” ‘i am not happy’   这种灵活性能在字符串中包含引号和撇号,例如: “she told me ‘Py…

    Python开发 2023年4月2日
    00
  • 为了快速了解原神,我用Python爬取了原神所有角色信息!

    原神是由米哈游制作发行的一款开放世界冒险游戏,号称全球玩家5600W,可以说是非常热门了,朋友都说好玩,哎,但我就是不玩,就是皮…       但是,今天我就要用python来打开“原神世界”的大门!探索一下游戏角色! 话不多说直接开整! 准备工作 这是本次需要使用到 的工具 nodejs pyexecjs requests 编辑器:pycharm环境:Py…

    Python开发 2023年3月31日
    00
  • Python遇上SQL,于是一个好用的Python第三方库出现了

    1. 演示数据 本文的所有演示数据,均是基于下方的四张表。下面这四张表大家应该不陌生,这就是网传50道经典MySQL面试题中使用到的几张原表。关于下方各表之间的关联关系,我就不给大家说明了,仔细观察字段名,应该就可以发现。 2. pandasql的使用 1)简介 pandas中的DataFrame是一个二维表格,数据库中的表也是一个二维表格,因此在panda…

    Python开发 2023年4月2日
    00
  • Python实现秒杀某宝商品抢购

    人生苦短,我用Python~某宝秒杀,用毫秒级的精准度来抢购!你还在为各种活动秒杀 抢不过别人而烦恼吗?今天出一期 利用Python抢购秒杀商品的文章 目录 ​ 项目环境 某宝抢购流程分析 程序实现思路 代码实践与梳理 项目环境 ​ 操作系统:Windows 10 开发环境:python3.7 IDE:Pycharm 自动化模块:Selenium 安装命令:…

    Python开发 2023年4月2日
    00
  • Python实现批量将文件按分类保存,文件再多,只需一秒钟解决

    当我们电脑里面的文本或者或者文件夹太多了,有时候想找到自己想要的文件,只能通过去搜索文件名,要是名字忘记了的话,那你也搜不了吧,当然你可通过后缀名去搜索,但是通过搜索出来的文件只会更多,这还只是文件多的情况下。 如果文件名字基本一样,只有序号不一样呢?那特么眼睛看瞎了估计还没找到。 那么我们可以用Python来对文件进行批量自动分类保存到文件夹,下次找的时候…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部