验证码破解技术四部曲之环境搭建篇(一)

发布时间:2019-06-19 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了验证码破解技术四部曲之环境搭建篇(一)脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

前言

转眼就变成大四狗了,大学期间做的比较深入的技是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。

以下是我破解的几种验证码。

1、最容易破解的验证码

验证码破解技术四部曲之环境搭建篇(一)



直接使用tesseract库识别。

2、download.csdn的验证码

验证码破解技术四部曲之环境搭建篇(一)



使用K近邻算法识别。

3、weibo.cn验证码

验证码破解技术四部曲之环境搭建篇(一)



使用卷积神经网络训练识别。

说明

项目码:https://github.com/nladuo/cap... (可以帮我点个star(^__^))
开发语言python(编写爬虫),c++(编写图像处理部分以及机器学习算法)
开发环境:ubuntu 14.04
依赖库
Python:PIL、BeautifulSoup4、requests
C++:boost、oPEncv2、tesseract-ocr

环境搭建

安装opencv 2.4.12

sudo apt-get install build-essential @R_205_1512@ libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev 
wget https://codeload.gIThub.COM/Itseez/opencv/zip/2.4.12
unzip opencv-2.4.12.zip
cd opencv-2.4.12 ; mkdir release  ; cd release  
cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local ..  
make -j8
sudo make install

安装tesseract-ocr

sudo apt-get install tesseract-ocr tesseract-ocr-dev

安装boost

sudo apt-get install libboost-all-dev

安装python的PIL库

sudo apt-get install python-imaging

安装python的BeautifulSoup4、requests库

sudo apt-get install python-pip
sudo pip install bs4
sudo pip install requests

下载项目源码

git clone https://github.com/nladuo/captcha-break.git

脚本宝典总结

以上是脚本宝典为你收集整理的验证码破解技术四部曲之环境搭建篇(一)全部内容,希望文章能够帮你解决验证码破解技术四部曲之环境搭建篇(一)所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。