python圖片驗(yàn)證碼識(shí)別最新模塊muggle_ocr的示例代碼
一.官方文檔
https://pypi.org/project/muggle-ocr/
二模塊安裝
pip install muggle-ocr# 因模塊過(guò)新,阿里/清華等第三方源可能尚未更新鏡像,因此手動(dòng)指定使用境外源,為了提高依賴(lài)的安裝速度,可預(yù)先自行安裝依賴(lài):tensorflow/numpy/opencv-python/pillow/pyyaml
三.使用代碼
# 導(dǎo)入包import muggle_ocr# 初始化;model_type 包含了 ModelType.OCR/ModelType.Captcha 兩種sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)# ModelType.OCR 可識(shí)別光學(xué)印刷文本 這里個(gè)人覺(jué)得應(yīng)該是官方文檔寫(xiě)錯(cuò)了 官方文檔是ModelType.Captcha 可識(shí)別光學(xué)印刷文本with open(r'test1.png', 'rb') as f: b = f.read()text = sdk.predict(image_bytes=b)print(text)# ModelType.Captcha 可識(shí)別4-6位驗(yàn)證碼sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)with open(r'test1.png', 'rb') as f: b = f.read()text = sdk.predict(image_bytes=b)print(text)
PS:下面看下 Python 實(shí)現(xiàn)全自動(dòng)登錄(真正的全自動(dòng),自動(dòng)識(shí)別驗(yàn)證碼)
你沒(méi)有看錯(cuò),全自動(dòng)驗(yàn)證~~~
黑科技?還是黑代碼?我感覺(jué)這個(gè)看在你用啥,對(duì)不對(duì)?反正我用來(lái)(* * * * ) 你懂得
好了,先說(shuō)一下用到的東西
selenium (本意是用來(lái)全自動(dòng)測(cè)試) Phantomjs (一種沒(méi)有界面的瀏覽器) ** 驗(yàn)證碼識(shí)別器(一塊錢(qián)可用100次的這種)關(guān)門(mén)放代碼
from selenium import webdriverfrom PIL import Imageif __name__ == ’__main__’: wbe = webdriver.PhantomJS() wbe.get('https://www.某個(gè)網(wǎng)站的登錄頁(yè)面.com/login/index.html')//你可以拿知乎,百度,等等測(cè)試 element = wbe.find_element_by_xpath(’//*[@id='entry_name']/p[3]/img’)//驗(yàn)證碼所在的xpath路徑 left = element.location[’x’] top = element.location[’y’] right = element.location[’x’] + element.size[’width’] bottom = element.location[’y’] + element.size[’height’] im = Image.open(r’登錄頁(yè).png’)//全頁(yè)面截屏 im = im.crop((left, top, right, bottom)) im.save(’驗(yàn)證碼.png’)
#!/usr/bin/env python# coding:utf-8import requestsfrom hashlib import md5class RClient(object): def __init__(self, username, password, soft_id, soft_key): self.username = username self.password = md5(password).hexdigest() self.soft_id = soft_id self.soft_key = soft_key self.base_params = { ’username’: self.username, ’password’: self.password, ’softid’: self.soft_id, ’softkey’: self.soft_key, } self.headers = { ’Connection’: ’Keep-Alive’, ’Expect’: ’100-continue’, ’User-Agent’: ’ben’, } def rk_create(self, im, im_type, timeout=60): ''' im: 圖片字節(jié) im_type: 題目類(lèi)型 ''' params = { ’typeid’: im_type, ’timeout’: timeout, } params.update(self.base_params) files = {’image’: (’a.png’, im)} r = requests.post(’http://api.ruokuai.com/create.json’, data=params, files=files, headers=self.headers) return r.json() def rk_report_error(self, im_id): ''' im_id:報(bào)錯(cuò)題目的ID ''' params = { ’id’: im_id, } params.update(self.base_params) r = requests.post(’http://api.ruokuai.com/reporterror.json’, data=params, headers=self.headers) return r.json()def get_code(): rc = RClient(’用戶(hù)名’, ’密碼’, ’94522’, ’62c235939b7240879453f31603733fd6’)//想拿下測(cè)試的留言我,教你拿到測(cè)試賬號(hào) im = open(’a.png’, ’rb’).read() print rc.rk_create(im, 3040)
完整代碼
#!/usr/bin/env python# coding:utf-8from selenium import webdriverfrom PIL import Imageimport requestsfrom hashlib import md5import timeclass RClient(object): def __init__(self, username, password, soft_id, soft_key): self.username = username self.password = md5(password.encode('utf-8')).hexdigest() self.soft_id = soft_id self.soft_key = soft_key self.base_params = { ’username’: self.username, ’password’: self.password, ’softid’: self.soft_id, ’softkey’: self.soft_key, } self.headers = { ’Connection’: ’Keep-Alive’, ’Expect’: ’100-continue’, ’User-Agent’: ’ben’, } def rk_create(self, im, im_type, timeout=60): ''' im: 圖片字節(jié) im_type: 題目類(lèi)型 ''' params = { ’typeid’: im_type, ’timeout’: timeout, } params.update(self.base_params) files = {’image’: (’a.png’, im)} r = requests.post(’http://api.ruokuai.com/create.json’, data=params, files=files, headers=self.headers) return r.json() def rk_report_error(self, im_id): ''' im_id:報(bào)錯(cuò)題目的ID ''' params = { ’id’: im_id, } params.update(self.base_params) r = requests.post(’http://api.ruokuai.com/reporterror.json’, data=params, headers=self.headers) return r.json()def get_code(im_file): rc = RClient(’賬號(hào)’, ’密碼’, ’94522’, ’62c235939b7240879453f31603733fd6’) im_source = open(im_file, 'rb').read() print(rc.rk_create(im_source, 3040))if __name__ == ’__main__’: wbe = webdriver.PhantomJS() wbe.get('https://www.dajiang365.com/login/index.html') time.sleep(2) wbe.save_screenshot('das.png') element = wbe.find_element_by_xpath(’//*[@id='entry_name']/p[3]/img’) left = element.location[’x’] top = element.location[’y’] right = element.location[’x’] + element.size[’width’] bottom = element.location[’y’] + element.size[’height’] im = Image.open(r’das.png’) im = im.crop((left, top, right, bottom)) im.save(’a.png’) time.sleep(2) get_code('a.png')
總結(jié)
到此這篇關(guān)于python圖片驗(yàn)證碼識(shí)別最新模塊muggle_ocr的示例代碼的文章就介紹到這了,更多相關(guān)python 驗(yàn)證碼識(shí)別模塊muggle_ocr內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. JSP的Cookie在登錄中的使用2. asp(vbscript)中自定義函數(shù)的默認(rèn)參數(shù)實(shí)現(xiàn)代碼3. HTML5 Canvas繪制圖形從入門(mén)到精通4. 使用Spry輕松將XML數(shù)據(jù)顯示到HTML頁(yè)的方法5. 利用CSS3新特性創(chuàng)建透明邊框三角6. ASP基礎(chǔ)知識(shí)VBScript基本元素講解7. 詳解CSS偽元素的妙用單標(biāo)簽之美8. XHTML 1.0:標(biāo)記新的開(kāi)端9. php網(wǎng)絡(luò)安全中命令執(zhí)行漏洞的產(chǎn)生及本質(zhì)探究10. XML入門(mén)的常見(jiàn)問(wèn)題(四)
