文章詳情頁

Python通過Tesseract庫實現文字識別

瀏覽：6日期：2022-08-03 18:15:46

機器視覺

從Google的無人駕駛汽車到可以識別假鈔的自動售賣機，機器視覺一直都是一個應用廣泛且具有深遠的影響和雄偉的愿景的領域。

這里我們將重點介紹機器視覺的一個分支：文字識別。介紹如何用一些Python庫來識別和使用在線圖片中的文字。

我們可以很輕松的閱讀圖片里的文字，但是機器閱讀這些圖片就會非常困難，利用這種人類用戶可以正常讀取但是大多數存貯器沒法讀取的圖片，這時驗證碼（CAPTCHA）就出現了。驗證碼讀取的難易程序也大不相同。

將圖像翻譯成文字一般被稱為光學文字識別（Optical Character Recognition，OCR）。可以實現OCR的底層庫并不多，目前很多庫都是使用共同的幾個底層OCR庫，或者是在上面進行定制。

OCR庫概述

在讀取和處理圖像、圖像相差的機器學習以及創建圖像等任務中，Python一直都是非常出色的語言。雖然有很多庫可以進行圖像處理，但是這里我們只介紹Tesseract庫。

Tesseract

Tesseract是一個OCR庫，目前由Google贊助。Tesseract是目前公認最優秀、最精確的開源OCR系統。除了極高的精確度，Tesseract也具有很高的靈活性。它可以通過訓練識別出任何字體，也可以識別出任何Unicode字符。

安裝Tesseract：Windows系統

下載可執行安裝文件安裝即可。

安裝pytesseract

Tesseract是一個Python的命令行工具，不是通過import語句導入的庫。安裝之后，要用tesseract命令在Python的外面運行，但我們可以通過pip安裝支持Python版本的Tesseract庫：

pip install pytesseract

處理規范的文字

你要處理的大多數文字都是比較干凈、格式規范的。格式霍英東的文字通常具有以下特點：

使用統一的標準字體（不包含手寫體、草書或者十分“花哨”的字體），復印或者拍照但是字體清晰、沒有多余的痕跡或者污點排列整齊，沒有歪歪斜斜的字沒有超出圖片范圍，也沒有殘缺不全，或緊緊貼在圖片的邊緣

文字的一些格式問題在圖片預處理時可以進行解決。例如，可以把圖片轉換成灰度圖，調整亮度和對比度，還可以根據需要進行裁剪和旋轉，在這里不作介紹。

示例：

英文：

Python通過Tesseract庫實現文字識別

識別結果的準確率還是挺高的。

通過Python代碼實現

英文：

Python通過Tesseract庫實現文字識別

中文：

Python通過Tesseract庫實現文字識別

運行結果

This is some text, written in Arial, that will be read byTesseract. Here are some symbols: !@#$%'&*()******************************中華人民共和國

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：Python API len函數操作過程解析下一條：Python爬蟲實現模擬點擊動態頁面

相關文章：

1. 低版本IE正常運行HTML5+CSS3網站的3種解決方案2. 讀大數據量的XML文件的讀取問題3. 利用CSS制作3D動畫4. JSP的Cookie在登錄中的使用5. html5手機觸屏touch事件介紹6. xpath簡介_動力節點Java學院整理7. 《CSS3實戰》筆記--漸變設計（一)8. 詳解JSP 內置對象request常見用法9. 使用Spry輕松將XML數據顯示到HTML頁的方法10. 測試模式 - XSL教程 - 5

排行榜

					
					java向下轉型基礎知識點及實例
一個用于MySQL的PHP XML類
IntelliJ IDEA創建web項目的方法
intellij idea設置統一JavaDoc模板的方法詳解
python 制作python包,封裝成可用模塊教程
解決python打開https出現certificate verify failed的問題
在Android中使用WebSocket實現消息通信的方法詳解
低版本IE正常運行HTML5+CSS3網站的3種解決方案
利用CSS制作3D動畫
Python生成六萬個隨機,唯一的8位數字和數字組成的隨機字符串實例
ajax請求后臺得到json數據后動態生成樹形下拉框的方法