Tesseract是一個光學字符識別引擎。支持多種操作系統,基于Apache許可證的自由軟件,由Google贊助開發。 Tesseract被認為是最精準的開源光學字符識別引擎之一。
Tesseract 是一個光學字符識別引擎,支持多種操作系統。Tesseract 是基于 Apache 許可證的自由軟件,自 2006 年起由 Google 贊助開發。 2006 年,Tesseract 被認為是最精準的開源光學字符識別引擎之一。
Tesseract 最初是在 1985 年至 1994 年之間在布里斯托的惠普實驗室和位于格里利科羅拉多州的惠普公司開發的,1996 年進行了一些更改以移植到 Windows,并在 1998 年進行了一些 C ++化。2005 年 Tesseract 開放由 HP 采購。自 2006 年以來,它是由 Google 開發的。
Tesseract OCR 該軟件包包含一個 OCR 引擎 - libtesseract 和一個命令行程序 - tesseract。 Tesseract 4 增加了一個基于 OCR 引擎的新神經網絡(LSTM),該引擎專注于線路識別,但仍然支持 Tesseract 3 的傳統 Tesseract OCR 引擎,該引擎通過識別字符模式來工作。通過使用 Legacy OCR Engine 模式(--oem 0)啟用與 Tesseract 3 的兼容性。它還需要訓練有素的數據文件,這些文件支持傳統引擎,例***自 tessdata 存儲庫的文件。
Tesseract 支持 unicode(UTF-8),可以“開箱即用” 識別 100 多種語言。
Tesseract 支持各種輸出格式:純文本,hOCR(HTML),PDF,不可見文本的 PDF,TSV。主分支還具有 ALTO(XML)輸出的實驗支持。
Tesseract OCR 引擎于 20 世紀 80 年代出現,更新迭代至今,它已經包括內置的深度學習模型,變成了十分穩健的 OCR 工具。而 Tesseract 和 OpenCV 的 EAST 檢測器是一個很棒的組合,感興趣的讀者可參考機器之心報道。
Tesseract 支持 Unicode(UTF-8)字符集,可以識別超過 100 種語言,還包含多種輸出支持,比如純文本、PDF、TSV 等。但是為了得到更好的 OCR 結果,還必須提升提供給 Tesseract 的圖像的質量。
值得注意的是,在執行實際的 OCR 之前,Tesseract 會在內部執行多種不同的圖像處理操作(使用 Leptonica 庫)。通常情況下表現不錯,但在一些特定的情況下的效果卻不夠好,導致準確度顯著下降。
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
網絡推廣與網站優化公司(網絡優化與推廣專家)作為數字營銷領域的核心服務提供方,其價值在于通過技術手段與策略規劃幫助企業提升線上曝光度、用戶轉化率及品牌影響力。這...
在當今數字化時代,公司網站已成為企業展示形象、傳遞信息和開展業務的重要平臺。然而,對于許多公司來說,網站建設的價格是一個關鍵考量因素。本文將圍繞“公司網站建設價...
在當今的數字化時代,企業網站已成為企業展示形象、吸引客戶和開展業務的重要平臺。然而,對于許多中小企業來說,高昂的網站建設費用可能會成為其發展的瓶頸。幸運的是,隨...
如何注冊申請163郵箱?如何注冊163郵箱?需要工作,如何獲得?您可以在官方網站注冊您的電子郵件地址,搜索 "163網絡電子郵件地址 "在網頁上,并從搜索結果中找到官網的郵箱地址。進去之后,會有一個 "立即注冊按鈕,然后就可以根據提示完成注冊了。手機上如何申請163郵箱?1.打開手機中的瀏覽器,在瀏覽器中的163郵箱中輸入官網,在163郵箱中輸入官網。163郵箱官網2.進入163官網后,點擊 "立...
溫州瘦肉丸為什么會散?關于豬肉丸子為什么散的問題,丸子開裂的主要原因有:3360丸子開裂豬肉脂肪太多,做成丸子拌肉餡太油膩。去掉辣椒和醋很重要,香菇和木耳切塊,少放一點。如果你加的淀粉太少,它就不會結塊。加一點土豆粉或者淀粉(防止分散),或者適量加一點糯米。糯米其實就是姜米,是一種家庭食品。龍港話和溫州話相同嗎?不一樣。福建龍崗有很多閩南語,溫州話是以市區話為基礎的。周邊的永嘉、樂清、瑞安等地接近...
泰山攻略之夜爬泰山注意事項?1.泰安市區很小,起步價基本都是最熱門的景點,出行很方便?;疖嚦隹谔幱性S多出租車?;疖囌靖浇浅7泵???梢韵瘸渣c東西,嘗嘗山東煎餅和三妹湯。2.可以住泰山紅門停車場附近的客棧,提前在網上預定。出門五分鐘內就能到達山的入口。當時筆者住的客棧送了一個背包和一個石敢當的掛件,體驗很好。3.一般要三四個小時才能爬到山頂。就算你從來沒有在晚上爬過什么山,十一點出發也不晚,不會耽誤...