Tesseract 5.3.4: Előrelépés az optikai szövegfelismerésben

Már elérhető a Tesseract 5.3. 4 OCR új pontkiadása fejlesztésekkel.

A Tesseract OCR egy ingyenes alkalmazás és szabvány a legtöbb OCR felhasználási helyzethez. A legújabb kiadás, a Tesseract 5.3.4 számos kulcsfontosságú fejlesztéssel javítja az OCR működését. A 2006 óta a Google által szponzorált Tesseract hosszú utat tett meg a Hewlett Packard 1985 és 1998 közötti kezdeti fejlesztése óta, és a piac egyik legfejlettebb OCR-rendszerévé fejlődött.

A Tesseract két különböző felismerő motort kínál: a klasszikus motort, amely az egyedi karakterminták szintjén azonosítja a szöveget, és egy új motort, amely kihasználja a gépi tanulást, különösen egy hosszú rövid távú memória (LSTM) neurális hálózatot. Ez a fejlett motor optimalizálja a húrfelismerést, ami figyelemreméltóan növeli a pontosságot. A kész, előre betanított modellek elérhetősége 123 nyelven tovább racionalizálja a felhasználói élményt.

Tesseact 5.3.4: Főbb jellemzők

UTF-8 támogatás és többnyelvűség

A Tesseract 5.3.4 kulcsfontosságú funkciókat vezet be, amelyek számos nyelven javítják a használhatóságot. Támogatja az UTF-8 karakterek és szövegek felismerését a rendszer immár több mint 100 nyelven, az olyan széles körben beszélt nyelvektől, mint az angol és a spanyol, egészen az olyan egyedi írásjelekkel rendelkező nyelvekig, mint az orosz, kazah, fehérorosz és ukrán. Ez a frissítés a globális felhasználói bázist szolgálja ki, így a Tesseract sokoldalú választás a különféle nyelvi igényekhez.

További kimeneti formátumok

A Tesseract egyik kiemelkedő tulajdonsága mindig is az alkalmazkodóképesség volt, és az 5.3.4-es kiadás ezt egy lépéssel tovább viszi. A felhasználók mostantól különféle formátumokban menthetik OCR-eredményeiket, beleértve a sima szöveget, HTML-t (hOCR), ALTO-t (XML), PDF-t és TSV-t. Ez a rugalmasság biztosítja, hogy a felhasználók zökkenőmentesen integrálhassák a Tesseract-ot meglévő munkafolyamataikba, így könnyedén alkalmazkodnak a különböző projektkövetelményekhez.

Teljesítmény optimalizálás

A Tesseact 5.3. 4 nem csak a funkciók továbbfejlesztését végzi el, hanem a modern technológiákat alkalmaz a teljesítmény optimalizálása érdekében. Az OpenMP és SIMD utasításokat (például AVX2, AVX, AVX512F, NEON vagy SSE4.1) használó modulok beépítése biztosítja a felhasználók számára a gyors és hatékony szövegfelismerést.

A Tesseact 5.3.4 legfontosabb fejlesztései:

  1. Továbbfejlesztett képfelismerés URL-en keresztül: Az új verzió javítja a képfelismerést azáltal, hogy lehetővé teszi az URL-alapú fájlletöltést a libcurl könyvtár segítségével. Ez a funkció nagyobb rugalmasságot és egyszerűbb használatot tesz lehetővé, mivel a User-Agent fejléc a betöltés során kerül beállításra. Figyelemre méltó kiegészítés a „curl_cookiefile” paraméter a cookie-fájlok használatához.
  2. TCP-protokoll a ScrollView szerverhez: A ScrollView szerver most a TCP-t részesíti előnyben preferált protokolljaként, javítva a kommunikáció hatékonyságát.
  3. Továbbfejlesztett felhasználói élmény: A „combine_tessdata -d” parancsot úgy finomították, hogy az stderr helyett az stdout kimenetet használja, javítva ezzel az általános felhasználói élményt.
  4. Build Probléma javítások: A Tesseract 5.3.4 kijavítja az összeállítási problémákat az autoconf és a Clang használata során, így simább telepítési folyamatot biztosít.

Ahogy a Tesseract továbbra is új etalont állított fel az OCR technológia terén, az 5.3.4-es kiadás megerősíti vezető, nyílt forráskódú megoldásként elfoglalt helyét. Ennek a verziónak néhány napon belül meg kell érkeznie az Ubuntu, Debian és más terjesztési tárolókba.

Ezt a kiadást is letöltheted a hivatalos oldalról.