71
Tesseract.js je knižnica javascript, ktorá z obrázkov vyníma slová takmer v akomkoľvek jazyku.Motor Tesseract OCR bol jedným z troch najlepších motorov v teste presnosti UNLV z roku 1995.V rokoch 1995 až 2006 sa na tom vykonalo len veľmi málo práce, je to však pravdepodobne jeden z najpresnejších dostupných OCR motorov s otvoreným zdrojom.Zdrojový kód načíta binárny, sivý alebo farebný obrázok a výstupný text.Je zabudovaná čítačka tiff, ktorá bude čítať nekomprimované obrázky TIFF, alebo je možné pridať libtiff na čítanie komprimovaných obrázkov.Sú k dispozícii jazykové súbory pre mnoho jazykov, dokonca aj pre text nastavený vo Frakture a písmo čiernej listiny ....
tesseract