ABBYY: megjelent a FineReader 10 OCR szoftver - dokumentumdigitalizálás új alapokon

Kovács Attila, 2009. október 7. 12:33

A szövegfelismerési, adatkinyerési és nyelvészeti technológiáiról ismert orosz ABBYY cég ma bejelentette a FineReader új 10.0-s verzióját, amely egy új szintet képvisel a professzionális szövegfelismerés (OCR) terén.

A két legfontosabb technológiai elem - a többoldalas dokumentumok élethű megjelenítéséért felelős ADRT (Adaptive Document Recognition Technology), valamint digitális kamera OCR - is teljesen megújult, túlmutatván a hagyományos szövegfelismerési technológiákon. A különösen felhasználóbarát, intuitív felületének és a hozzá kapcsolódó új technológiának köszönhetően, a szoftver használata nagyon egyszerű és mégis nagyon hatékony, legyen szó bármilyen dokumentum típusról úgy az üzleti szférában, mint a magán felhasználásban.

Különösen a háttérképet tartalmazó dokumentumok (pl. magazinok) esetén javult sokat a pontos reprodukció. De mintegy 30%-kal nőtt a felismerési pontosság az ázsiai nyelveknél (pl. kínai, japán) és 20%-kal pedig az európai nyelvek esetében. A gyengébb minőségű anyagoknál, mint a faxok, digitális fényképek, vagy mobil telefon képek, szintén jelentősen javult a felismerési pontosság. Ez a megnövelt pontosság jelentősen lecsökkenti az utómunkálatokat, megkönnyítvén az átmenetet a papírmentes környezet irányába.  

Főbb jellemzők:


A 2. generációs ADRT - az OCR technológia új alapokon
Az ADRT az ABBYY OCR motorjának csúcstechnológiát képviselő és egyedi része. Ezzel lehet a több oldalas dokumentumok logikai struktúráját reprodukálni. A FineReader 10-ben megjelenő 2. generációs ADRT a legösszetettebb dokumentumok esetében is hatékonyan működik. Ilyen új elemek a tartalomjegyzék és a bekezdés struktúrák felismerése és reprodukálása. A láblécek és stílusok felismerésénél pedig tovább javult a reprodukciós pontosság. Ellentétben a hagyományos OCR technológiákkal, az ADRT nemcsak egyszerűen visszaadja a dokumentum eredeti kinézetét, hanem intelligensen reprodukálja annak szerkezetét, úgy ahogy az a Microsoft Office -ban található.

Az OCR széleskörűvé válik - Mobiltelefon-képek felismerése   
A 3. generációs camera OCR, a FineReader 10 felhasználók esetében, lehetővé teszi, hogy a szkenner és a digitális fényképezőgép mellett a mobiltelefont is beviteli eszköznek használják. Ezáltal az ABBYY OCR használata széles rétegek számára elérhetővé válik, helytől és egyéb speciális eszköztől függetlenül. A korábban már alkalmazott képjavító algoritmusok mellet új funkciók jelentek meg, úgy, mint a 3D torzítás kiküszöbölésére, az ISO zaj kiszűrésére, valamint a mozgásból adódó elmosódás korrigálására.

A hatékonyság növelése, feladat centrikus OCR-rel   
A FineReader 10 egy új továbboptimalizált felhasználói felületet kapott, amely jelentősen lecsökkenti a lépések számát, amivel egy kívánt célt el lehet érni. Jóval kevesebb kattintással, sok esetben automatizáltan dolgozhatunk, javítva a napi munka hatékonyságát. Az ún. gyors feladatok száma növekedett és csoportosítva lettek témák szerint. Egy gombnyomással szinte minden megoldható.

Újdonság az E-book Reader-hez átdolgozott HTML mentésnél   
A jelentősen átdolgozott HTML export funkció eredményeképpen a FineReader 10 jelentősen leegyszerűsíti az elektronikus könyvek olvasását és publikálását. A FineReader a könyvek fejezeteit automatikusan önálló HTML fájlként mentve, majd link alapú tartalomjegyzéket létrehozva, jelentősen megkönnyíti a navigálást. Nem kell hosszan görgetni a dokumentumban. Természetesen a FineReader 10 tud menteni standard HTML formában, ami egy weboldalon aztán könnyen szerkeszthető, indexelhető és publikálható.

Az ABBYY FineReader 10 teljesen kompatibilis a Microsoft Windows 7 op. rendszerrel. Emellett számos olyan technológia továbbfejlesztést és finomítást kínál, amelyekkel a hatékonyság növelhető: javított oldalkép felismerés - pontosabb dokumentum reprodukció; megnövelt PDF tömörítés; az MRC technológiának köszönhetően, akár 10 szeres tömörítés is elérhető a PDF fájloknál, anélkül, hogy ez minőségromlást eredményezne; új felismerési nyelvek.
A felismerési nyelvek száma a koreai és a jiddis beépítésével 186-ra nőtt. A FineReader a legtöbb nyelvet ismerő OCR program a világon.; kibővített PDF/A mentési lehetőségek.

Az ABBYY FineReader 10 három változatban lesz kapható. Professional, Corporate és Site License Edition. Most a Professional Edition jelent meg, amelynek teljesen magyar változata december elejére várható, amit nem sokkal előz majd meg a Corporate Edition angol nyelvű változata, amelyből később a teljes magyar változatot is kézbe vehetjük. A mai naptól, a most még hazánkban széles körben elérhető 9.0 magyar változatot megvásárlók, a 10-es magyar megjelenésekor ingyenesen upgradelhetnek majd. Az új verziókkal a termék ára nem változik.