CAT, ami nem macska...

Vértes János Andor, 2005. november 22. 13:53
Sajtótájékoztatón mutatta be kedd délelőtt a Dativus Translator Kft. CD-s (és on-line) "óriásszótárát", valamint fordítóprogramját. Bár a szótár és a szoftver az angol "cat" szócskának bizonyára a hétköznapi jelentését adja ki, a sajtótájékoztató alapjául ezúttal egy betűszó, a Computer Aided Translation rövidítéséből származó CAT szolgált.

Ez a szoftver a Dativus Translator Kft-nek mintegy hat éve tartó fejlesztése, és - ahogy ezt Batta Ildikó marketingigazgató hangsúlyozta is - a számítógéppel segített fordítás sokkal pontosabban írja le a fogalmat, mint a gépi fordítás. A nyelv szerteágazó szabályrendszere nehezen algoritmizálható, a gépi nyersfordításhoz bizony ma még nélkülözhetetlen az ember. Ez az ember persze sok segítséget kap a Dativus programtól, amely a szófajokból és a szó környezetének elemzéséből az azonos alakú szavak eltérő jelentését is igyekszik megfejteni, de az is egy jelentős fordítói támogatás, hogy a nyers mondat szavai alá szinonimák, további lehetőségek gördíthetők le, amelyekből azután a fordító már könnyedén kiválaszthatja a valóban odaillő pontos kifejezést.

Az óriás-szótárról megtudtuk, hogy 354 000 szópárt, 391 000 kifejezést, 564 000 mondatmintát tartalmaz. A számokban nem kételkedünk (nem jártunk utána), de a felsorolást ketté bontanánk: a szópárok és kifejezések valóban a szótár adatbázisába tartoznak, a mondatminták viszont a fordítóprograméba. A sajtótájékoztatón jelen lévő újságírók hangot adtak abbéli véleményüknek, hogy akkor, amikor a marketinganyagban egy szótár a méreteit hangsúlyozza, nem feltétlenül az Országh-féle Nagyszótár 160 ezer szótári adatával kellene összevetnie magát, hanem mondjuk az Akadémiai nagyszótárral, amely épp egy nagyságrenddel gazdagabb az Országh-szótárnál, így egyértelműen meghaladja az "óriásszótár" méreteit.

A sajtótájékoztató kérdés/felelet részében olyan észrevételek is felmerültek, miszerint meglehetősen sok a véletlennek nem minősíthető egybeesés az Akadémiai nagyszótár és az "óriásszótár" között, és ezekre az észrevételekre a Dativus Translator Kft. képviselőitől nem érkezett megnyugtató és egyértelmű felelet. Sajnos esetünkben nem csupán arról van szó, hogy a CAT nyilvánvalóan minden szótárban macska vagy cica, hanem arról, hogy az egyes kifejezések példamondatainál több, mint véletlen az egybeesés. A szerzők mindkét esetben a "47. oldal"-ra lapoznak, a részvényeket mindkét szótárban "10 fonton" jegyzik, mindkét szótár szerzője "a 21-es buszra" száll, esetleg azért, hogy eljusson - mindkét esetben - a "Broadway és a 45. utca kereszteződésé"-hez, és a "rendelet" szóról mindkét szerzőcsapatnak épp egy "1998. július 17-én kelt rendelet" jut eszébe. A példákat tucatszám lehetne még sorolni, de végül is ezt a kérdéskört a az Akadémiai Kiadónak és a Dativusnak kell majd egymás közöttt tisztázni. A felhasználónak, ha ki akarja próbálni a szoftvert, minden esetre el kell fogadni egy licencszerződést, amely leszögezi: " A Dativus on-line szótár a POLYGOTT Kft. szerzői jog és szomszédos jogok által védett szellemi tulajdona. Jelen megállapodás alapján a felhasználó a Dativus on-line szótár használati jogát szerzi meg, és a felhasználást engedélyező semmilyen további jogot, így különösen tulajdonjogot nem ruház át a felhasználóra. ... A felhasználást engedélyező szavatolja, hogy a Dativus on-line alapszótár egyedüli tulajdonosa, illetve hogy az átadott felhasználási jogokkal jogszerűen rendelkezhet, és harmadik személynek nincsen olyan joga, amely a felhasználóra jelen megállapodással átruházott jogokat korlátozná vagy kizárná."