Vakbarát Magyar Elektronikus Könyvtár és VilágHalló

forrás Prim Online, 2004. március 4. 15:30
A MEK Egyesület, átgondolva látássérült olvasóinak helyzetét, az elektronikus könyvtárhoz vakbarát belépési oldalt hozott létre. Bemutatkozott a világviszonylatban is egyedülálló VilágHalló online felolvasó rendszer is.
Vakbarát Magyar Elektronikus Könyvtár (MEK)

A MEK Egyesület a dokumentumok letöltéséhez egyszerű text formátumot, az erre alkalmas dokumentumokhoz pedig online felolvasási lehetőséget biztosít. Mind az online felolvasás, mind a text formátum kiindulópontja az XML, a mára már nemzetközileg elfogadott szövegábrázolási szabvány. Tekintve, hogy ezek előállítása nagy munka, az egyesület igyekezett minél szabványosabb formában, a Text Encoding Initiative (TEI) alapján elkészíteni, hogy később már gépi konverzióval kinyerhető legyen az e-book vagy más, később igényként felmerülő egyéb formátum.

A hálózati technológiák fejlődése a vak és csökkentlátó felhasználók számára kedvezőtlen irányba fordult a grafikus felületek térhódításával. Az eredetileg karakteres programokra kidolgozott felolvasó (text to speech) programok segítségével a bonyolult képeket tartalmazó oldalakon már nem lehet eligazodni. Az egér, mint fő navigálási eszköz, a vakok számára alkalmatlan. A fejlődés irányát követve a MEK is áttért összetettebb szolgáltatást nyújtó újabb technológiákra, de a látássérült olvasók nagy számára való tekintettel, egyidejűleg vakos használatra optimalizált belépési pontot is kíván nyújtani. Ezt a célt szolgálja a http://vmek.oszk.hu internet címen nyíló oldal, az online felolvasás lehetősége, valamint a text formátumban is feltöltött szövegek. Az így kialakított oldal egyben a gyengébb kapcsolattal rendelkező olvasók számára is előnyös a grafikus elemek kis száma miatt.

A tervezés során derült ki, hogy a fejlesztésbe nem érdemes ma már belefogni az XML technológia alkalmazása nélkül. A logikai jelölőkkel ellátott szövegből ugyanis a letöltésre és felolvasásra szánt szövegek éppúgy előállíthatók konverzióval, mint a látók számára is alkalmas HTML oldalak, PDF fájlok, valamint a jövőben várható (esetleg váratlan) igények, mint pl. az e-book. Továbbá felhasználható a szöveg differenciált keresésre, újabb szöveggyűjtemény összeállítására, sőt, ha szükségessé válik, akár braille-ben is kinyomtatható.

A sokoldalú későbbi felhasználás egységes, lehetőleg nemzetközi szabványon alapuló szerkezeti meghatározottságot igényel. Erre a célra a TEI (Text Encoding Initiative) ajánlásai alapján készíttetett a MEK minden dokumentumtípusra kiterjedő DTD-t (documentum type definition), amely a későbbiekben az OSZK egyéb digitalizálási projektjeiben is felhasználható.

A DTD-t az Empolis Magyarország készítette, az IHM-ITEM pályázat keretében.

VilágHalló online felolvasó rendszer

A VilágHalló egy nyílt forráskódú internetes online felolvasó rendszer, mely az interneten lévő szövegeket mesterségesen generált emberi beszéd formájában teszi hallgathatóvá. (Olvasásszakértők szerint ez a fajta felolvasás - éppen mert személytelen, érzelemmentes - jobban hasonlít az olvasásra, mint ha színész tolmácsolná a szöveget, mivel az olvasó saját maga értelmezheti a művet.) Jelenleg még kissé mesterkélt a felolvasó hang, de fejlesztőinek kitűzött célja, hogy a géphang minősége megközelítse, sőt elérje a természetes emberi beszédet.

A VilágHalló mind filozófiájában, mind információtechnológiai megoldásában alapvetően eltér a képernyő-felolvasó szoftverektől, melyek használata esetén a felhasználók külön-külön gondoskodnak a szoftverkomponensek beszerzéséről és folyamatos frissítéséről, a szövegek letöltéséről, a kapcsolódó szerzői jogi követelmények betartásáról, a megfelelő tároló és processzor kapacitásról stb.

Ezekkel szemben a VilágHalló egy központilag menedzselt integrált online szolgáltatás, ami az elérhető szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy "szövegrádió") egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, mert a szöveg nem jelenik meg önállóan a felhasználónál, nem töltheti le, nem mentheti el, és így mentesül sok szerzői jogi megkötéstől. Lehetőség van a kivételszó (nem úgy kell ejteni, ahogyan írva van), idegenszó, tulajdonnév kiejtésének központi kezelésére.

A szoftverkomponensek és az internetes szövegállomány változásainak követését és a rendszerbe építését a szolgáltató végzi és teszi elérhetővé a felhasználók számára. Hogy csak a fontosabbakat említsük: a beszédgeneráló motor fejlettebb verzióra cserélése (pl. több hangszín, állítható sebesség), az újabb motorok (pl. idegen nyelvű) beépítése, az elektronikus formában elérhetővé vált szövegek, szövegábrázolási standardok (pl. XML, TEI) használata, a számítógépes nyelvi elemzés új eredményeinek felhasználása.

A VilágHalló a tárolt szövegeket a felolvasásra legalkalmasabb formátumra hozza, függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) és a felolvasás szempontjából informatív, strukturális és nyelvi annotációkkal látja el (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az - akár ragozott - idegenszó illetve név helyes kiejtése).

A szükséges szoftver- és hardverkomponensekről a felhasználónak még csak tudomást sem kell szereznie, a megfelelő CPU igényt, tárolási kapacitást és minden egyéb erőforrást a szolgáltatás biztosítja és így ezek költségei nem a felhasználót terheli. Elegendő egy vékony kliens programot letölteni és az internetre kapcsolódni, akár telefonvonalon is.

Mindehhez a VilágHalló egy egységes közeget és a vakok által is könnyen, vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható, beállítható a legkedvezőbb megjelenés és a billentyűk, amikkel kezelni lehet. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói beállítások közül az egyik legfontosabb a "KÖNYVJELZŐ" funkció, mely lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol abbahagytuk. (Egy átlagos méretű könyv felolvasása 12 órát venne igénybe.)

Jelenleg a VilágHalló a Magyar Elektronikus Könyvtár (MEK) vakbarát oldalához kapcsolódik és az új MEK szövegeit olvassa. Ehhez a ProfiVox beszédszintetizáló motort használja.

A ProfiVox magyar nyelvű beszédgeneráló szoftver (TTS, Text-to-Speech). Az eszköz közel 10 év fejlesztő munkájának eredménye, a BME Távközlési és Telematikai Tanszék kiemelkedő kutatói fejlesztették. Ma is folyamatosan fejlesztik, pillanatnyilag ez a legszebben beszélő magyar TTS motor. Nem ingyenes.

Minden nyelven vannak TTS (Text-to-Speech) motorok, némelyik hangját szinte nehéz megkülönböztetni az emberi hangtól, a kevésbé jókat akár ingyen is el lehet érni.

A VilágHalló világviszonylatban is egyedülálló. A Szabály Informatikai Bt. által elindított, és az IHM kutatásfejlesztési pályázata által támogatott program keretében a K-PRO Kft. fejlesztette.

Teszt (béta) változata jelenleg a http://www.uhu.hu/vilaghallo oldalról tölthető le a használatához szükséges JAVA szoftverkomponensekkel együtt. A végleges verzió http://www.vilaghallo.hu oldalról fog szolgáltatni.