Vakbarát Magyar Elektronikus Könyvtár és VilágHalló

forrás Prim Online, 2004. március 4. 15:30
A MEK Egyesület, átgondolva látássérült olvasóinak helyzetét, az elektronikus könyvtárhoz vakbarát belépési oldalt hozott létre. Bemutatkozott a világviszonylatban is egyedülálló VilágHalló online felolvasó rendszer is.
Vakbarát Magyar Elektronikus Könyvtár (MEK)

A MEK Egyesület a dokumentumok letöltéséhez egyszerű text formátumot, az erre alkalmas dokumentumokhoz pedig online felolvasási lehetőséget biztosít. Mind az online felolvasás, mind a text formátum kiindulópontja az XML, a mára már nemzetközileg elfogadott szövegábrázolási szabvány. Tekintve, hogy ezek előállítása nagy munka, az egyesület igyekezett minél szabványosabb formában, a Text Encoding Initiative (TEI) alapján elkészíteni, hogy később már gépi konverzióval kinyerhető legyen az e-book vagy más, később igényként felmerülő egyéb formátum.

A hálózati technológiák fejlődése a vak és csökkentlátó felhasználók számára kedvezőtlen irányba fordult a grafikus felületek térhódításával. Az eredetileg karakteres programokra kidolgozott felolvasó (text to speech) programok segítségével a bonyolult képeket tartalmazó oldalakon már nem lehet eligazodni. Az egér, mint fő navigálási eszköz, a vakok számára alkalmatlan. A fejlődés irányát követve a MEK is áttért összetettebb szolgáltatást nyújtó újabb technológiákra, de a látássérült olvasók nagy számára való tekintettel, egyidejűleg vakos használatra optimalizált belépési pontot is kíván nyújtani. Ezt a célt szolgálja a http://vmek.oszk.hu internet címen nyíló oldal, az online felolvasás lehetősége, valamint a text formátumban is feltöltött szövegek. Az így kialakított oldal egyben a gyengébb kapcsolattal rendelkező olvasók számára is előnyös a grafikus elemek kis száma miatt.

A tervezés során derült ki, hogy a fejlesztésbe nem érdemes ma már belefogni az XML technológia alkalmazása nélkül. A logikai jelölőkkel ellátott szövegből ugyanis a letöltésre és felolvasásra szánt szövegek éppúgy előállíthatók konverzióval, mint a látók számára is alkalmas HTML oldalak, PDF fájlok, valamint a jövőben várható (esetleg váratlan) igények, mint pl. az e-book. Továbbá felhasználható a szöveg differenciált keresésre, újabb szöveggyűjtemény összeállítására, sőt, ha szükségessé válik, akár braille-ben is kinyomtatható.

A sokoldalú későbbi felhasználás egységes, lehetőleg nemzetközi szabványon alapuló szerkezeti meghatározottságot igényel. Erre a célra a TEI (Text Encoding Initiative) ajánlásai alapján készíttetett a MEK minden dokumentumtípusra kiterjedő DTD-t (documentum type definition), amely a későbbiekben az OSZK egyéb digitalizálási projektjeiben is felhasználható.

A DTD-t az Empolis Magyarország készítette, az IHM-ITEM pályázat keretében.

VilágHalló online felolvasó rendszer

A VilágHalló egy nyílt forráskódú internetes online felolvasó rendszer, mely az interneten lévő szövegeket mesterségesen generált emberi beszéd formájában teszi hallgathatóvá. (Olvasásszakértők szerint ez a fajta felolvasás - éppen mert személytelen, érzelemmentes - jobban hasonlít az olvasásra, mint ha színész tolmácsolná a szöveget, mivel az olvasó saját maga értelmezheti a művet.) Jelenleg még kissé mesterkélt a felolvasó hang, de fejlesztőinek kitűzött célja, hogy a géphang minősége megközelítse, sőt elérje a természetes emberi beszédet.

A VilágHalló mind filozófiájában, mind információtechnológiai megoldásában alapvetően eltér a képernyő-felolvasó szoftverektől, melyek használata esetén a felhasználók külön-külön gondoskodnak a szoftverkomponensek beszerzéséről és folyamatos frissítéséről, a szövegek letöltéséről, a kapcsolódó szerzői jogi követelmények betartásáról, a megfelelő tároló és processzor kapacitásról stb.

Ezekkel szemben a VilágHalló egy központilag menedzselt integrált online szolgáltatás, ami az elérhető szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy "szövegrádió") egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, mert a szöveg nem jelenik meg önállóan a felhasználónál, nem töltheti le, nem mentheti el, és így mentesül sok szerzői jogi megkötéstől. Lehetőség van a kivételszó (nem úgy kell ejteni, ahogyan írva van), idegenszó, tulajdonnév kiejtésének központi kezelésére.

A szoftverkomponensek és az internetes szövegállomány változásainak követését és a rendszerbe építését a szolgáltató végzi és teszi elérhetővé a felhasználók számára. Hogy csak a fontosabbakat említsük: a beszédgeneráló motor fejlettebb verzióra cserélése (pl. több hangszín, állítható sebesség), az újabb motorok (pl. idegen nyelvű) beépítése, az elektronikus formában elérhetővé vált szövegek, szövegábrázolási standardok (pl. XML, TEI) használata, a számítógépes nyelvi elemzés új eredményeinek felhasználása.

A VilágHalló a tárolt szövegeket a felolvasásra legalkalmasabb formátumra hozza, függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) és a felolvasás szempontjából informatív, strukturális és nyelvi annotációkkal látja el (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az - akár ragozott - idegenszó illetve név helyes kiejtése).

A szükséges szoftver- és hardverkomponensekről a felhasználónak még csak tudomást sem kell szereznie, a megfelelő CPU igényt, tárolási kapacitást és minden egyéb erőforrást a szolgáltatás biztosítja és így ezek költségei nem a felhasználót terheli. Elegendő egy vékony kliens programot letölteni és az internetre kapcsolódni, akár telefonvonalon is.

Mindehhez a VilágHalló egy egységes közeget és a vakok által is könnyen, vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható, beállítható a legkedvezőbb megjelenés és a billentyűk, amikkel kezelni lehet. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói beállítások közül az egyik legfontosabb a "KÖNYVJELZŐ" funkció, mely lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol abbahagytuk. (Egy átlagos méretű könyv felolvasása 12 órát venne igénybe.)

Jelenleg a VilágHalló a Magyar Elektronikus Könyvtár (MEK) vakbarát oldalához kapcsolódik és az új MEK szövegeit olvassa. Ehhez a ProfiVox beszédszintetizáló motort használja.

A ProfiVox magyar nyelvű beszédgeneráló szoftver (TTS, Text-to-Speech). Az eszköz közel 10 év fejlesztő munkájának eredménye, a BME Távközlési és Telematikai Tanszék kiemelkedő kutatói fejlesztették. Ma is folyamatosan fejlesztik, pillanatnyilag ez a legszebben beszélő magyar TTS motor. Nem ingyenes.

Minden nyelven vannak TTS (Text-to-Speech) motorok, némelyik hangját szinte nehéz megkülönböztetni az emberi hangtól, a kevésbé jókat akár ingyen is el lehet érni.

A VilágHalló világviszonylatban is egyedülálló. A Szabály Informatikai Bt. által elindított, és az IHM kutatásfejlesztési pályázata által támogatott program keretében a K-PRO Kft. fejlesztette.

Teszt (béta) változata jelenleg a http://www.uhu.hu/vilaghallo oldalról tölthető le a használatához szükséges JAVA szoftverkomponensekkel együtt. A végleges verzió http://www.vilaghallo.hu oldalról fog szolgáltatni.

Színes ROVAT TOVÁBBI HÍREI

A múlt feltárása, a jövő segítségével!

Kevés izgalmasabb terület létezik a régészetnél. Vajon mi rejtőzik a régi idők, épületek falai mögött? Felfedezések, meglepetések sokasága, amire nem igazán lehet felkészülni. Egy ilyen terepmunkát azonban nem lehet csak úgy, ásóval elvégezni, és még Indiana Jonesnak is óriási segítség egy-egy digitális, innovatív, 21. századi eszköz!

2024. április 15. 18:46

Megéri-e az elektromos autózás?

Az elektromos autók használata ugyan már nem új keletű dolog, mégis még mindig nagyon megosztó témának számít. Vannak megrögzött ellenzői és szinte már vallásos áhitattal tisztelői is ennek a közlekedési eszköznek, de az igazság vélhetően valahol a kettő között lesz. Nagyban múlik ugyanis sok dolog azon is, hogy milyen felhasználói szokásaid vannak a mindennapokban. A következő cikkben azonban összegyűjtöttük az elektromos autózás néhány pozitívumát.

2023. június 19. 09:31

Mire jók a chatbotok?

Éjjel-nappal elérhető chates ügyfélszolgálatot fenntartani igen költséges. A legtöbb weboldal számára nem is érné meg. Van azonban egy módszer, amivel jelentősen lehet növelni a felhasználói élményt, mégpedig chatbot használatával.

2023. június 16. 10:27

Hogyan válassz szoftverfejlesztő céget 5 lépésben?

Ha jelentős tőkét, erőforrásokat és időt fektetsz be egy szoftverfejlesztési projektbe, akkor egyáltalán nem mindegy, hogy milyen cégnek szervezed ki az adott feladatot.

2023. április 24. 09:12

Hát persze hogy dráma!

A Super Bowl reklámjai kapcsán szinte minden évben születik egy cikk Amerikában élő és dolgozó barátunk, Horváth Laci tollából, az idén azonban a marketing mellett szó esik az izgalmakról és a bírókról is...

2023. február 15. 23:01

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Itt a világ első, Swarovski kristályba ágyazott autós kijelzője

2024. április 10. 14:55

A csevegőprogramokat vizsgálta az NMHH

2024. április 2. 13:14

Megvannak az IAB 2023-as Legjobb szakdolgozat pályázatának nyertesei

2024. március 25. 15:50

A 2024-es év fordulópont lehet az IT munkaerőpiacon?

2024. március 20. 10:09