Virtuális űrasszisztens

forrás Prim Online, 2005. július 21. 20:01
A kaliforniai Szilícium-völgyben működő NASA Ames Research Center és a Xerox Corporation egy sokoldalú, hangvezérelt számítógépes rendszert mutatott be a Michigani Egyetemen (Ann Arbor), ahol az Association for Computational Linguists szövetség 25. éves találkozóját tartotta. A Clarissa nevű rendszert az asztronauták munkaterhelésének csökkentésére fejlesztették ki.

"Clarissa egy teljesen hangvezérelt virtuális űrasszisztens, segítségével az asztronauták hatékonyabban használhatják kezüket és szemüket, és teljes figyelmüket a megoldandó feladatra összpontosíthatják, miközben beszédparancsokkal vezérelik a rendszert" - fejtette ki Beth Ann Hockey, az Ames kutatóközpontban dolgozó fejlesztői csapat projektvezetője.

A Clarissa felszabadítja az asztronauták kezét és reagál beszédparancsaikra; munka közben hangosan felolvassa nekik a folyamat lépéseit, segít számon tartani a már elvégzett lépéseket, valamint rugalmasan megadható, beszédaktivált riasztásokkal és időzítőkkel biztosítja, hogy semmiről se feledkezzenek el.

Kim Farrell, Clarissa egyik fejlesztője az ivóvíz minőségét vizsgálja a beszédvezérelt robot segítségével a NASA Ames Research Center szimulátorában. A Xerox és a NASA mérnökei által kifejlesztett intelligens rendszer a nemzetközi űrállomás asztronautái számára nyújt hatékony segítséget a tesztek és a karbantartási munkálatok könnyebb és biztonságosabb elvégzéséhez

Az asztronautáknak manapság már mintegy 12 000 bonyolult műveletet kell elvégezniük a létfenntartó rendszerek működtetéséhez, az űrruhák megvizsgálásához, a tudományos kísérletek elvégzéséhez, az orvosi vizsgálatok végrehajtásához és más rutinfeladatok elvégzéséhez.

"Próbáljon csak meg elemezni egy vízmintát, miközben végignézi egy eljárás kézikönyvét a számítógép képernyőjén, és mindezt mikrogravitációs lebegés közben" - mondja Michael Fincke asztronauta, aki a nemzetközi űrállomáson eltöltött hat hónap után a közelmúltban tért vissza. "A Clarissa űrasszisztenst beszédparancsokkal irányíthatom, meghallgathatom az útmutató lépéseit, és közben a kezemmel elvégezhetek egy eljárást - ez akkora segítség, mint ha még egy csapattag lenne a fedélzeten".

Mivel a rendszernek mindig készen kell állnia beszédparancsok fogadására, a virtuális asszisztens első változata megpróbált értelmezni minden kiejtett szót, még a csapat tagjainak egymás közötti beszélgetéseit is. Ennek eredményeként a Clarissa nehezen tudta megkülönböztetni a beszélgetéseket a neki adott parancsoktól.

A NASA Ames Kutatóközpontjában dolgozó Manny Rayner, a Clarissát megvalósító csapat vezetője 2004-ben megbeszélést folytatott a Xerox európai kutatóközpontjában tevékenykedő Jean-Michel Renders-szel az esetleges együttműködésről. Azt remélték, hogy a Xerox gépi tanulás, nyelvészet és szövegkategorizálás terén szerzett tapasztalata növelni fogja a rendszer pontosságát "mindent vevő mikrofon" üzemmódban.

"A NASA azt akarta, hogy a rendszer bármikor készen álljon a segítségre anélkül, hogy külön aktiválási parancsokat kéne adni neki" - magyarázta Renders. "Ezért nem lehetett az egyszerűbb »Start Trek« megoldást választani, ahol az űrhajósok a rendszer megkérdezése vagy egy parancs kimondása előtt egy bizonyos szót mondanak, például azt, hogy »számítógép«". Meg kellett oldanunk, hogy a rendszer jobban meg tudja különböztetni a parancsokat a beszélgetéstől."

A Renders által a NASA beszédfelismerési problémájára kidolgozott technológiát a Xerox is használja a nyomtatott vagy digitális dokumentumok kategorizálásának javítására. A Xerox Grenoble-ban dolgozó kutatói számos olyan élvonalbeli szoftver képességet fejlesztettek ki, amelyekkel a Xerox ügyfelei könnyebben kezelhetik a dokumentumtartalmakat.

A Xerox módszerével a Clarissa pontosabban tudja elemezni a kiejtett szavakat. Felismeri a szavakat, a mondatokat és a szavak összefüggéseit, és reagálni tud a különböző módokon megfogalmazott parancsokra. A rendszer megvizsgálja a mondat összes szavát, figyelembe veszi az egyes szavak helyes felismerésének megbízhatóságát, és bonyolult gépi tanulási algoritmussal súlyozza a különböző pozitív és negatív információkat.

Ezáltal a rendszer sokkal jobban el tudja különíteni a neki szóló parancsokat a beszélgetésektől. Renders szerint a továbbfejlesztés eredményeként a rendszer hibaaránya a korábbihoz képest több mint 50%-kal javult.

A Clarissa jelenleg mintegy 75 különböző parancsot ért, amelyek 260 körüli szóból álló szókészlettel fogalmazhatók meg. A csapat azt tervezi, hogy a jövőben tovább fogja növelni a parancsok számát és a szókészletet.

"Vannak eléggé egyszerű parancsok, mások azonban eléggé bonyolultak" - magyarázta Hockey. "Többnyire olyan parancsok hangzanak el, mint »tovább« vagy »menj a 8. lépésre«. Előfordul azonban, hogy ilyesmit kell mondani: »10 óra 25-ös riasztást kikapcsolni« vagy »visszakérdezéses ellenőrzés beállítása a 3-as - 14-es lépésekre«.