Mesterséges intelligencia az animáció világában

Takács Barnabás, 2000. szeptember 19. 23:26
A világ egyik legfejlettebb és legintelligensebb számítógépét HAL-nak hívták: Stanley Kubrick, a nemrég elhunyt híres filmrendező immár klasszikussá vált filmjében, a 2001. Űrodüsszeiában szerepelt. A kezdetben gépiesen magabiztos és kellemesen nyugodt HAL hangja a film során egyre több és több érzelmet fejez ki, míg végül az utolsó jelenetben egy, az "elmúlás" lehetőségét és közelségét felismerő (mi több, azzal nagyon is szembesülni kényszerülő), szinte emberi lény szorongásait és félelmeit ismerhetjük meg. Napjaink számítógépei még nem beszélgetnek velünk, nincsenek érzelmeik, és nem félnek az elmúlástól. De meddig lesz ez így, és van-e olyan technológia, amely ezt megváltoztathatja?
A HAL név az egyik legnagyobb és legrégebben létező, számítógépeket fejlesztő cégre, az IBM-re utal. HAL egyszerűen IBM mínusz 1, pontosabban az ábécében az I-t megelőző betű a H, a B-t az A és az M-et az L. Érdekes egybeesés, hogy szintén az IBM hozta létre azt a ténylegesen létező, Nagy Kéknek (Big Blue) elkeresztelt szuperszámítógépet, amely megverte a volt sakkvilágbajnokot, G. Kaszparovot. Tényleg gondolkodnak ezek a gépek, vagy csak egyszerűen gyorsabban és pontosabban számolnak ki előre látható eseményeket? Nem gondolkodnak. Nincs tudatuk, nincsenek érzelmeik, és nincs öntudatuk sem. A mesterséges intelligencia (artificial intelligence, röviden AI) pontos szabályait követik, és ennek segítségével számunkra hihető valóságot tárnak elénk. Mitől és hogyan válhatna tehát egy virtuális teremtmény, mondjuk egy digitális színész vagy egy internetavatár, gondolkodó, intelligens lénnyé?

Mesterséges intelligencia

Egy önállóan cselekvő és gondolkozó (autonóm) virtuális ember megteremtéséhez három fontos evolúciós lépésre lesz szükség. Az első a procedurális vagy algoritmikus viselkedés, melynek lényege, hogy előre beprogramozzuk, miként viselkedjen virtuális emberünk bizonyos szituációkban. Digitális teremtményünket például utasíthatjuk arra, hogy a szoba egyik pontjáról sétáljon át a másikra, vagy hogy üljön le egy székre. A mesterségesintelligencia-algoritmusok automatikusan tudják, hogy ezt miként kell megvalósítani. A rendszerbe épített procedurális memória azt is lehetővé teszi, hogy a parancs végrehajtása közben az eredeti mozgást a körülményektől függően felülbíráljuk. Máshogy kell például padlón járni, mint lépcsőn, vagy egy székre, díványra, illetve fotelbe leülni. A második lépésben célkitűzésre és adaptációra van szükség.

Célkitűzés alatt azt értjük, hogy szintetikus emberünk a maga virtuális világában él, és feladatokat lát el anélkül, hogy annak részleteit meghatároznánk. Gondoljunk a rendező és a színész kapcsolatára. A színész a rendező egy jelenetre vonatkozó rövid utasításait a forgatókönyv és az alakított szereplő egyéniségének megfelelően próbálja eljátszani. A másik folyamat az adaptáció, amely szintén nélkülözhetetlen, hiszen környezetünk állandó változását tanulás segítségével követnünk kell. Az előbbi példával élve: a próbák során egy jelenetet többször is felvehetnek, miközben a rendező utasításai, a színpad és a kellékek is megváltozhatnak. Végül a harmadik fázisban teljes körű személyiségmodellt kell megteremteni. Virtuális lényeink ekkor már valóban intelligenciával és döntésképességgel rendelkeznek. Racionális viselkedésüket olyan véletlenszerű folyamatok is befolyásolják, mint a hangulatok és az érzelmek.

Az AI (mesterséges intelligencia) azon ún. interdiszciplináris - azaz egyszerre több tudományágat felölelő - tárgyak közé tartozik, amelyek a hozzá nem értők számára kissé misztikusnak tűnhetnek. A valóságban azonban olyan nagyon egyszerű eszközök és módszerek logikus használatáról van csak szó, amelyek alapjait igen könnyű megérteni. Induljunk ki az egyik legősibb tudományból, a filozófiából. A lét és a tudás fogalma ősidők óta foglalkoztatja az emberiséget. A filozófia számunkra legfontosabb két ága az ontológia és az episztemológia. Az ontológia a lét problémáját kutatja, és arra a kérdésre keresi a választ, hogy mitől ember az ember. Az episztemológia ugyanakkor a tudást vizsgálja, és azt, hogy mi a valóság és a valóság belső ábrázolása (számítógépes vagy egyéb) közti viszony. Miként jutunk tehát általában a tudás birtokába? Természetesen tanulással. De milyen is pontosan a tanulás folyamata? Hogyan tárolódik az információ, miként választjuk külön a hasznosat a haszontalantól? Miként keresünk emlékeink között? Ez a mesterséges agy építése szempontjából nagyon fontos kérdés. A válasz nem egyszerű. Egy azonban biztos. Minden intelligens lénynek, legyen az biológiai vagy digitális, környezetétől kell elsajátítania a túléléshez szükséges viselkedésmintákat és normákat. Ez lesz tehát a kiindulópontunk.

AI-technológia kezdőknek

A mesterséges intelligencia tudománya az emberi viselkedés modelljéül gyakran használja a játék fogalmát. Az élet játék! - mondjuk sokszor. Hát lássuk, igaz-e ez az AI világában. A játékot ügynökök (emberek) játsszák, akik egy elképzelt vagy valós térben mozognak, amelyet gyakran egy térképpel ábrázolunk. Az élethez hasonlóan a játéknak vannak szabályai, amelyeket az ügynökök (többé-kevésbé) betartanak. Minden ügynök tevékenységének van valami célja, amit különböző stratégiák bevetésével próbál meg elérni. Természetesen vannak olyan célok is, amelyeket többen együtt próbálnak elérni (kooperatív), és vannak olyanok, amelyek személyesek (non-kooperatív). Céljaik elérése érdekében az ügynökök érdekeiket védő csoportokba szerveződhetnek. Ehhez elsősorban kommunikációra van szükségük, amit csak egy közös nyelv segítségével tudnak lebonyolítani. Ezen a nyelven kommunikálva egy intelligens ügynöknek - céljai követése közben - fel kell ismernie, ha az őt körülvevő körülmények változnak, és szükség esetén módosítania kell a céljainak legjobban megfelelő stratégiát. Ezt hívjuk alkalmazkodásnak vagy adaptációnak. Az adaptáció tehát a tanulás egy formája.

Tanulni sokféleképpen lehet, de általában szükségünk van egy tanítóra, akiben megbízunk, hogy a tőle származó információ valóban helyes. A hangsúly ebben a folyamatban a bizalmon van. A valóság jobb modellezéséhez az ügynököknek szükségük van az információ megbízhatóságának kifejezésére (belief factor). Ezt a "hihetőségi indexet" figyelembe kell venniük döntéseik meghozatalakor. Barátaink azonban nem szándékosan vezetnek minket félre. Miből ered tehát ez a probléma? Abból, hogy - az adaptáció és tanulás következtében - minden ügynöknek más és más belső képe (modellje) alakul ki az őt körülvevő világról. Ennek megfelelően tanácsaik különböző szempontok szerint lehetnek igazak (truth maintanance). És itt térjünk vissza arra, hogy miért mondtuk az előző szakaszban, hogy a játék szabályait az ügynökök csak többé-kevésbé tartják be. A szabályok ugyanis gyakran bizonytalan, ún. fuzzy formát öltenek. A bizonytalanság forrása lehet információhiány, pontatlan tudás vagy az, hogy a tények ellent látszanak mondani belső igazságunknak (contradiction). A játék (valós élet) modellje tehát matematikai értelemben véve nem monoton, ami végül mindig konfliktusok kialakulásához vezet. Így van ez tehát a valós és a digitális világban is :-).

Konfliktusaink ugyanazon valóság különböző szempontok szerint történő kiértékeléséből fakadnak. Ha úgy tetszik, ez az intelligencia sajátos és elkerülhetetlen tulajdonsága. A természetes intelligenciák tapasztalati alapokon nyugszanak, amelyek vagy statisztikák, szabályok, vagy minták (patterns) formájában jelenhetnek meg. A mesterséges világban tehát ugyanúgy ezt a három elvet kell követnünk, ha gondolkodó és társalgó lényeket szeretnénk teremteni.

Alkalmazások

A mesterséges intelligencia fejlődése lehetővé tette, hogy olyan virtuális lényeket teremtsünk, amelyekkel az emberi kommunikációhoz hasonló módon beszélgetni tudunk (Talkie.Com, Xerox, Improv Technologies). Kéréseinket és gondolatainkat egyszerű szavakkal közölhetjük, és okos, pontos, szinte életszerű válaszokat kapunk. Az intelligens avatárok ilyen formában történő alkalmazása fontos szerepet fog kapni a kereskedelemben, a turizmusban és az élet sok más területén. Az AI fontos szerepet kap viselkedésmodellek (behavior models) tervezésekor is. Ezeket a rendszereket nem egyének, hanem csoportok kollektív viselkedésének elemzésére vagy szimulációjára használhatjuk. Repülőterek, forgalmas útkereszteződések forgalmát elemezhetjük így, vagy vészhelyzetek és pánikszituációk kimenetelét jósolhatjuk meg (Animation Science). Természetesen a filmiparban is előszeretettel használják ezt a technológiát.

A Gladiator vagy a Titanic című filmben például digitális színészek ezreit hozták létre ún. crowd modeling segítségével, ami valójában nem más, mint sok ember kollektív viselkedésének szimulációja.

A sok érdekes alkalmazás közül kiemelném egyik kedvencem, a digitális "commedia dell'arte" és a virtuális színház létrehozását (Humanoid 2, Virtual Drama Society, Improv Tech.). Az ötlet lényege, hogy a darab írója és rendezője által megálmodott cselekménysorozatot a nézők interaktívan befolyásolhatják, így a történet minden alkalommal más és más lesz. A szereplők természetesen mindig karakterüknek és jellemüknek megfelelően reagálnak, ám a történet kimenetele az interakciótól függ. Ez lenne a televíziózás vagy akár a dráma jövője?

Mesterséges élet

Robin Williams legutóbbi filmje (Bicentennial Man) egy tudatára ébredt és érzelmekkel rendelkező háztartási robot/android története, aki 200 éven át harcol, hogy emberré válhasson. Ha intelligencia és digitális érzelem (!) létrehozható mesterségesen, akkor hol a határ? Vajon HAL tudott-e sírni? Ha igen, akkor létezhet-e digitális élet? Erről szól következő havi cikkünk.

A szerző köszönetet mond Prof. Vámos Tibor akadémikusnak, akinek a segítsége nélkül soha nem tudott volna meg ennyit a komputerepisztemológiáról és a mesterséges intelligenciáról.