Motion capture: digitális mozgásrögzítés

Takács Barnabás, 2000. július 4. 14:00
Közel három évvel ezelőtt, amikor a Csillagok háborúja I (Fantom Menace) még szó szerint csak a tervezőasztalon létezett, a Skywalker Ranch technikusai tudták, hogy a film harci jeleneteihez "android" statiszták és különböző idegen lények ezreit kell majd számítógéppel létrehozniuk. A harcosok mozgásának hasonlónak, mégis különbözőnek kell lenni, és a rendező kívánságára a mozdulatoknak emberszerűnek, de nem túl emberinek kell tűnni, hogy a mozilátogatók észrevétlenül belemerülhessenek a film fantáziavilágába. A mára már mindannyiunk által ismert magas szintű produkció létrehozása hagyományos módszerekkel anyagilag és technikailag is lehetetlen lett volna, így a Szilikon-völgyben található ILM filmstúdió szakemberei úgy döntöttek, hogy a film létrehozásához a digitális mozgásrögzítés - vagy ahogy a filmszakma hívja: "motion capture" - technológiáját vetik be.
A technika művészete

Az animáció művészet! A szakma nagyjai egyetértenek abban, hogy nem a rajzok mozgásáról, hanem a mozgás rajzolásáról van szó. Érthető tehát, hogy sokan közülük nem tartják művészhez méltónak, hogy olyan segédeszközöket vegyenek igénybe, amelyek egy élő ember mozgását rögzítik, majd "egyszerűen" visszajátsszák azt egy másik szereplő esetében. Olyan ez - érvelnek -, mint amikor valaki úgy rajzol aktot, hogy először fényképet készít a modellről, majd a fotót átvilágítva lemásolja a vonalakat. Az "egyszerűen" szó nem véletlenül szerepel idézőjelben. A fenti vélemény ugyanis nem megalapozott, és távol áll az igazságtól. A valóság az, hogy a motion capture - vagy ahogyan a szakma gyakran nevezi: "mocap" - technológiájának használata még napjainkban is inkább művészet, majdnem varázslat. Semmiképp sem egyszerű operátori munka. Hogy miért?

Emlékeznek még Micimackó barátjára, az ugráló kis Tigrisre? Képzeljük el, hogy Disney egy most készülő filmjében Micimackó a csíkokról ábrándozik. Álmában több száz kis Tigris jelenik meg, de mindegyik kicsit másként néz ki, és máshogy mozog. Az animátorok feladata, hogy a digitálisan megépített modellt úgy mozgassák, hogy ez élethű és természetes legyen. Lassított felvételeken jól látszik, hogy a nagymacskák mozgása milyen fenséges és csodálatosan összehangolt. Még egy ilyen, viszonylag egyszerűnek tűnő mozgás kialakításához is igen sok apró részletet kell megvalósítani. Mivel a filmiparban állatok mozgását gyakran kell rögzíteni, kézenfekvő, hogy egy macskát "beöltöztetnek", és heteken át (!) dolgoznak, hogy a megfelelő elrugaszkodó, repülő, illetve leérkező mozdulatokat felvegyék. Ezekből a mozdulatszeletkékből néhány nap alatt összeállítható a kis Tigrisre jellemző ugráló mozgás, amelyet aztán kisebb variációkkal az összes modellre alkalmazni lehet.

Hogyan működik?

Az emberi mozgás jellemzőinek rögzítésére sok technikai megoldást dolgoztak ki. Többségük közös abban, hogy a testre aktív vagy passzív érzékelőket rögzítenek, amelyek pozícióját a felvétel során nagy pontossággal mérik. Ezen mérések eredménye alapján azután a háromszögelés módszerével "könnyen" kiszámítható az előadó csontvázának helyzete és csuklóinak pontos orientációja. Az érzékelőt akkor nevezzük aktívnak, ha jeleket sugároz. Aktív lehet pl. egy kis lámpa, egy LED vagy akár egy mágneses jelforrás. A passzív érzékelők éppen fordítva működnek, azaz külső jeleket vernek vissza, és így válnak láthatóvá. A legjobb hasonlat talán a kocsikon használt macskaszemek anyaga. Még kis rájuk eső fény mellett is viszonylag jól láthatók és felismerhetők. A használt jelforrások és érzékelők típusától függően igen sok variáció létezik. Napjainkban leginkább az optikai rendszerek terjedtek el (Vicon, Motion Analysis). Tipikus kiépítésben egy központi számítógép 8-32 digitális kamera segítségével egy időben több különböző szemszögből látja egy előadó mozgását. A felvétel előtt a színész ízületeire és teste más pontjaira a macskaszemhez hasonló fényvisszaverő elemeket (marker) szerelnek, amelyek nagy sebességű mozgás mellett is jól láthatók a kamerákkal. Ha a rendszer kalibrált, akkor a felvétel után elég információ áll rendelkezésre ahhoz, hogy minden marker 3D-s mozgáspályáját (trajectory) kiszámoljuk. Az optikai rendszerek legnagyobb előnye, hogy gyorsak, pontosak, és viszonylag nagyszámú, akár 300 markert is képesek egyszerre követni. Ugyanakkor a gyakori takarási problémák miatt - azaz amikor egy kamera nem látja valamelyik pontot - használatuk nehézkes lehet, különösen, ha egyszerre több személy mozgását kell egy időben rögzíteni. A másik jelentős hátrány, hogy még nem használhatók valós időben (real-time), azaz a rendező a felvételkor nem láthatja, hogy a rögzített mozgás miként néz majd ki a filmben egy virtuális színész esetében. Ha feltétlenül valós idejű rögzítésre van szükségünk, akkor legjobb elektromágneses berendezéseket használni (Ascension Technology, Polhemus). Ezek a rendszerek lényegében a színész testére erősített apró rádióadókból állnak, amelyek alacsonyfrekvenciás jeleket sugároznak az antennák felé. Mivel a szenzorok aktívak, pozíciójukon kívül orientációjukat is mérni tudjuk, így - az optikai megoldásoktól eltérően - nem három, hanem egyszerre hat szabadságfokot tudunk átadni az animációs programcsomagnak. A mágneses rendszerek legnagyobb előnye tehát, hogy 6D-s adatot szolgáltatnak valós időben, miközben több előadó mozgását is gond nélkül rögzíthetjük az érzékelők állandó kiesésének problémája nélkül. Persze az élet nem fenékig tejfel. Az előnyökért valahol fizetnünk is kell. A mágneses rendszerek mozgástere jóval kisebb, kevesebb érzékelőt használhatunk (általában 10-90-et), és a színész testét kábelek hálózzák be, amelyek nehézkessé tehetik mozgását. És még egy jó tanács. Az igen erős mágneses tér miatt semmiképpen se hozzuk magunkkal a hitelkártyánkat :-).

Itt megállok a rendszerek további ismertetésében, mivel még millió és millió különféle mütyür és mechanikai megoldás létezik. A téma iránt részletesebben érdeklődőknek leginkább Alberto Menache könyvét ajánlom. Menache, aki a PDI filmstúdió fő karakteranimátora, és akinek munkáját a Z, a hangya (AntZ) vagy a nemrégiben bemutatott Gladiátor című filmek kapcsán is megcsodálhattuk, nemcsak a technológiai alapokat mutatja meg, hanem betekintést nyújt a digitális filmgyártás kulisszái mögé is.

Motioncapture-mesék

A digitális mozgásrögzítés (mocap) technológiája - bár több mint 15 éve létezik - csak nagyon nehezen tudott bekerülni a filmgyártás elfogadott eszközei közé. Ennek okát elsősorban azokban a technikai nehézségekben kell keresnünk, amelyek megakadályozták, hogy az új eszköz könnyen és megbízhatóan illeszkedjen a már meglévő gyártási rendszerekbe. A legnagyobb gondot a felvett mozgásinformáció változtatása, szerkesztése jelenti. A rendezők szemszögéből ugyanis "a valóság nem élethű", azaz "nagyon lapos" - a szónak abban az értelmében, hogy a filmvásznon nem azt a hatást kelti, amit művészi szempontból el szeretnének érni. Ezért egyes mozdulatokat túl kell hangsúlyozni, vagy stilizált formában újra kell megjeleníteni. Ha tehát a felvett mozgásanyagot utólag a stúdióban nem lehet módosítani, akkor használata egyáltalán nem praktikus, és megbukik az animátorok ellenállásán. A rendező ugyanis sokszor nincs tisztában azzal, hogy az általa kívánt változtatások valójában milyen nehézségek árán valósíthatók meg. A modern animáció ugyanis még mindig a szereplők bizonyos kulcspozíciókba történő beállításán (keyframing) alapul. Ezek a pozitúrák a mozgás eldobhatatlan, azaz kulcsfontosságú elemeit tartalmazzák. Megváltoztatásuk az egész mozgássorozat megváltozását jelentheti. A filmnél használt másodpercenkénti 24 képkockából ezek a kulcsok (a mozgás bonyolultságától függően) 3-8 képkockánként követik egymást, a mocap használata esetén azonban minden képkocka kulcspozícióvá válik, így a módosítás óriási feladat.

A motion capture használata a korai időkben sok híres kudarchoz vezetett. A digitális mozgásrögzítés technikáját először Arnold Schwarzenegger Total Recall című filmjében próbálták ki. Az 1989-ben még aligha kiforrott optikai rendszert egy üldözéses jelentben akarták alkalmazni, amikor Arnold - néhány őr és az üldözők egy csapata elől menekülve - egy röntgenkészüléken rohan át, és csontváza láthatóvá válik. A jelenetet Mexikóvárosban vették fel. Schwarzenegger mozgását külön rögzítették, míg az üldöző őröket egyszerre 10 emberes csoportokban (ezt még ma sem vállalná senki). A felvétel simán lezajlott, és a rendezőt kételyei ellenére biztosították, hogy az adatokkal minden rendben lesz. Természetesen csak jóval később derült ki, hogy az operatőrök hibája miatt egyetlen másodperc erejéig sem tudták az anyagot használni. A megrendelőt természetesen ez nem nagyon érdekelte, így óriási költségek árán kézzel készítették el az egész jelenetet. A történet iróniája, hogy 1990-ben a PDI kollégái éppen ezért a munkájukért kapták meg a legjobb vizuális effektusért kijáró Oscar-díjat. Hasonló történetek "árnyalták" a Batman és Robin, illetve a Godzilla című filmet, ahol a nagy költségek árán rögzített mocap mozgásanyagának csak alig 20%-át tudták használni.

A nagy áttörést James Cameron filmje, a Titanic hozta meg. Az azóta híressé vált képsorokat, amelyekben a hajó végzetes útjára indul, hagyományosan több száz statiszta és egy helikopterről mozgatott kamera segítségével vehették volna fel. A valóságban azonban sem a hajó nem létezett, sem pedig a statiszták. A helikoptert egy mozgásvezérelt kamera helyettesítette, amely egy miniatűr makett felett suhant át, a tömeg pedig a Digital Domain stúdióiban rögzített mocap segítségével mozgatott virtuális statisztákból állt össze. A digitális mozgásrögzítés azóta fénykorát éli. Olyan filmeket köszönhetünk neki, mint a Csillagok háborúja I vagy a Múmia. A tanulság: ha a technológiát jól, a célnak megfelelően használjuk, örömben és sikerben lesz részünk. Ha rosszul, csak kínlódás és küszködés vár ránk. Talán életünk minden mozzanatára igaz ez egy kicsit…

A mocap és a szórakoztatóipar

Napjaink fontos folyamata a média- és általában a szórakoztatóipar konvergenciája. Bizonyos szempontból mondhatjuk, hogy ez a rendelkezésünkre álló animációs és digitális filmeszközök nagyfokú fejlődésének köszönhető. Ezekben az iparágakban az elmúlt években kialakult vizuális minőség már egyre kevésbé elegendő a versenyben maradáshoz, így mind az internet, mind a számítógépes játékipar kénytelen a jelenkori televízió képminőségével felvenni a versenyt. Ezt az igényt próbálják kielégíteni az újonnan megjelenő PlayStation 2, X-Box vagy Sega gépek is. A felfokozott harcban pozícióelőnyhöz csak olyan cégek jutnak, amelyek gyorsan és olcsón tudnak magas szintű termékeket, a mi esetünkben animációt előállítani. Ezt ma elsősorban a motion capture teszi lehetővé. Egy jobb sportjáték például egy csatár vagy védő közel 800 alapmozdulatát tartalmazza. Ezt "kézzel" animálni gyakorlatilag lehetetlen, így legtöbbször a liga sztárjaira szerelt motioncapture-rendszereket használják a mozgások rögzítésére. Az interneten is hasonló helyzet kezd kialakulni. A hetente megjelenő folytatásos epizódok (webisodes) vagy az egyre gyakoribb élőközvetítések - virtuális stúdiókból, virtuális szereplőkkel - mind valós idejű vagy legalábbis nagyon gyors gyártási folyamatot igényelnek.

Hová vezet ez a jövőben? Sajnos a mocap technológia drága, és várhatóan még sokáig nem lesz otthon, kisipari módszerekkel űzhető. A megoldást így más irányban kell keresnünk. Az olvasó talán emlékszik még egy korábbi cikkünkre, amelyben arról írtunk, hogy egy önállóan cselekvő és gondolkozó (azaz autonóm) virtuális ember létrehozásához öt főbb evolúciós lépésre lesz szükség. Ezek a következők: (1) fázisanimáció, (2) objektumorientált rétegződés, (3) procedurális viselkedés, (4) célkitűzés és adaptáció, (5) intelligencia, hangulat és érzelmek létrehozása. Utazásunk során elérkeztünk tehát a tudomány és technológia egyik igen dinamikusan fejlődő ága, a mesterséges intelligencia világába. A következő hónapban erről szól majd Autonóm avatárok és filmszereplők című cikkünk.