3D-fényképezés: internet,games & Hollywood
Érzékelhető világunk három fizikai dimenzióból áll (3D), amelyet a fizikusok gyakran kiegészítenek egy negyedikkel (idő), a matematikusok pedig további jó néhánnyal - ha jól emlékszem, összesen 11-gyel -, amelyek nevéről és jelentéséről mit sem tudok :-). A szórakoztatóipar alapvetően kétdimenziós (2D). A filmvásznon vagy a televízió képernyőjén a 3D-s világot valójában a kamera síkjára eső vetületekkel ábrázoljuk, amit képeknek nevezünk. A mozifilm nem más, mint képek sorozata, melyeket a rendező és az operatőr szemszögéből látunk. Az életben azonban a tárgyakat megfoghatjuk, kezünkbe vehetjük, és szabadon nézegethetjük. Tapasztalataink alapján megtanuljuk formájukat, és később képeik alapján is felismerjük őket. Hétköznapjaink során ezt sok-sok tárggyal tesszük meg. Valójában nem is tudjuk, mennyi feltevés és tudatalatti hipotézis segítségével látunk. Agyunk statisztikai tulajdonságok alapján olyan feltevéseket tesz, amelyeket mi a "józan ész" alapján értelmezünk. Egy bögre füle például nem látszik minden szögből, mi mégis mindig pontosan felismerjük, a körülményektől függetlenül. Ugyanez igaz az emberi arcokra és szinte minden minket körülvevő tárgyra is. Egy ismeretlen arcról, amelyet például szemből vagy félig eltakarva látunk, elég nagy valószínűséggel feltételezhetjük, hogy a tulajdonos dús hajfürtjei mögött két fül is lapul. A viccesnek tűnő megfigyelés ellenére ezen "triviális" feltevések nélkül látásunk nem működne.
Fontos az a felismerés, hogy csak azt látjuk, amit látni akarunk, és nem azt, amit valójában a szemünk érzékel. Agyunk a beérkező ingereket rendszerezi, és egy egységes belső világ modellje alapján értelmezni próbálja. Az egymásnak ellentmondó részleteket kiszűri (pl. zajnak tekinti), és a hiányzó részleteket gyakran kitölti. Pontosan ezt az értelmezési mechanizmust lehet szemünk becsapására használni. Gondoljunk az optikai illúziókra. Az ott alkalmazott "trükkök" és optikai csalódások képezik a filmszakma speciális effektusainak alapjait is. Egy jó trükk célja nem a valóság ábrázolása, hanem kételyeink felfüggesztése. Szemünk csak akkor hisz el valamit valódinak (autentikusnak), ha bizonyos kulcstulajdonságok vagy ún. nyomok (cues) egybeesnek. Ezeket az apró részleteket úgy a legegyszerűbb létrehozni, ha a munkát egy nagyon is hétköznapi tárgy fényképezésével vagy digitalizálásával kezdjük. Így nem csoda, hogy "minden vizuális trükknek vagy illúziónak a valóságból kell kiindulnia."
3 dimenziós kamerák
A modern 3D-animáció alapját a számítógép belsejében tárolt geometriai modellek képezik. Ezek a modellek térbeli pontok seregéből épülnek fel, jól meghatározott szabályok szerint. Függetlenül attól, hogy egy emberi arcról, testről, esetleg csak egy épületről vagy egy járműről van szó, a bonyolult felszínek leírásához sok százezer pontra is szükségünk lehet. A kézi modellezés így igen sok szakértelmet és időt kívánó feladat. Jó lenne tehát az analóg és a digitális világ közé olyan eszközöket építeni, amelyek jelentősebb kézi beavatkozás nélkül számokkal, azaz numerikusan ábrázolják egy felszín koordinátáit. A 3D-fényképezés tehát valójában nem más, mint egy mérési feladat, ahol a kamerában kialakult kép minden egyes (X, Y) pixeljéhez egy távolságértéket (Z koordináta) és egy pixelszínt rendelünk hozzá. Egy 3D-képet előállító kamerának vagy kamerarendszernek három alapproblémát kell megoldania. Az első a forma (shape) pontonkénti rekonstrukciója, azaz a Z koordináták mérése. A második egy olyan textúra (texture) létrehozása, amelyet a formára rávetítve (texture projection) megkapjuk az eredeti objektum 3D-s helyes képét. A harmadik ugyanazon tárgyról készített több forma és textúra (patches) összeolvasztása egy egységes objektummá.
Technikailag a 3D-forma pontos mérésének feladata több módon is elképzelhető. Ha a tárgy statikus, azaz nem mozgó, akkor a legegyszerűbb és leggyorsabb módszer egy ún. lézerszkenner használata. A lézer pásztázó mozgással minden X, Y képpontra "kilő" egy lézersugarat, majd a háromszögelés (triangulation) matematikai elve segítségével megállapítja, hogy a sugár a kamera síkjától milyen távolságban metszette a digitalizálandó tárgyat. A 2D-s pásztázó mozgás kialakításához a sugár általában csak egy síkban mozdul el, míg a másik dimenziót a tárgy vagy a kamera mechanikus forgatásával érik el. A lézerszkenner a legelterjedtebb eszközök egyike, és sok cég forgalmazza. Példaként megemlíteném a Cyberware, a Minolta, a Polhemus, a Real-3D és a Magyarországon kifejlesztett ScanGuru termékeit.
Lézerfény helyett vetíthetünk egy ismert mintát is a tárgyra. A módszert strukturált fénynek (structured light) nevezik. Ha pl. egy kockás füzet mintáját rávetítjük valaki arcára, akkor a négyzetháló torzulásaiból kiszámíthatjuk, hogy az egyes felszíni pontok milyen relatív Z koordinátáknak felelnek meg. Minél sűrűbb a négyzetháló, annál pontosabban tudjuk a felszínt rekonstruálni. Nagy felszíni sűrűség eléréséhez az egymástól kissé eltérő négyzethálós mintákat egymás után gyorsan váltogathatjuk (multiplexing), vagy különböző színekkel kódolhatjuk (color stripe method). A módszer előnye nemcsak olcsósága, hanem gyorsasága és egyszerű használata is. Így érthető, hogy az utóbbi két évben egyre inkább kezd elterjedni. A korábbi cikkeinkben említett Marlene Dietrich-animáció (Virtual Celebrity) létrehozásához például a belga Eyetronics nevű cég ShapeSnatcher termékét használtuk. Ajánlani tudnám még a 3D Metrics kameráját, amelyet éppen ezekben a hónapokban egy közel 1000 arcot tartalmazó arcadatbázis létrehozására alkalmazunk (Digital Elite), vagy az orvosi technológiára szakosodott Virtual 3D- és a játékiparban használt Inspeck-kamerákat.
A harmadik megoldás az emberi térlátáshoz hasonló sztereolátás elvén működik. Először két kamera ugyanarról a tárgyról kissé eltérő nézőpontból készít képet, majd a "bal" kép minden pontjához megfeleltetik a "jobb" kép megfelelő pixeljét (stereo matching). A kettő látszólagos elmozdulásából kiszámítható, hogy az adott képpont milyen távolságban volt a kamerák síkjától. A módszer egyszerű, de gyakorlati alkalmazása sok nehézségbe ütközhet, így csak néhány cég alkalmazza. Az érdeklődőknek azonban érdemes megnézniük a RealViz vagy a C3D technológiáját.
3D-arcok
Az animáció világában a valósághű, érzelmeket és érzéseket kifejezni tudó arcok létrehozása technikailag még ma is az egyik legnagyobb kihívásnak számít. Kézenfekvőnek látszik, hogy élő emberek arcát és mimikáját digitalizáljuk, majd ezt használjuk programjainkban. Sajnos ez a gondolat nem vezet egyszerű és gyors megoldáshoz. Mint fentebb leírtuk, egy 3D-kamerának egyszerre két funkciót kell megvalósítania. Az egyik az, hogy nagy pontossággal mérni tudja a tárgy geometriai formáját, a másik pedig, hogy egy képet/textúrát rögzítsen. Ha a tárgy nem mozog, ezt a két lépést egymás után könnyen megtehetjük. Arcunk azonban makro- és sokszor alig észrevehető mikromozgásaival csak akkor teszi ezt lehetővé, ha a két képet nagyon gyors egymásutánban készítjük el. Egy átlagos videokamera mindössze 30 képet tud másodpercenként rögzíteni. A fent vázoltak alapján ennek csak fele, azaz 15 kép áll rendelkezésünkre egyetlen másodperc leforgása alatt, alig több mint 10%-a annak a sebességnek, amely szükséges lenne minden fintorunk pontos felvételéhez és analizálásához.
Vajon valóban szükséges minden apró arcmozdulatunkat rögzíteni, vagy van elegánsabb megoldás is? A válasz: igen is, meg nem is. Ha pontos mérésről van szó, akkor nem tehetünk mást, mint hogy megépítünk egy nagyon nagy sebességű és felbontású kamerarendszert. A film és az internet világában azonban csak a valóság illúzióját kell keltenünk, így megengedhetünk egy kis csalást. Néhány hónappal ezelőtt arról írtunk, hogy matematikai értelemben jól, pontosan és kompaktul leírható arcunk, illetve arckifejezéseink. Ebből logikusan következik, hogy ha egy olyan kamerát építünk, amely ismeri az emberi arc fogalmát, akkor ezt a matematikai modellt arra is használhatjuk, hogy a kamera által "látott" képet értelmezzük, és minden képponthoz hozzárendeljük a megfelelő Z koordinátát. De nem untatok senkit a technikai részletekkel. Mégis hová vezet ez? Végeredményben jogi és etikai kérdések hosszú sorához. Ez a megoldás ugyanis lehetővé teszi, hogy bárki arcát egyetlen fénykép alapján rekonstruáljuk, és animáció segítségével olyan szituációkba helyezzük, amit nem tett és valószínűleg nem is tett volna meg. Nem kell azért mindjárt rosszra gondolni. Megváltoztathatjuk például Mona Lisa híres mosolyát, vagy akár egy mosóporreklámban is szerepeltethetjük... A továbbiakat az olvasó fantáziájára bízom :-).
Internet, games & Hollywood
Az elmúlt években kialakuló digitális szórakoztatóipar forradalmához nagyban hozzájárult, hogy az egyre olcsóbb és elterjedtebb 3D-s digitalizáló eszközök segítségével könnyen és hatékonyan tudunk különböző tárgyakat a számítógép belsejébe juttatni. Míg kezdetben ez a film- és játékipar privilégiuma volt, napjainkban szinte bárki megvehet egy, az ízlésének és pénztárcájának megfelelő 3D-s digitalizáló eszközt. Ez az elektronikus kereskedelemben, azaz az internet hasábjain olyan honlapokhoz vezetett, ahol a cybervásárlók forgathatják és minden irányból megnézhetik - mintegy kezükbe vehetik - azokat az árucikkeket, amelyeket szeretnének megvásárolni. Ma talán utópiának tűnik, de az új évezredben valószínűleg az is meg fog változni, ahogy ruháinkat próbálgatjuk egy üzletben. A közeljövőben a feleségem például bemehet az áruházba, kiválaszthat egy elegáns öltönyt, majd - korábban digitalizált testem alapján - a számítógép automatikusan létrehoz egy olyan fényképet, amelyen testre szabott új öltönyömben állok gyermekeinkkel a napsütésben. Nem marad más hátra, mint ezt a képet e-mailben elküldeni az irodámba, ahol én - jó férj módjára - jóváhagyom, és azonnal (szintén elektronikusan) ki is fizethetem. De nemcsak a kereskedelem, hanem az élet minden területe megváltozik. Már napjainkban is léteznek olyan interaktív múzeumok, ahol az értékes tárgyak digitális másolatával szinte azt tehetünk, amit akarunk. Kedvünkre nézegethetjük őket, játszhatunk velük, még belsejükbe is betekinthetünk, miközben egyre többet tudunk meg az őket körülvevő ősi kultúrákról. Végül a 3D-kamerák hatására természetesen a film és a játékok világa is kezd majd átalakulni. Hollywood kísérletezőbb kedvű műhelyeiben a korábban költséges színpadok helyett már ma is teljes egészében számítógéppel generált digitális díszleteket, berendezési tárgyakat és kellékeket alkalmaznak. Az utolsó, még valódinak tekinthető elem az ember... De, mint tudjuk, a szintetikus színészek megjelenése hamarosan ezt is veszélybe sodorhatja.
A művészeket és a művészetet azonban soha nem szabad - és nem is tudjuk - kiiktatni. Az alkotás formája megváltozhat, de lényegi folyamata nem. Minden bizonnyal a jövő animátorai bonyolult digitális lényekkel rendelkeznek majd. Az egér és a billentyűzet használata helyett szóbeli utasításokkal, párbeszéd formájában érik el művészi céljaikat. Jelenleg azonban még nem tart itt a világ és a technológia. Ha egy virtuális színészt ma mozgatni akarunk, akkor a legegyszerűbb egy élő ember mozdulatait lemásolni. Ezt a megoldást a film világában motion capture-nek hívják, és ennek titkaiba nyújtunk bepillantást sorozatunk következő számában.
Kapcsolódó cikkek
- Samsung termékáradat a berlini IFA-n
- 360 fokos panorámaképek mobilkamerával
- A világ első teljesen elektronikus képkeresője digitális kamerákhoz
- Photoshop: újabb támogatott géptípusok és digitális negatív
- Tenyérmédia - Karácsonyra
- Adobe szoftverek amatőr digitális videósoknak és fényképészeknek
- Kamerás telefonokkal készített képnyomtatás fotóminőségben
- 8 megapixeles fotók mobiltelefonnal
- TIPA díjözön a Canonnak
- Képek nyomtatása közvetlenül mobiltelefonról
TECHXPO 2024: Már közel 360 ezren töltötték le a Digitális Állampolgár mobilalkalmazást
Megnyitotta kapuit a TECHXPO 2024, Közép-Európa legnagyobb tech csúcstalálkozója Budapesten. A négynapos rendezvény fajsúlyos nemzetközi konferenciaprogrammal indult, melynek nyitóelőadását Rogán Antal, a Miniszterelnöki Kabinetirodát vezető miniszter tartotta a Digitális Állampolgárság témájában. Előadott még a konferencián többek között Gerd Leonhard, a világ TOP 10 jövőkutatóinak egyike, Hong-Eng Koh, a Huawei Technologies globális közszolgálati iparági vezető kutatója, illetve Bojár Gábor, a Graphisoft alapítója is.
A Tenstorrenttel közösen fejleszti mesterségesintelligencia-megoldásait az LG
Az LG Electronics (LG) és a Tenstorrent bejelentette, hogy kibővítették együttműködésüket, amelynek célja a globális piacra szánt SoC-k, (System-on-Chips, azaz egylapkás rendszerek) fejlesztése. A partnerség révén az LG célja, hogy tovább bővítse a termékeihez és szolgáltatásaihoz használt AI-chipek tervezésében és fejlesztésében rejlő lehetőségeket. A vállalat elkötelezett az AI-alapú innovációk előmozdítása mellett, különösen a háztartási készülékek, az okosotthon-megoldások, valamint a jövőbeli mobilitási és kereskedelmi fejlesztésének területén.
Franciaországban már a mesterséges intelligencia deríti fel a villanyóraleolvasási hibákat
Az ENEDIS, Franciaország villamosenergia-hálózati elosztója az SAP Signavio Process Mining és az SAP Business AI megoldásait választotta annak érdekében, hogy automatizálja a mérőleolvasások során észlelt anomáliák megoldását, és megbízható számlázást garantáljon mintegy 600 000 üzleti ügyfelének.
A Vezetők között a Schneider Electric az e-autók töltését menedzselő megoldások piacán
A Vezető megoldásszállítók közé sorolta az IDC kutatócég „MarketScape: Worldwide Electric Vehicle Charging Management Solutions 2024 Vendor Assessment” elemzése a Schneider Electricet az elektromos járművek töltését menedzselő rendszerek piacán. A vállalat megoldásai átfogó töltőinfrastruktúra-kezelést biztosítanak a skálázhatóságra, a megbízhatóságra, a biztonságra és a felhasználói élményre összpontosítva.
Rébuszok helyett kézzelfogható megoldások a NIS2 fejtörőhöz
Nagy érdeklődés övezte a Gábor Dénes Egyetem NIS2 konferenciáját. Ennek egyik oka a téma aktualitása, hiszen a kiberbiztonság szavatolása kötelező törvényi előírás az érintett vállalatok részére. A másik ok, hogy kevés az egész folyamatot átfogó és bemutató esemény, amely nemcsak a NIS2 irányelvben meghatározott jogszabályi előírásokat mutatja be és értelmezi, hanem kézzelfogható, gyakorlati megoldásokat is kínál a vállalatok részére.