A Cornell Egyetem kutatói robotokat tanítanak oktatóvideók megtekintésére, abból pedig egy sor lépésről lépésre instrukció kiszűrésével egy bizonyos feladat elsajátítására.
A szakemberek szerint még DVD-lejátszót sem kell bekapcsolni, mert a robot megtalálja a szükséges tartalmat a YouTube-on. A fejlesztés már egy olyan jövőt céloz, ahol személyes robotjaink lehetnek a házimunka – főzés, mosogatás, mosás, macskaetetés – elvégzésére, illetve robot gondozóink az idősek és mozgáskorlátozottak megsegítésére.
A kutatók által RoboWatch névre keresztelt projektet részben az teszi kivitelezhetővé, hogy a legtöbb „Hogyan…” videó közös alapokon nyugszik és hatalmas az elérhető forrásmennyiség. A YouTube 180 ezer videót kínál csak arra a témára, Hogyan készítsünk tojásrántottát? és 281 ezret arra, Hogyan kössünk meg egy nyakkendőt? A robotikusok szerint az ugyanazon feladat megoldását kínáló videók szkennelésével egy számítógép meg tudja állapítani, mi a közös bennük, majd azt egyszerű, lépésről lépésre instrukciókká alakíthatja.
Ozan Sener, a vizsgálat vezető szerzője szerint a rendszer kulcsfontosságú jellegzetessége, hogy ellenőrizetlen. A legtöbb korábbi kísérletben a robotok tanulását kiegészítette egy ember, aki elmagyarázta, hogy mit is lát a gép: például a tárgyfelismerést eddig úgy oldották meg, hogy a tárgyak fényképét bemutatták a robotnak, miközben az ember nevén nevezte őket. Jelen esetben viszont a robot az adott munkaterületen maga járhat utána az instrukcióknak és egyedül fejtheti meg őket.
Egy ismeretlen feladat esetén a robot számítógépes agya adatlekérdezéssel igyekszik a videómegosztó oldalon fellelni az adott témában született Hogyan… videókat. Az algoritmus olyan rutinokat is felölel, amelyek mellőzik a keresőszavaknak ugyan megfelelő, de nem instruktív videókat: például a főzéssel kapcsolatos keresés rajzfilmes elemektől kezdve konyhaeszközökig sok mindent feldobhat.
A számítógép képkockáról képkockára végigpásztázza a videókat, gyakran feltűnő objektumokat keres, és a hozzá tartozó narráció feliratát olvasva megkeresi a rendszeresen ismétlődő szavakat. Eme markerekkel a különféle videók hasonló szegmenseit összeveti, majd egyetlen szekvenciába fűzi. A feliratokból pedig írásos instrukciókat képes összeállítani.
Más kutatásokban a robotok emberek verbális utasításai alapján próbáltak elsajátítani bizonyos feladatokat. A jövőben más forrásokat, például a Wikipediát is igénybe vehetik.
A videókból megszerzett tudásanyag a RoboBrain online ismerettárban érhető el a gépeknek.
Forrás: Phys.org / hirado.hu