Képelemzési eljárást fejleszt a Xerox egy magyar kutató közreműködésével

forrás Prim Online, 2011. február 17. 16:41

A Xerox európai kutatóközpontjának, a Xerox Research Centre Europe-nak az egyik fő kutatási területe az intelligens képfelismerő- és elemző megoldás kidolgozása. A sikeres tesztelésekkel megalkotott rendszer piaci bevezetése alapvető változásokat hozhat a képfeldolgozás jelenleg ismert, illetve használt folyamataiban. Leányvállalatán, az Affiliated Computer Services szolgáltatásain keresztül a Xerox hosszútávon is be szeretné építeni üzleti folyamataiba, partneri együttműködéséibe a kutatások eredményeit.

Manapság a képek felkutatása a céges archívumokból vagy online képtárakból szinte kizárólag azok szöveges elnevezésére való rákereséssel történik. Ennek megfelelően a felhasználó keresési találatai között csak olyan fotók jelennek meg, amelyek címében szerepel a megadott kulcsszó. A témájukban egyező, azonban szöveges jellemzésükben hiányos találatok elvesznek, vagyis a kívántnál kevesebb releváns kép akad fenn a találati szűrőn. A Xerox szakemberei ezen az alacsonyabb hatásfokú keresési formulán szeretnének változtatni azzal, hogy olyan képfelismerő- és elemző alkalmazásokat dolgoznak ki, amelyek kiegészítik a szöveges keresést egy automatikus képfelismerési modullal.

„Az archívumokat kezelő rendszert mintaképek segítségével megtanítjuk arra, hogy felismerje a keresett kép különböző elemeit. Ha például olyan képet keresünk, amelyen egy spánielt sétáltató fiatal lány látható, aki a nyakába húzott kapucnis felsőben az eső áztatta erdőt járja, akkor ezeket az elemeket egyenként, illetve együttesen is értelmezni tudja az erre felkészített rendszer. Azaz, ha egyszerű kereséssel a kutyasétáltatás a megadott kulcsszó, akkor úgyis találatként jelenik meg, és akkor is, ha összetett keresés esetén egyszerre több képjellemzőt adunk meg” – hangsúlyozta a rendszer működése kapcsán Csurka Gabriella, a projekt egyik szakértője. A szakember beszámolója szerint előrehaladott elméleti kutatásokat végeznek a képek esztétikai besorolása érdekében, hogy ez a szempont is keresésre alkalmas kategóriává válljon a jövőben. Ennek révén arra is lehetőség nyílik majd, hogy a képek által keltett érzelmi benyomások és hangulatok megjelenjenek a keresési feltételek közt.

A most tesztelés alá vont Xerox képfelismerő- és elemző megoldás már több ezer képkategóriát (köztük tájakat, tárgyakat, állatokat, de úgyszintén absztrakt kategóriákat, mint „teniszmérkőzés” vagy „esküvő”) képes eredményesen megtanulni mintaképek alapján, így ugyanennyi besorolási szempont alapján válik kereshetővé az adott felvétel. A megoldást szöveges keresőfunkcióval kombinálva gyakorlatilag bármilyen általános kulcsszóra (beleértve például konkrét személyek vagy helyek nevét) rákereshetünk, jelentősen javítva a keresés eredményét.

A legnagyobb kihívást a projektben az jelenti, hogy a rendszer a mintaképek betáplálása után és azok állandó ismétlő monitorozása alapján kellő pontossággal határozza meg a jellemző elemeket (formákat, színeket, kontrasztokat, személyeket, szöveges tartalmakat, anyagokat vagy a felületek minőségét) és ismerje fel azokat a későbbiekben. Jelenleg az alkalmazás keresési beállításainak finomhangolása zajlik, a rendszer széleskörű elterjedése a kutatások befejezését, és a sikeres tesztelések lezárását követően várható. Mivel a kutatók a multimodális – azaz a kép- és szövegalapú keresést kombináló – keresésben látják a jövőt, az utóbbi keresési mechanizmusra épülő technológiát is folyamatosan fejlesztik. Ráadásul ezen megoldás elemei már megtalálhatóak a vállalat szolgáltatásaiba épített néhány munkafolyamatban is. A szövegalapú Litigation Services szolgáltatáson keresztül például sikerrel alkalmazzák a csoportosítást és kategorizálást egyszerűsítő folyamatokat a jogi dokumentumok elrendezésében – e-dokumentumok millióit kezelik a Xerox által fejlesztett rendszerek, könnyebbé téve az ügyészek és ügyvédek munkáját.

A Xerox által felvásárolt, informatikai- és üzleti folyamatokat kiszervező vállalat, az Affiliated Computer Services (ACS) szintén beépíti szolgáltatásaiba a Xerox európai kutatóközpontjának fejlesztéseit. Az eredmények felhasználása széles spektrumon mozog, az irodai archívumkezeléstől az egészségügyig sok területen képes azonnali és hathatós segítséget nyújtani a napi munka egyszerűsítésében, és hatékonyságának növelésében. Az Aladin kutató programban például olyan kategorizálási módszer kifejlesztésén dolgoznak, amelynek révén a betegségek azonosítása válik gyorsabbá a lelettárolási rendszer kiépítésével. A felhasználási területek száma gyakorlatilag végtelen – többek között a közlekedésszervezésben is komoly hasznát lehet venni a képfeldolgozási eljárásoknak: a rendszer segítségével a kamerák például rendszám alapján képesek pillanatok alatt ellenőrizni, hogy jogosultan veszi-e igénybe az ott közlekedő jármű a buszsávot.

Kulcsszavak: tudomány Xerox

Infotársadalom ROVAT TOVÁBBI HÍREI

Ismét találkozhatunk a Google Utcakép autóival

Google Utcakép autói idén tavasszal újra visszatérnek a magyar utakra. A következő hónapokban az ország számos pontját érintik majd, hogy frissítsék a városok, utak és autópályák nézetét a Google Térképen.

2024. április 20. 09:49

Sony World Photography Awards 2024 – kihirdették a nyerteseket

A World Photography Organisation egy különleges gálaünnepségen Londonban kihirdette a Sony World Photography Awards 2024. évi nyerteseit. Az immár 17. éve megrendezett díjátadó ünnepség napjaink legjobb fotográfiai alkotásait mutatja be, valamint az elmúlt év legközkedveltebb képeit és történeteit díjazza. A győztes, döntős és shortlistre került képek április 19-től láthatók a Sony World Photography Awards 2024 kiállításon a londoni Somerset House-ban.

2024. április 19. 20:08

Kiberbiztonsági útmutató készült a magyar kkv-knak

A magyar kisvállalkozásokat támogató kiberbiztonsági kézikönyvet mutatott be az Európai Innovációs és Technológiai Intézettel (EIT Digital), a Nemzetközi Digitális Alapítvánnyal (Global Digital Foundation) együttműködve a Huawei Technologies. 

2024. április 19. 18:43

A MITTE az ügynökségi partnere a világ első tokenizált naperőmű projektjének

A MITTE felel a globális zöld energia vállalat, a Sunmoney Solar Group almárkájának branding és social feladataiért, illetve a Sunmoney 360 app design feladataiért.

2024. április 19. 16:59

Ünnepel a Samsung Galaxy Team európai sportolói csapata

Már csak 100 nap, és elkezdődnek a 2024-es párizsi olimpiai és paralimpia játékok. Ez alkalomból a Samsung, az esemény nemzetközi partnereként bejelenti eddigi legnagyobb létszámú sportolói csapatát. A vállalat idén összesen 57, köztük 44 európai Team Galaxy versenyzőt támogat – olyan sportolókat, akik a játékok során országukat képviselik –, hogy az olimpián is kihozhassák magukból a bennük rejlő lehetőségeket. 

2024. április 19. 15:11

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Ingyenes digitális platform segít a tanároknak és diákoknak az érettségire való felkészülésben

2024. április 20. 11:36

Itt a világ első, Swarovski kristályba ágyazott autós kijelzője

2024. április 10. 14:55

A csevegőprogramokat vizsgálta az NMHH

2024. április 2. 13:14

Megvannak az IAB 2023-as Legjobb szakdolgozat pályázatának nyertesei

2024. március 25. 15:50