Képelemzési eljárást fejleszt a Xerox egy magyar kutató közreműködésével
Manapság a képek felkutatása a céges archívumokból vagy online képtárakból szinte kizárólag azok szöveges elnevezésére való rákereséssel történik. Ennek megfelelően a felhasználó keresési találatai között csak olyan fotók jelennek meg, amelyek címében szerepel a megadott kulcsszó. A témájukban egyező, azonban szöveges jellemzésükben hiányos találatok elvesznek, vagyis a kívántnál kevesebb releváns kép akad fenn a találati szűrőn. A Xerox szakemberei ezen az alacsonyabb hatásfokú keresési formulán szeretnének változtatni azzal, hogy olyan képfelismerő- és elemző alkalmazásokat dolgoznak ki, amelyek kiegészítik a szöveges keresést egy automatikus képfelismerési modullal.
„Az archívumokat kezelő rendszert mintaképek segítségével megtanítjuk arra, hogy felismerje a keresett kép különböző elemeit. Ha például olyan képet keresünk, amelyen egy spánielt sétáltató fiatal lány látható, aki a nyakába húzott kapucnis felsőben az eső áztatta erdőt járja, akkor ezeket az elemeket egyenként, illetve együttesen is értelmezni tudja az erre felkészített rendszer. Azaz, ha egyszerű kereséssel a kutyasétáltatás a megadott kulcsszó, akkor úgyis találatként jelenik meg, és akkor is, ha összetett keresés esetén egyszerre több képjellemzőt adunk meg” – hangsúlyozta a rendszer működése kapcsán Csurka Gabriella, a projekt egyik szakértője. A szakember beszámolója szerint előrehaladott elméleti kutatásokat végeznek a képek esztétikai besorolása érdekében, hogy ez a szempont is keresésre alkalmas kategóriává válljon a jövőben. Ennek révén arra is lehetőség nyílik majd, hogy a képek által keltett érzelmi benyomások és hangulatok megjelenjenek a keresési feltételek közt.
A most tesztelés alá vont Xerox képfelismerő- és elemző megoldás már több ezer képkategóriát (köztük tájakat, tárgyakat, állatokat, de úgyszintén absztrakt kategóriákat, mint „teniszmérkőzés” vagy „esküvő”) képes eredményesen megtanulni mintaképek alapján, így ugyanennyi besorolási szempont alapján válik kereshetővé az adott felvétel. A megoldást szöveges keresőfunkcióval kombinálva gyakorlatilag bármilyen általános kulcsszóra (beleértve például konkrét személyek vagy helyek nevét) rákereshetünk, jelentősen javítva a keresés eredményét.
A legnagyobb kihívást a projektben az jelenti, hogy a rendszer a mintaképek betáplálása után és azok állandó ismétlő monitorozása alapján kellő pontossággal határozza meg a jellemző elemeket (formákat, színeket, kontrasztokat, személyeket, szöveges tartalmakat, anyagokat vagy a felületek minőségét) és ismerje fel azokat a későbbiekben. Jelenleg az alkalmazás keresési beállításainak finomhangolása zajlik, a rendszer széleskörű elterjedése a kutatások befejezését, és a sikeres tesztelések lezárását követően várható. Mivel a kutatók a multimodális – azaz a kép- és szövegalapú keresést kombináló – keresésben látják a jövőt, az utóbbi keresési mechanizmusra épülő technológiát is folyamatosan fejlesztik. Ráadásul ezen megoldás elemei már megtalálhatóak a vállalat szolgáltatásaiba épített néhány munkafolyamatban is. A szövegalapú Litigation Services szolgáltatáson keresztül például sikerrel alkalmazzák a csoportosítást és kategorizálást egyszerűsítő folyamatokat a jogi dokumentumok elrendezésében – e-dokumentumok millióit kezelik a Xerox által fejlesztett rendszerek, könnyebbé téve az ügyészek és ügyvédek munkáját.
A Xerox által felvásárolt, informatikai- és üzleti folyamatokat kiszervező vállalat, az Affiliated Computer Services (ACS) szintén beépíti szolgáltatásaiba a Xerox európai kutatóközpontjának fejlesztéseit. Az eredmények felhasználása széles spektrumon mozog, az irodai archívumkezeléstől az egészségügyig sok területen képes azonnali és hathatós segítséget nyújtani a napi munka egyszerűsítésében, és hatékonyságának növelésében. Az Aladin kutató programban például olyan kategorizálási módszer kifejlesztésén dolgoznak, amelynek révén a betegségek azonosítása válik gyorsabbá a lelettárolási rendszer kiépítésével. A felhasználási területek száma gyakorlatilag végtelen – többek között a közlekedésszervezésben is komoly hasznát lehet venni a képfeldolgozási eljárásoknak: a rendszer segítségével a kamerák például rendszám alapján képesek pillanatok alatt ellenőrizni, hogy jogosultan veszi-e igénybe az ott közlekedő jármű a buszsávot.
Kapcsolódó cikkek
- Tízszer hosszabb üzemidejű akkumulátorok
- Fénnyel hajtogatható 3D-s csomagolást fejlesztettek ki
- Masat-1 - Idejének negyedét a Föld árnyékában tölti az első magyar műhold
- Az ókori világ földrajzát segít megismerni a Google új projektje
- Masat-1 - Az első magyar műhold a Föld árnyékában halad pályája egy részén
- A digitális technológia mentheti meg a kihalófélben lévő nyelveket
- Már elérhető a neten Európa legjobb gépi fordítóprogramja
- Japán tudósok megcsinálták az Avatar-robotot
- A munkavégzés hatékonyságát növelő mobilalkalmazást fejlesztett a Xerox
- Sokoldalú LED-es megoldású kijelzők az LG-től
Infotársadalom ROVAT TOVÁBBI HÍREI
A Sony bejelenti második generációs zászlóshajóját, az Alpha 1 II fényképezőgépet
A Sony bemutatja a második generációs Alpha 1 II zászlóshajóját, egy új full frame, tükör nélküli, cserélhető objektíves fényképezőgépet, amelyet a Sony legmodernebb AI feldolgozóegységével működik. A fényképezőgép körülbelül 50.1 megapixel (MP) effektív felbontású érzékelővel rendelkezik, akár 30 fps sebességgel, AF/AE-követéssel képes elsötétedésmentes sorozatfelvételt készíteni, torzításmentes zárral van ellátva, és továbbfejlesztette a képtisztaságot a közép- és magastónusok érzékenységénél.
Az új Sony objektív nagy felbontást, gyönyörű bokeh-t és fejlett autofókuszt kínál
A Sony bejelentésével új utat tör: az FE 28-70mm F2 GM prémium E-bajonettes objektív a teljes zoomtartományban nagy, F2-es rekesznyílással büszkélkedhet, így gyönyörű bokeh-t, nagy felbontást és egyedülálló autofókuszt biztosít állóképekhez és videófelvételekhez, nem beszélve a prímobjektívek minőségével vetekedő élességről és kontrasztról.
A digitális bankolás jövője: személyre szabott ügyfélélmény és új generációs technológiák
A Deloitte legfrissebb, Digital Banking Maturity 2024 kutatásának eredményeiből kiderül, hogy a COVID-19 járvány idején elindult digitalizációs folyamatok nemhogy nem lassultak, hanem új lendületet kaptak a bankszektorban az elmúlt évek során, alkalmazkodva az ügyfelek folyamatosan bővülő igényeihez. A fejlesztések fókuszában a funkciók mennyisége helyett, egyre inkább a személyre szabottság, az ügyfélélmény fokozása és a költséghatékonyság kapott hangsúlyt. Emellett a korábban elhanyagolt területek, például a digitális jelzálog is előtérbe kerültek.
OMV: 2025 végéig országszerte elérhető lesz az ultragyors töltőhálózat
Országszerte 15 helyszínen már igénybe vehetőek az OMV új gyorstöltői. A társaság még idén megduplázza ultragyors töltéssel üzemelő töltőállomásai számát, 2025 végéig pedig közel 50 helyszínen összesen 80 villámtöltő pont működik majd az országban. A töltők legalább 100 kW teljesítmény leadására képesek, ami később több helyszínen akár a 200 kW-ot is elérheti, a hálózati kapacitás függvényében. Az OMV saját applikációt is fejlesztett a töltőkhöz, amiben most különleges akciókkal várja az autósokat.
Nemzetközi szintre lép a karbonlábnyom-csökkentő magyar startup
Balogh Petya és az általa fémjelzett STRT Holding Nyrt., valamint két másik befektető látott fantáziát a digitális marketing tevékenységek, így a weboldalak és e-mail kampányok karbonlábnyomának csökkentésére specializálódott Carbon.Crane-ben. A világszinten naponta küldött 350 milliárd e-mail* és a 200 millió aktívan üzemelő weboldal** – a háttérben dolgozó szerverparkok miatt – egyre nagyobb, ráadásul egyre növekvő részét teszi ki a globális karbonkibocsátásnak, erre dolgozott ki egyedi megoldásokat a 100%-ban magyar tulajdonú és hazai alapítású startup. Az egyedi és innovatív szolgáltatásokat nemzetközi szinten is értékeli a szakma, amit legutóbb a MediaSpace Global Changemakers' Awards 2024 díjával ismert el.