Világszerte egyedülálló beszédfelismerő rendszert fejlesztettek
A Nextent Informatika Zrt. által vezetett konzorcium a Széchenyi 2020 „K+F versenyképességi és kiválósági együttműködések” (GINOP 2.2.1) című felhívásra 2017-ben benyújtott pályázatával 607,63 millió forint vissza nem térítendő európai uniós támogatásban részesült. A kutatás-fejlesztési projekt célja a magyar call centerek számára készült hangbányászati rendszer nemzetköziesítése volt, intonált kifejezések azonosítására alkalmas technológia kifejlesztésével. A megvalósításban részt vett az Xdroid Kft., a SCI-Hálózat Zrt., és a Szegedi Tudományegyetem is.
A négy fős konzorcium 2021. március 31-én sikeresen lezárta a „Voxindex” nevű projektjét, mely keretében egy olyan, intonált kifejezések valós idejű azonosítására alkalmas nyelvfüggetlen, telefonos közegben működő, minta alapú beszédfelismerő rendszert fejlesztettek ki, mely a világ vezető beszédfelismerő technológiáitól eltérően alkalmas egy-egy új nyelven való azonnali alkalmazásra, és egyúttal képes kezelni az egyes emberek eltérő intonációjából adódó különbségeket.
A nemzetközi versenytársak jelenleg szinte kizárólag nyelvfüggő beszédfelismerő technológiákat használnak és legfeljebb a piacaik szerinti legfontosabb 10-15 nyelvet fedik le, amely a Föld populációjának - beszélt nyelv szerint - csak a 20-25%-át teszi ki. Ezek a megoldások nem képesek megbirkózni a speciális kiejtéssel, a ritka kifejezésekkel, a rosszabb beszédminőséggel, valamint telefonos közegben a jóval alacsonyabb hangminőség miatt nem működnek.
A fejlesztés eredményeként így a kettős célt - a gyors nyelvi bővítést és a rosszul intonált beszéd felismerésének problematikáját - egyszerre sikerült megoldani. A rendszer különbséget tud tenni azonos tartalmú, de különböző intonációjú kifejezések között, például megkülönböztetni egy dühös ügyfél elköszönését egy elégedett ügyfél elköszönésétől, vagy az éneklést a szavalástól, a suttogó beszédet a kiabálástól. A nyelvterületi célcsoportok mellett fontos értékesítési célt képeznek az idős, panaszokkal küzdő emberek felügyeletét ellátó úgynevezett care centerek diszpécser szolgálatai is. Ezen emberek hangját a beszédfelismerő rendszerek nehezen ismerik fel, hiszen állapottól függő intonációs és akusztikus kilengések övezik a beszédüket. Itt jön elő a minta alapú rendszer előnye, azaz, hogy hangminta alapon lehet benne keresni.
Az innovációs eredményeket egy, az adott terület országosan és világszinten is elismert kutatóiból álló szakmai csapat együttműködése biztosította. A több mint 20 fős kutató csapatban találhatóak mesterséges intelligencia, beszédtechnológiai szakértők, nyelvészek, fonológusok, és termékfejlesztési szakemberek is. A projekt az alábbi telephelyeken valósult meg: a Nextent kutató-fejlesztő laboratóriumaként működő miskolci telephelyén, a SCI-Hálózat jobbágyi fióktelepén, az Xdroid szegedi kutatási központjában, illetve az SZTE Bölcsészettudományi Karán.
Kapcsolódó cikkek
- Eljött a hanglenyomat alapján történő azonosítás ideje
- Elégedett a Telenor ügyfélszolgálat az érzelemfelismerő szoftverrel
- Az internetes zaklatások ötöde a közösségi médiában történik
- Cassandra mesterséges intelligenciával racionalizálja a call centerek működését
- Szegeden nyitja meg új irodáját a Lufthansa Systems
- Megnyugodhatnak a call centeresek: munkájukat egyelőre nem veszélyeztetik a robotok
- Agrármegoldás lett a befutó az első 24 órás IoT hackathonon Szegeden
- Bekapcsolódik a hazai kutatás-fejlesztésbe a Huawei
- A Szegedi Egyetemmel közösen keres kibervilágrengető ötleteket a T-Systems
- Új fejezetet nyit a hazai informatikai képzésben, orvos-, élelmiszer- és agrárinformatikában a Magyar Telekom Csoport