A Xiaomi saját fejlesztésű technológiával segít a beszédzavarral élő embereknek

forrás: Prím Online, 2022. május 21. 14:16

Az internetes szolgáltatásokat nyújtó, valamint IoT platformon keresztül kommunikáló okostelefonokat és egyéb intelligens eszközöket gyártó Xiaomi most rántotta le a leplet legújabb, az akadálymentesítés jegyében létrehozott, fejlett algoritmusokra és saját fejlesztésű beszédtechnológiára épülő alkalmazásáról. A Xiaomi AI Lab által kifejlesztett, a szöveget beszédhanggá alakítani képes Text-To-Speech technológiát arra használják, hogy egyedi és testreszabott hangot generáljanak beszédzavarral élő felhasználók számára. 

Az érintett felhasználók mostantól a "saját hangjukat" használva, nem pedig a szokásos monoton géphangon kommunikálhatnak másokkal. Ez a sikeres kezdeményezés a Xiaomi Műszaki Bizottság "Own My Voice" projektje előkészítő kutatásainak része. A cég "Tech for Good" kampánya illeszkedik a Xiaomi távlati céljaihoz, amelyek fő üzenete: az "innovatív technológia segítségével mindannyiunknak jobb élete lehet".

 

Miért indította el a Xiaomi ezt a projektet?

A Xiaomi törődik az emberekkel, és a technológiai innováció segítségével törekszik az igényeik kielégítésére. A cég felismerte, hogy az érintettek is egyedi, saját hangjukat használva szeretnének kommunikálni a mindennapok során, így az "Own My Voice" projektet előkészítő csapatnak lett egy beszédzavarral élő tagja is, hogy minél pontosabban megértsék a célcsoport szükségleteit.

 

Zhu Xi, a Xiaomi Technológiai Bizottsága Tech for Good nagykövete elmondta: „Mi is izgatottan figyeljük, mennyi értéket teremt számunkra a technológiai innováció és ezek miként segíthetik a felhasználókat abban, hogy minél inkább önazonosak lehessenek.”

 

 

Hogyan valósította meg a Xiaomi a projektet?

A legmegfelelőbb és a leginkább személyre szabott tónusok létrehozása érdekében a projektcsapat több mint 200, a cégnél dolgozó önkéntest kért föl arra, hogy kölcsönözze a hangját a kezdeményezéshez. Egy hanglenyomat-megfeleltető algoritmus segítségével vetették össze az önkéntesek által adományozott hangokat az adott felhasználó hangjának jellemzőivel. Így találták meg azt a legmegfelelőbb hangszínt, amely referencia lehet a felhasználó számára.

 

A személyre szabás érdekében – a személyiségi jogok védelmének szem előtt tartásával – a kiválasztott hangot úgy módosították, hogy abból egy új és eredeti, a befogadó hangszínéhez közelítő tónus keletkezzen. Ezután az élőbeszédhez hasonló stílusú, a szöveget beszédhanggá alakítani képes Text-to-Speech technológiát hívják segítségül a mesterségesintelligencia-modell betanításához is, hogy az így létrehozott beszédnek emberi érzelmek kifejezésére is alkalmas természetes ritmusa és intonációja legyen.

 

Az "Own My Voice" projekt a legfejlettebb algoritmusokat kombinálja a Xiaomi saját fejlesztésű beszédtechnológiájával, hogy az így létrehozott tónus különlegesnek és hitelesnek hangozzon, ezzel alapozva meg a személyre szabott beszédszintetizációt a beszédzavarral élők számára is.

 

Miért jelentős ez a projekt?

Az innováció legfontosabb elemét a Xiaomi AI Lab beszédtechnológiával foglalkozó szakértői csoportja biztosítja, akik 2017 óta 37 hangszintetizálással kapcsolatos tudományos közleményt publikáltak olyan nívós nemzetközi fórumokon, mint például az International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Az "Own My Voice" elsősorban az általuk kifejlesztett Text-To-Speech technológiára támaszkodik, és a sikerének kulcsa is ez lehet.

 

Ezzel a technológiával intonációjában, dinamikájában és sebességében a valódi emberi hanghoz hasonló szintetizált hang hozható létre, amelynek révén a mesterségesnek ható, monoton géphangot egy természetesebb tónus váltja fel. Jelenleg ez a technológia számos olyan okoskészüléken elérhető, amelyben ott van a Xiaoai, a Xiaomi MI-alapú hangasszisztense. Az "Own My Voice" projekt azt demonstrálja, hogy Text-To-Speech technológia miként válhat széles körben alkalmazhatóvá az akadálymentesítés érdekében, és hogyan javíthatja a felhasználói élményt.

 

Zhu Xi hozzátette: „Ha korán felismerjük és figyelembe vesszük a problémában érintett felhasználói csoportok igényeit, az a technológia elterjesztésének folyamatát is jelentősen lerövidítheti, azt is elősegítve, hogy a speciális igényekkel rendelkező felhasználók azonnal a részesei lehessenek a legújabb fejlesztéseknek.”

 

A Xiaomi a jövőben is szem előtt tartja majd az érintett felhasználói kör visszajelzéseit, törekedve a megoldás minél szélesebb körű hozzáférhetővé tételére. A Xiaomi célja továbbra is az, hogy elérhetővé tegye a legfejlettebb technológiát, és a műszaki innováció révén kielégítse a legkülönbözőbb igényeket.

Kulcsszavak: Xiaomi Own My Voice

Megoldás ROVAT TOVÁBBI HÍREI

Így alakítják a jövőt a Pécsi Tudományegyetem hallgatói

Tizenkét innovatív kutatás-fejlesztési projekt indul a Pécsi Tudományegyetem Műszaki és Informatikai Karán a Huawei SEEDs Kiválósági Ösztöndíjprogram keretében. A mérnökhallgatók által jegyzett tudományos projektek valós iparági és társadalmi problémákra keresnek megoldást a legmodernebb technológiák – így a mesterséges intelligencia (MI), vagy a virtuális valóság (VR) – segítségével. A többi között intelligens parkolórendszert, a siketeket segítő jelnyelvfelismerő alkalmazást fejlesztenek, okospólókat felhasználva csoportok fizikai paramétereit – például katonák állóképességét – monitorozó megoldást hoznak létre, valamint egy olyan VR-alapú szimulációt is készítenek, amely az építőipari munkásokat segíti a biztonságosabb munkavégzésben. 

2022. július 7. 13:59

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Új vezető a Microsoft Magyarország élén

2022. július 1. 11:16

A hatás mechanizmusát keresik az IVSZ MENTA 2022 előadói

2022. június 30. 12:40

Az ESET új, hálózati szintű megoldást kínál a távközlési és internetszolgáltatók számára

2022. június 23. 11:24

A raktár nélküli webshopoké a jövő

2022. június 19. 13:24