A Xiaomi saját fejlesztésű technológiával segít a beszédzavarral élő embereknek

forrás: Prím Online, 2022. május 21. 14:16

Az internetes szolgáltatásokat nyújtó, valamint IoT platformon keresztül kommunikáló okostelefonokat és egyéb intelligens eszközöket gyártó Xiaomi most rántotta le a leplet legújabb, az akadálymentesítés jegyében létrehozott, fejlett algoritmusokra és saját fejlesztésű beszédtechnológiára épülő alkalmazásáról. A Xiaomi AI Lab által kifejlesztett, a szöveget beszédhanggá alakítani képes Text-To-Speech technológiát arra használják, hogy egyedi és testreszabott hangot generáljanak beszédzavarral élő felhasználók számára. 

Az érintett felhasználók mostantól a "saját hangjukat" használva, nem pedig a szokásos monoton géphangon kommunikálhatnak másokkal. Ez a sikeres kezdeményezés a Xiaomi Műszaki Bizottság "Own My Voice" projektje előkészítő kutatásainak része. A cég "Tech for Good" kampánya illeszkedik a Xiaomi távlati céljaihoz, amelyek fő üzenete: az "innovatív technológia segítségével mindannyiunknak jobb élete lehet".

 

Miért indította el a Xiaomi ezt a projektet?

A Xiaomi törődik az emberekkel, és a technológiai innováció segítségével törekszik az igényeik kielégítésére. A cég felismerte, hogy az érintettek is egyedi, saját hangjukat használva szeretnének kommunikálni a mindennapok során, így az "Own My Voice" projektet előkészítő csapatnak lett egy beszédzavarral élő tagja is, hogy minél pontosabban megértsék a célcsoport szükségleteit.

 

Zhu Xi, a Xiaomi Technológiai Bizottsága Tech for Good nagykövete elmondta: „Mi is izgatottan figyeljük, mennyi értéket teremt számunkra a technológiai innováció és ezek miként segíthetik a felhasználókat abban, hogy minél inkább önazonosak lehessenek.”

 

 

Hogyan valósította meg a Xiaomi a projektet?

A legmegfelelőbb és a leginkább személyre szabott tónusok létrehozása érdekében a projektcsapat több mint 200, a cégnél dolgozó önkéntest kért föl arra, hogy kölcsönözze a hangját a kezdeményezéshez. Egy hanglenyomat-megfeleltető algoritmus segítségével vetették össze az önkéntesek által adományozott hangokat az adott felhasználó hangjának jellemzőivel. Így találták meg azt a legmegfelelőbb hangszínt, amely referencia lehet a felhasználó számára.

 

A személyre szabás érdekében – a személyiségi jogok védelmének szem előtt tartásával – a kiválasztott hangot úgy módosították, hogy abból egy új és eredeti, a befogadó hangszínéhez közelítő tónus keletkezzen. Ezután az élőbeszédhez hasonló stílusú, a szöveget beszédhanggá alakítani képes Text-to-Speech technológiát hívják segítségül a mesterségesintelligencia-modell betanításához is, hogy az így létrehozott beszédnek emberi érzelmek kifejezésére is alkalmas természetes ritmusa és intonációja legyen.

 

Az "Own My Voice" projekt a legfejlettebb algoritmusokat kombinálja a Xiaomi saját fejlesztésű beszédtechnológiájával, hogy az így létrehozott tónus különlegesnek és hitelesnek hangozzon, ezzel alapozva meg a személyre szabott beszédszintetizációt a beszédzavarral élők számára is.

 

Miért jelentős ez a projekt?

Az innováció legfontosabb elemét a Xiaomi AI Lab beszédtechnológiával foglalkozó szakértői csoportja biztosítja, akik 2017 óta 37 hangszintetizálással kapcsolatos tudományos közleményt publikáltak olyan nívós nemzetközi fórumokon, mint például az International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Az "Own My Voice" elsősorban az általuk kifejlesztett Text-To-Speech technológiára támaszkodik, és a sikerének kulcsa is ez lehet.

 

Ezzel a technológiával intonációjában, dinamikájában és sebességében a valódi emberi hanghoz hasonló szintetizált hang hozható létre, amelynek révén a mesterségesnek ható, monoton géphangot egy természetesebb tónus váltja fel. Jelenleg ez a technológia számos olyan okoskészüléken elérhető, amelyben ott van a Xiaoai, a Xiaomi MI-alapú hangasszisztense. Az "Own My Voice" projekt azt demonstrálja, hogy Text-To-Speech technológia miként válhat széles körben alkalmazhatóvá az akadálymentesítés érdekében, és hogyan javíthatja a felhasználói élményt.

 

Zhu Xi hozzátette: „Ha korán felismerjük és figyelembe vesszük a problémában érintett felhasználói csoportok igényeit, az a technológia elterjesztésének folyamatát is jelentősen lerövidítheti, azt is elősegítve, hogy a speciális igényekkel rendelkező felhasználók azonnal a részesei lehessenek a legújabb fejlesztéseknek.”

 

A Xiaomi a jövőben is szem előtt tartja majd az érintett felhasználói kör visszajelzéseit, törekedve a megoldás minél szélesebb körű hozzáférhetővé tételére. A Xiaomi célja továbbra is az, hogy elérhetővé tegye a legfejlettebb technológiát, és a műszaki innováció révén kielégítse a legkülönbözőbb igényeket.

Kulcsszavak: Xiaomi Own My Voice

Megoldás ROVAT TOVÁBBI HÍREI

Térítésmentesen tanulhatnak nyelvet a tanárok

A hétköznapi élet során egyre több olyan impulzussal találkozunk, ami idegen nyelvhez kötött. Így vannak ezzel a pedagógusok is, akiknek a kezében páratlan lehetőség van: azok a tanárok ugyanis, akik még nem beszélnek angolul vagy németül, vagy esetleg magasabb szintre emelnék a nyelvtudásukat, esetleg csak gyakorolnák a kiejtésüket, bővítenék a  szókincsüket, térítésmentes nyelvtanulási lehetőséget tudhatnak magukénak. A KRÉTA Idegennyelvi Felkészítő Modulja (IFM) ugyanis térítésmentes lehetőséget biztosít minderre a pedagógusoknak is, akik közül már több ezren használják a felületet.

2024. március 29. 13:30

Idén is a „Bajnokok" között a Schneider Electric

Zsinórban az ötödik évben kapott „Champion", vagyis „Bajnok" minősítést a Schneider Electric a Canalys kutatócég „Titans Channel Leadership Matrix" elemzésében. A vállalat az értékesítési csatornái folyamatos fejlesztése iránti elkötelezettségével, valamint a bevezetett programokkal és a partnereit támogató eszközökkel érdemelte ki az elismerést.

2024. március 29. 10:48

Fényes jövő vár idén az adatközponti szektorra

Saját átalakulási folyamaton megy keresztül az adatközpontok piaca, amely magába foglalja a legmodernebb technológiák használatát a műveletek és az erőforrások elosztásának optimalizálása, valamint a biztonsági protokollok javítása érdekében. 

2024. március 28. 19:05

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Megvannak az IAB 2023-as Legjobb szakdolgozat pályázatának nyertesei

2024. március 25. 15:50

A 2024-es év fordulópont lehet az IT munkaerőpiacon?

2024. március 20. 10:09

Nők az informatikában – Számít a nemek aránya a munkahelyen?

2024. március 12. 20:53

Szemünk előtt zajlik az e-kereskedelem mohácsi csatája

2024. március 6. 13:05