A Xiaomi saját fejlesztésű technológiával segít a beszédzavarral élő embereknek

forrás: Prím Online, 2022. május 21. 14:16

Az internetes szolgáltatásokat nyújtó, valamint IoT platformon keresztül kommunikáló okostelefonokat és egyéb intelligens eszközöket gyártó Xiaomi most rántotta le a leplet legújabb, az akadálymentesítés jegyében létrehozott, fejlett algoritmusokra és saját fejlesztésű beszédtechnológiára épülő alkalmazásáról. A Xiaomi AI Lab által kifejlesztett, a szöveget beszédhanggá alakítani képes Text-To-Speech technológiát arra használják, hogy egyedi és testreszabott hangot generáljanak beszédzavarral élő felhasználók számára. 

Az érintett felhasználók mostantól a "saját hangjukat" használva, nem pedig a szokásos monoton géphangon kommunikálhatnak másokkal. Ez a sikeres kezdeményezés a Xiaomi Műszaki Bizottság "Own My Voice" projektje előkészítő kutatásainak része. A cég "Tech for Good" kampánya illeszkedik a Xiaomi távlati céljaihoz, amelyek fő üzenete: az "innovatív technológia segítségével mindannyiunknak jobb élete lehet".

 

Miért indította el a Xiaomi ezt a projektet?

A Xiaomi törődik az emberekkel, és a technológiai innováció segítségével törekszik az igényeik kielégítésére. A cég felismerte, hogy az érintettek is egyedi, saját hangjukat használva szeretnének kommunikálni a mindennapok során, így az "Own My Voice" projektet előkészítő csapatnak lett egy beszédzavarral élő tagja is, hogy minél pontosabban megértsék a célcsoport szükségleteit.

 

Zhu Xi, a Xiaomi Technológiai Bizottsága Tech for Good nagykövete elmondta: „Mi is izgatottan figyeljük, mennyi értéket teremt számunkra a technológiai innováció és ezek miként segíthetik a felhasználókat abban, hogy minél inkább önazonosak lehessenek.”

 

 

Hogyan valósította meg a Xiaomi a projektet?

A legmegfelelőbb és a leginkább személyre szabott tónusok létrehozása érdekében a projektcsapat több mint 200, a cégnél dolgozó önkéntest kért föl arra, hogy kölcsönözze a hangját a kezdeményezéshez. Egy hanglenyomat-megfeleltető algoritmus segítségével vetették össze az önkéntesek által adományozott hangokat az adott felhasználó hangjának jellemzőivel. Így találták meg azt a legmegfelelőbb hangszínt, amely referencia lehet a felhasználó számára.

 

A személyre szabás érdekében – a személyiségi jogok védelmének szem előtt tartásával – a kiválasztott hangot úgy módosították, hogy abból egy új és eredeti, a befogadó hangszínéhez közelítő tónus keletkezzen. Ezután az élőbeszédhez hasonló stílusú, a szöveget beszédhanggá alakítani képes Text-to-Speech technológiát hívják segítségül a mesterségesintelligencia-modell betanításához is, hogy az így létrehozott beszédnek emberi érzelmek kifejezésére is alkalmas természetes ritmusa és intonációja legyen.

 

Az "Own My Voice" projekt a legfejlettebb algoritmusokat kombinálja a Xiaomi saját fejlesztésű beszédtechnológiájával, hogy az így létrehozott tónus különlegesnek és hitelesnek hangozzon, ezzel alapozva meg a személyre szabott beszédszintetizációt a beszédzavarral élők számára is.

 

Miért jelentős ez a projekt?

Az innováció legfontosabb elemét a Xiaomi AI Lab beszédtechnológiával foglalkozó szakértői csoportja biztosítja, akik 2017 óta 37 hangszintetizálással kapcsolatos tudományos közleményt publikáltak olyan nívós nemzetközi fórumokon, mint például az International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Az "Own My Voice" elsősorban az általuk kifejlesztett Text-To-Speech technológiára támaszkodik, és a sikerének kulcsa is ez lehet.

 

Ezzel a technológiával intonációjában, dinamikájában és sebességében a valódi emberi hanghoz hasonló szintetizált hang hozható létre, amelynek révén a mesterségesnek ható, monoton géphangot egy természetesebb tónus váltja fel. Jelenleg ez a technológia számos olyan okoskészüléken elérhető, amelyben ott van a Xiaoai, a Xiaomi MI-alapú hangasszisztense. Az "Own My Voice" projekt azt demonstrálja, hogy Text-To-Speech technológia miként válhat széles körben alkalmazhatóvá az akadálymentesítés érdekében, és hogyan javíthatja a felhasználói élményt.

 

Zhu Xi hozzátette: „Ha korán felismerjük és figyelembe vesszük a problémában érintett felhasználói csoportok igényeit, az a technológia elterjesztésének folyamatát is jelentősen lerövidítheti, azt is elősegítve, hogy a speciális igényekkel rendelkező felhasználók azonnal a részesei lehessenek a legújabb fejlesztéseknek.”

 

A Xiaomi a jövőben is szem előtt tartja majd az érintett felhasználói kör visszajelzéseit, törekedve a megoldás minél szélesebb körű hozzáférhetővé tételére. A Xiaomi célja továbbra is az, hogy elérhetővé tegye a legfejlettebb technológiát, és a műszaki innováció révén kielégítse a legkülönbözőbb igényeket.

Kulcsszavak: Xiaomi Own My Voice

Megoldás ROVAT TOVÁBBI HÍREI

TECHXPO 2024: Már közel 360 ezren töltötték le a Digitális Állampolgár mobilalkalmazást

Megnyitotta kapuit a TECHXPO 2024, Közép-Európa legnagyobb tech csúcstalálkozója Budapesten. A négynapos rendezvény fajsúlyos nemzetközi konferenciaprogrammal indult, melynek nyitóelőadását Rogán Antal, a Miniszterelnöki Kabinetirodát vezető miniszter tartotta a Digitális Állampolgárság témájában. Előadott még a konferencián többek között Gerd Leonhard, a világ TOP 10 jövőkutatóinak egyike, Hong-Eng Koh, a Huawei Technologies globális közszolgálati iparági vezető kutatója, illetve Bojár Gábor, a Graphisoft alapítója is.

2024. november 22. 19:55

A Tenstorrenttel közösen fejleszti mesterségesintelligencia-megoldásait az LG

Az LG Electronics (LG) és a Tenstorrent bejelentette, hogy kibővítették együttműködésüket, amelynek célja a globális piacra szánt SoC-k, (System-on-Chips, azaz egylapkás rendszerek) fejlesztése. A partnerség révén az LG célja, hogy tovább bővítse a termékeihez és szolgáltatásaihoz használt AI-chipek tervezésében és fejlesztésében rejlő lehetőségeket. A vállalat elkötelezett az AI-alapú innovációk előmozdítása mellett, különösen a háztartási készülékek, az okosotthon-megoldások, valamint a jövőbeli mobilitási és kereskedelmi fejlesztésének területén.

2024. november 22. 18:14

Franciaországban már a mesterséges intelligencia deríti fel a villanyóraleolvasási hibákat

Az ENEDIS, Franciaország villamosenergia-hálózati elosztója az SAP Signavio Process Mining és az SAP Business AI megoldásait választotta annak érdekében, hogy automatizálja a mérőleolvasások során észlelt anomáliák megoldását, és megbízható számlázást garantáljon mintegy 600 000 üzleti ügyfelének.

2024. november 22. 14:58

A Vezetők között a Schneider Electric az e-autók töltését menedzselő megoldások piacán

A Vezető megoldásszállítók közé sorolta az IDC kutatócég „MarketScape: Worldwide Electric Vehicle Charging Management Solutions 2024 Vendor Assessment” elemzése a Schneider Electricet az elektromos járművek töltését menedzselő rendszerek piacán. A vállalat megoldásai átfogó töltőinfrastruktúra-kezelést biztosítanak a skálázhatóságra, a megbízhatóságra, a biztonságra és a felhasználói élményre összpontosítva.

2024. november 22. 13:17

Rébuszok helyett kézzelfogható megoldások a NIS2 fejtörőhöz

Nagy érdeklődés övezte a Gábor Dénes Egyetem NIS2 konferenciáját. Ennek egyik oka a téma aktualitása, hiszen a kiberbiztonság szavatolása kötelező törvényi előírás az érintett vállalatok részére. A másik ok, hogy kevés az egész folyamatot átfogó és bemutató esemény, amely nemcsak a NIS2 irányelvben meghatározott jogszabályi előírásokat mutatja be és értelmezi, hanem kézzelfogható, gyakorlati megoldásokat is kínál a vállalatok részére. 

2024. november 22. 11:39

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Idén is keresi a digitális szakma női példaképeit az IVSZ és a WiTH

2024. november 22. 16:40

Huszadik alkalommal adták át a Hégető Honorka-díjakat

2024. november 21. 16:58

Hosszabbít ’Az Év Honlapja’ pályázat!

2024. november 19. 09:54

Törj be a digitális élvonalba: Nevezz ’Az Év Honlapja’ pályázatra!

2024. november 14. 16:36