Szóból ért nemcsak az ember, már a gép is (2. rész)

MTI Sajtóadatbank, 2012. május 6. 08:42

A hangfelismerő szoftver úgy működik, hogy a beszédet olyan processzorokhoz továbbítja, amelyek a kimondott szavakat hanghullámokra bontják le, és speciális algoritmusokkal azonosítják a hangokból összeállítható legvalószínűbb szót. A rendszer rögzíti és tárolja a beszédet, úgyhogy képes tanítani magát, hogy az idő múlásával egyre pontosabbá váljon.

A Nuance által adott biztosítékok ellenére a hangfelismerő szoftver elegendő kockázatot jelent az emberek magánszférájára számára ahhoz, hogy a használatának szabályozásáért felelősök odafigyeljenek rá. "Ahogy az arcfelismerés alkalmazási lehetőségei miatt aggódunk, úgy más biometrikus azonosításokról, köztük a hangfelismerésről is az a véleményünk, hogy problémákat vet fel" - szögezte le David C. Vladeck, a Szövetségi Kereskedelmi Hivatal (FTC) Fogyasztóvédelmi Irodájának vezetője általában a hangtechnológiáról, nem kifejezetten a Nuance által alkalmazott megoldásról.
   
A felhasználók gyorsabban jutnak célba
   

    "Dragon Go! - szól bele iPhone-jába Sejnoha. - Három személyre akarok helyet foglalni holnap estére a Craigie-ben, a Mainen."
    A Dragon Go a Nuance saját virtuális asszisztense, az az alkalmazás, amelyet bevezetése óta több milliószor töltöttek le.
     A Siritől eltérően azonban a Dragon Go nem válaszol. Sejnoha azt közölte vele, hogy helyet akar foglalni a massachusettsi Cambridge egyik éttermébe: az alkalmazás azonnal felvette a kapcsolatot az OpenTable-lel, és megjelenítette a lehetőségeket.
    A legegyszerűbb keresések esetén a Dragon Go rendszerint megkerüli a keresőmotorokat, és egyenesen olyan vállalatok internetes oldalára irányítja a felhasználókat, mint a Nuance partnerei, az Emazon, az Expedia és az OpenTable. Ha ott nem találják meg azt, amit keresnek, akkor a Dragon Go felajánlja a hagyományos internetes keresés lehetőségét.
    A felhasználók így kevesebb lépésben, gyorsabban jutnak célhoz. Sok esetben, ha például éttermi helyfoglalásról vagy vásárlásról van szó, a Nuance mérsékelt díjat számít fel a partneroldalaknak. Az alkalmazás kihívást jelent a Google-nak és a Microsoftnak, amelyeknek van saját hangtermékük - a Google Voice Actions és a Microsoft Tellme -, valamint a keresőmotoroknak is.
    Christopher Katsaros, a Google szóvivője nem volt hajlandó nyilatkozni erről a kérdésről. A cég nemrég korszerűsítette az Android telefonoknál használatos hangutasítási rendszert, a Google Voice Actionst: képessé tette arra, hogy az emberi beszédet folyamatosan írott szöveggé alakítsa át, és ezzel gyorsabbá és egyszerűbbé vált a szöveges üzenetek diktálása és küldése, a Google hangos keresése vagy útbaigazítások kérése.
    Lezli Goheen, a Microfost szóvivője elmondta, hogy cége a fogyasztók elvárásának megfelelően többféle módon is könnyített az információk megszerzésén. A minden Windows-termékben szereplő Tellme programon kívül, amely lehetővé teszi üzenetek diktálását és alkalmazások hangvezérlését, bevezették a Bing Voice Search programot is a keresések beszéddel történő irányítására.
   
Illúziókeltő, de könnyű a használata

   
    A US Airways törzsutasprogramjának azokat a résztvevőit, akik regisztrálták mobiltelefonjukat, név szerint üdvözli a Wally, a Nuance által a légitársaságnak kifejlesztett interaktív hangrendszer.
    A Wallyt tavaly nyáron vezették be annak az átalakításnak a részeként, amelynek során a US Airway telefonos ügyfélszolgálatát külföldről visszatelepítik az Egyesült Államokba. A rendszer képes például megmondani a törzsutasoknak, hogy milyen helyre szól a jegyük, egyszersmind jelenteni, ha magasabb szintre kerültek a programban. Az emberi beszédet írott szöveggé alakítja át, úgyhogy ha egy ügyfél úgy dönt, hogy élő személlyel kíván tovább tárgyalni, az eredeti kérdést nem kell megismételnie.
    A hangrendszer - amelyhez Wally Wingert, a Jay Leno vezette népszerű televíziós showműsor bemondója kölcsönözte a hangját - nemcsak azoknak a számát csökkentette, akik ragaszkodnak az élő munkatárshoz, hanem az ügyfélhívások átlagos hosszát is. Kerry Hester, a légitársaság alelnöke szerint ha nincs a rendszer, több száz új ügyfélszolgálati munkatársat kellett volna felvenniük.
    A Wally - amely nem árulja el, hogy automatizált rendszer - annyira élőnek tűnik, hogy sok ügyfél "Köszönöm"-mel köszön el tőle, mielőtt lerakja a kagylót.
    Ez az anonimitás azonban nem mindenkinek tetszik. Sherry Turkle, az MIT professzora szerint ahogy a hangfelismerő rendszerek kifinomultabbá válnak, megteremtik annak az illúzióját, hogy nem gépekkel, hanem más emberekkel kommunikálunk. Szerinte hosszú távon a rendszerek illúziókeltő volta és könnyű használata miatt háttérbe szorulnak a lassúbb, rendezetlenebb, valódi emberi kapcsolatokat. Ha emlékeztetik a felhasználókat, hogy egy géppel beszélnek, akkor talán jobban tudatosodik bennük, hogy mennyire felszínes a kapcsolat.
    "Kultúránkat érintő döntést kell hoznunk. El kell határoznunk, megmondjuk-e az embereknek, hogy géppel beszélnek vagy sem" - húzta alá a professzor.

Kulcsszavak: tudomány hangfelismerés

E-világ ROVAT TOVÁBBI HÍREI

Hozzuk ki a legtöbbet okostelefonunk hangzásából!

A hétköznapok elengedhetetlen részeként okostelefonunk egy kifejezetten kényelmes eszköz, amit számos dologra használhatunk. Akár csak telefonálunk, akár filmet vagy sorozatot nézünk, esetleg megbeszélésen veszünk részt vagy zenét hallgatunk, fontos, hogy a legjobb minőségű hangot kapjuk. A HONOR friss tippei ebben segítenek. 

2024. május 15. 16:10

A világ 600 legjobb fiatal egyeteme közé került a Széchenyi-egyetem

Az 501–600. helyen szerepel a győri Széchenyi István Egyetem azon a ranglistán, amelyet a Times Higher Education (THE) május 14-én tett közzé a világ legjobb fiatal egyetemeiről. Az intézmény újabb sikere mögött erősödő kutatási teljesítménye, valamint szoros ipari és nemzetközi kapcsolatai állnak.

2024. május 15. 14:33

A FŐTAXI a Formula 1 Magyar Nagydíj hivatalos szállítópartnere

2024-ben immár 39. alkalommal rendezik meg a Formula 1 Magyar Nagydíjat. A Hungaroring Sport Zrt-vel kötött megállapodás értelmében a július 21-én tartandó viadal hivatalos és kizárólagos személyszállító partnere a legnagyobb múltú hazai taxitársaság, a FŐTAXI lesz. A megállapodás célja, hogy a látogatók és a partnerek egyszerűen és biztonságosan jussanak el a Hungaroringre és haza. 

2024. május 15. 12:59

A HUAWEI Pura 70 Ultra a DXOMARK történetének legmagasabb pontszámmal rendelkező kamerás okostelefonja

A HUAWEI Pura 70 Ultra lett a legjobb okostelefon-fényképező a DXOMARK független tesztlabor szerint.  A Huawei nemrégiben mutatta be legújabb zászlóshajó-készülékét, amely rögtön átvette a vezetést a szaklabor okostelefon-kamera rangsorában. A Pura 70 Ultra hátlapján egy 50 megapixeles Ultra Lighting főkamera kapott helyet változtatható rekeszértékkel és optikai képstabilizátorral, továbbá egy 40 megapixeles ultraszéles látószögű kamera és egy 50 megapixeles Ultra Lighting makró telefotó-kamera, elöl pedig egy 13 megapixeles szelfikamera.

2024. május 15. 11:30

Protechtor Future Summit: Az AI exponenciálisan fejlődik, amire az emberi agy egyszerűen nincs felkészülve

Két borzasztóan aktuális és forró témáról beszélgettek neves és elismert hazai gondolkodók a Protechtor Future Summit üzleti és tech vezetőknek szóló inspirációs eseménysorozat tavaszi alkalmán. A mások mellett Király Júlia, Dr. Oszkó Péter vagy Dr. Tilesch György MI-szakértő nevével fémjelzett panelbeszélgetéseken a szakértők egyrészt a mesterséges intelligencia társadalmi igazságoságra és kultúrára gyakorolt hatását, másrészt az örök élet és a biológiai óra visszafordíthatóságának kérdését vizsgálták.

2024. május 15. 09:57

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Az IKEA Kreativ megérkezett Magyarországra

2024. május 15. 17:52

Továbbra is Christian Klein az SAP első embere

2024. május 7. 13:17

Magyar siker: Nemzetközi díjat nyert a TIME magazintól a nyelvtanuló-applikáció

2024. május 3. 19:59

Megvannak 2024 legvonzóbb hazai munkaadói

2024. április 29. 11:38