Szóból ért nemcsak az ember, már a gép is (2. rész)

MTI Sajtóadatbank, 2012. május 6. 08:42

A hangfelismerő szoftver úgy működik, hogy a beszédet olyan processzorokhoz továbbítja, amelyek a kimondott szavakat hanghullámokra bontják le, és speciális algoritmusokkal azonosítják a hangokból összeállítható legvalószínűbb szót. A rendszer rögzíti és tárolja a beszédet, úgyhogy képes tanítani magát, hogy az idő múlásával egyre pontosabbá váljon.

A Nuance által adott biztosítékok ellenére a hangfelismerő szoftver elegendő kockázatot jelent az emberek magánszférájára számára ahhoz, hogy a használatának szabályozásáért felelősök odafigyeljenek rá. "Ahogy az arcfelismerés alkalmazási lehetőségei miatt aggódunk, úgy más biometrikus azonosításokról, köztük a hangfelismerésről is az a véleményünk, hogy problémákat vet fel" - szögezte le David C. Vladeck, a Szövetségi Kereskedelmi Hivatal (FTC) Fogyasztóvédelmi Irodájának vezetője általában a hangtechnológiáról, nem kifejezetten a Nuance által alkalmazott megoldásról.
   
A felhasználók gyorsabban jutnak célba
   

    "Dragon Go! - szól bele iPhone-jába Sejnoha. - Három személyre akarok helyet foglalni holnap estére a Craigie-ben, a Mainen."
    A Dragon Go a Nuance saját virtuális asszisztense, az az alkalmazás, amelyet bevezetése óta több milliószor töltöttek le.
     A Siritől eltérően azonban a Dragon Go nem válaszol. Sejnoha azt közölte vele, hogy helyet akar foglalni a massachusettsi Cambridge egyik éttermébe: az alkalmazás azonnal felvette a kapcsolatot az OpenTable-lel, és megjelenítette a lehetőségeket.
    A legegyszerűbb keresések esetén a Dragon Go rendszerint megkerüli a keresőmotorokat, és egyenesen olyan vállalatok internetes oldalára irányítja a felhasználókat, mint a Nuance partnerei, az Emazon, az Expedia és az OpenTable. Ha ott nem találják meg azt, amit keresnek, akkor a Dragon Go felajánlja a hagyományos internetes keresés lehetőségét.
    A felhasználók így kevesebb lépésben, gyorsabban jutnak célhoz. Sok esetben, ha például éttermi helyfoglalásról vagy vásárlásról van szó, a Nuance mérsékelt díjat számít fel a partneroldalaknak. Az alkalmazás kihívást jelent a Google-nak és a Microsoftnak, amelyeknek van saját hangtermékük - a Google Voice Actions és a Microsoft Tellme -, valamint a keresőmotoroknak is.
    Christopher Katsaros, a Google szóvivője nem volt hajlandó nyilatkozni erről a kérdésről. A cég nemrég korszerűsítette az Android telefonoknál használatos hangutasítási rendszert, a Google Voice Actionst: képessé tette arra, hogy az emberi beszédet folyamatosan írott szöveggé alakítsa át, és ezzel gyorsabbá és egyszerűbbé vált a szöveges üzenetek diktálása és küldése, a Google hangos keresése vagy útbaigazítások kérése.
    Lezli Goheen, a Microfost szóvivője elmondta, hogy cége a fogyasztók elvárásának megfelelően többféle módon is könnyített az információk megszerzésén. A minden Windows-termékben szereplő Tellme programon kívül, amely lehetővé teszi üzenetek diktálását és alkalmazások hangvezérlését, bevezették a Bing Voice Search programot is a keresések beszéddel történő irányítására.
   
Illúziókeltő, de könnyű a használata

   
    A US Airways törzsutasprogramjának azokat a résztvevőit, akik regisztrálták mobiltelefonjukat, név szerint üdvözli a Wally, a Nuance által a légitársaságnak kifejlesztett interaktív hangrendszer.
    A Wallyt tavaly nyáron vezették be annak az átalakításnak a részeként, amelynek során a US Airway telefonos ügyfélszolgálatát külföldről visszatelepítik az Egyesült Államokba. A rendszer képes például megmondani a törzsutasoknak, hogy milyen helyre szól a jegyük, egyszersmind jelenteni, ha magasabb szintre kerültek a programban. Az emberi beszédet írott szöveggé alakítja át, úgyhogy ha egy ügyfél úgy dönt, hogy élő személlyel kíván tovább tárgyalni, az eredeti kérdést nem kell megismételnie.
    A hangrendszer - amelyhez Wally Wingert, a Jay Leno vezette népszerű televíziós showműsor bemondója kölcsönözte a hangját - nemcsak azoknak a számát csökkentette, akik ragaszkodnak az élő munkatárshoz, hanem az ügyfélhívások átlagos hosszát is. Kerry Hester, a légitársaság alelnöke szerint ha nincs a rendszer, több száz új ügyfélszolgálati munkatársat kellett volna felvenniük.
    A Wally - amely nem árulja el, hogy automatizált rendszer - annyira élőnek tűnik, hogy sok ügyfél "Köszönöm"-mel köszön el tőle, mielőtt lerakja a kagylót.
    Ez az anonimitás azonban nem mindenkinek tetszik. Sherry Turkle, az MIT professzora szerint ahogy a hangfelismerő rendszerek kifinomultabbá válnak, megteremtik annak az illúzióját, hogy nem gépekkel, hanem más emberekkel kommunikálunk. Szerinte hosszú távon a rendszerek illúziókeltő volta és könnyű használata miatt háttérbe szorulnak a lassúbb, rendezetlenebb, valódi emberi kapcsolatokat. Ha emlékeztetik a felhasználókat, hogy egy géppel beszélnek, akkor talán jobban tudatosodik bennük, hogy mennyire felszínes a kapcsolat.
    "Kultúránkat érintő döntést kell hoznunk. El kell határoznunk, megmondjuk-e az embereknek, hogy géppel beszélnek vagy sem" - húzta alá a professzor.

Kulcsszavak: tudomány hangfelismerés

E-világ ROVAT TOVÁBBI HÍREI

Jövőbe mutató adatvizualizációs megoldások az SAP és az IFUA Horváth versenyén

Kihirdették az SAP Hungary és az IFUA Horváth adatvizualizációs versenyének nyerteseit. Ötven csapat mérte össze tudását az egyetemi és vállalati szférából. A versenyzőknek az SAP új döntéstámogató eszköze, az SAP Analytics Cloud (SAC) segítségével kellett a Központi Statisztikai Hivatal (KSH) által biztosított adatokból látványos és lényeges összefüggéseket bemutató adatelemzéseket készíteniük és prezentálniuk. 

2024. április 17. 19:55

Facility managementben erősít az ICON

Három kiemelkedő épülettel, két irodaházzal és egy logisztikai ingatlannal bővült az ICON Real Estate Management ingatlanüzemeltetési portfoliója. A BEM Irodaház, a D2 Szabadkikötő, és az ELTE egyik megújult ingatlanja nem csupán az építészeti megoldásaik tekintetében példaértékűek, de a fenntarthatóság és az energiahatékonyság terén is úttörő megoldásokat alkalmaznak.

2024. április 17. 18:09

Új korszak az elektromobilitásban

A Maserati „Folgore Day” névre keresztelt nagyszabású eseményén mutatta be első 100%-ban elektromos kabrióját, a GranCabrio Folgore-t, melyet az úgynevezett „IT TURNS YOU ON” kampánnyal népszerűsítenek, az olasz művész, Damiano David szerepelésével. A modenai székhelyű márka fennállásának 110. évfordulóján a szigonyos márka ismertette ambiciózus céljait az elektromos átállás terén, valamint lerántotta a leplet TRIDENTE elektromos motorcsónakjáról is. 

2024. április 17. 16:28

Mesterséges intelligenciával készítik össze az Unilever B2C webshopjának rendeléseit

Közel 800 cikkszámot kezel, illetve mesterséges intelligenciával ellátott eszközökkel végzi a komissiózási feladatokat a Waberer’s Csoport leányvállalata, a WSZL az Unilever Magyarország Unishop elnevezésű B2C webshopjában. Az új megbízásnak köszönhetően a Waberer’s eddigi tevékenysége bővült és egy 14.500 négyzetméteres raktári terület kezelése mellett immár az Unishop raktárlogisztikai és fullfilment kiszolgálását is végzi. 

2024. április 17. 14:50

Nagy rekesznyílású és nagy látószögű zoomos Sony objektív

A Sony örömmel jelenti be a full-frame α (Alpha) E-bajonettes objektívek legújabb tagját. Az FE 16-25mm F2.8 G egy nagy rekesznyílású, nagylátószögű zoomobjektív, amely a 16 mm és 25 mm közötti teljes zoomtartományban F2.8 maximális rekesznyílást tart fenn, és kompakt, könnyű kialakításának köszönhetően a kiváló képminőséget nagyszerű hordozhatósággal kombinálja.

2024. április 17. 13:09

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Itt a világ első, Swarovski kristályba ágyazott autós kijelzője

2024. április 10. 14:55

A csevegőprogramokat vizsgálta az NMHH

2024. április 2. 13:14

Megvannak az IAB 2023-as Legjobb szakdolgozat pályázatának nyertesei

2024. március 25. 15:50

A 2024-es év fordulópont lehet az IT munkaerőpiacon?

2024. március 20. 10:09