Szóból ért nemcsak az ember, már a gép is (2. rész)
A hangfelismerő szoftver úgy működik, hogy a beszédet olyan processzorokhoz továbbítja, amelyek a kimondott szavakat hanghullámokra bontják le, és speciális algoritmusokkal azonosítják a hangokból összeállítható legvalószínűbb szót. A rendszer rögzíti és tárolja a beszédet, úgyhogy képes tanítani magát, hogy az idő múlásával egyre pontosabbá váljon.
A Nuance által adott biztosítékok ellenére a hangfelismerő szoftver elegendő kockázatot jelent az emberek magánszférájára számára ahhoz, hogy a használatának szabályozásáért felelősök odafigyeljenek rá. "Ahogy az arcfelismerés alkalmazási lehetőségei miatt aggódunk, úgy más biometrikus azonosításokról, köztük a hangfelismerésről is az a véleményünk, hogy problémákat vet fel" - szögezte le David C. Vladeck, a Szövetségi Kereskedelmi Hivatal (FTC) Fogyasztóvédelmi Irodájának vezetője általában a hangtechnológiáról, nem kifejezetten a Nuance által alkalmazott megoldásról.
A felhasználók gyorsabban jutnak célba
"Dragon Go! - szól bele iPhone-jába Sejnoha. - Három személyre akarok helyet foglalni holnap estére a Craigie-ben, a Mainen."
A Dragon Go a Nuance saját virtuális asszisztense, az az alkalmazás, amelyet bevezetése óta több milliószor töltöttek le.
A Siritől eltérően azonban a Dragon Go nem válaszol. Sejnoha azt közölte vele, hogy helyet akar foglalni a massachusettsi Cambridge egyik éttermébe: az alkalmazás azonnal felvette a kapcsolatot az OpenTable-lel, és megjelenítette a lehetőségeket.
A legegyszerűbb keresések esetén a Dragon Go rendszerint megkerüli a keresőmotorokat, és egyenesen olyan vállalatok internetes oldalára irányítja a felhasználókat, mint a Nuance partnerei, az Emazon, az Expedia és az OpenTable. Ha ott nem találják meg azt, amit keresnek, akkor a Dragon Go felajánlja a hagyományos internetes keresés lehetőségét.
A felhasználók így kevesebb lépésben, gyorsabban jutnak célhoz. Sok esetben, ha például éttermi helyfoglalásról vagy vásárlásról van szó, a Nuance mérsékelt díjat számít fel a partneroldalaknak. Az alkalmazás kihívást jelent a Google-nak és a Microsoftnak, amelyeknek van saját hangtermékük - a Google Voice Actions és a Microsoft Tellme -, valamint a keresőmotoroknak is.
Christopher Katsaros, a Google szóvivője nem volt hajlandó nyilatkozni erről a kérdésről. A cég nemrég korszerűsítette az Android telefonoknál használatos hangutasítási rendszert, a Google Voice Actionst: képessé tette arra, hogy az emberi beszédet folyamatosan írott szöveggé alakítsa át, és ezzel gyorsabbá és egyszerűbbé vált a szöveges üzenetek diktálása és küldése, a Google hangos keresése vagy útbaigazítások kérése.
Lezli Goheen, a Microfost szóvivője elmondta, hogy cége a fogyasztók elvárásának megfelelően többféle módon is könnyített az információk megszerzésén. A minden Windows-termékben szereplő Tellme programon kívül, amely lehetővé teszi üzenetek diktálását és alkalmazások hangvezérlését, bevezették a Bing Voice Search programot is a keresések beszéddel történő irányítására.
Illúziókeltő, de könnyű a használata
A US Airways törzsutasprogramjának azokat a résztvevőit, akik regisztrálták mobiltelefonjukat, név szerint üdvözli a Wally, a Nuance által a légitársaságnak kifejlesztett interaktív hangrendszer.
A Wallyt tavaly nyáron vezették be annak az átalakításnak a részeként, amelynek során a US Airway telefonos ügyfélszolgálatát külföldről visszatelepítik az Egyesült Államokba. A rendszer képes például megmondani a törzsutasoknak, hogy milyen helyre szól a jegyük, egyszersmind jelenteni, ha magasabb szintre kerültek a programban. Az emberi beszédet írott szöveggé alakítja át, úgyhogy ha egy ügyfél úgy dönt, hogy élő személlyel kíván tovább tárgyalni, az eredeti kérdést nem kell megismételnie.
A hangrendszer - amelyhez Wally Wingert, a Jay Leno vezette népszerű televíziós showműsor bemondója kölcsönözte a hangját - nemcsak azoknak a számát csökkentette, akik ragaszkodnak az élő munkatárshoz, hanem az ügyfélhívások átlagos hosszát is. Kerry Hester, a légitársaság alelnöke szerint ha nincs a rendszer, több száz új ügyfélszolgálati munkatársat kellett volna felvenniük.
A Wally - amely nem árulja el, hogy automatizált rendszer - annyira élőnek tűnik, hogy sok ügyfél "Köszönöm"-mel köszön el tőle, mielőtt lerakja a kagylót.
Ez az anonimitás azonban nem mindenkinek tetszik. Sherry Turkle, az MIT professzora szerint ahogy a hangfelismerő rendszerek kifinomultabbá válnak, megteremtik annak az illúzióját, hogy nem gépekkel, hanem más emberekkel kommunikálunk. Szerinte hosszú távon a rendszerek illúziókeltő volta és könnyű használata miatt háttérbe szorulnak a lassúbb, rendezetlenebb, valódi emberi kapcsolatokat. Ha emlékeztetik a felhasználókat, hogy egy géppel beszélnek, akkor talán jobban tudatosodik bennük, hogy mennyire felszínes a kapcsolat.
"Kultúránkat érintő döntést kell hoznunk. El kell határoznunk, megmondjuk-e az embereknek, hogy géppel beszélnek vagy sem" - húzta alá a professzor.
Kapcsolódó cikkek
- Szóból ért nemcsak az ember, már a gép is (1. rész)
- Debreceniek nyerték az Infomaratont
- A világ legnagyobb felbontású kamerájával működik a távcsőóriás
- Felderítő robotok versenyeznek Pécsen
- Egészségügyi kutatási projektek a Xerox-nál
- Videó, de nem játék - Emberveszteség nélkül kipróbálni rossz helyzeteket (2. rész)
- Videó, de nem játék - Emberveszteség nélkül kipróbálni rossz helyzeteket (1. rész)
- A Sztakipédia a World Wide Web 2012 konferencián
- Új navigációs technikával segítik az időseket a vezetésben
- Könyvfesztivál - Blog, hálózat, élet és filozófia: Csermely Péter könyvbemutatója
E-világ ROVAT TOVÁBBI HÍREI
A Sony bejelenti második generációs zászlóshajóját, az Alpha 1 II fényképezőgépet
A Sony bemutatja a második generációs Alpha 1 II zászlóshajóját, egy új full frame, tükör nélküli, cserélhető objektíves fényképezőgépet, amelyet a Sony legmodernebb AI feldolgozóegységével működik. A fényképezőgép körülbelül 50.1 megapixel (MP) effektív felbontású érzékelővel rendelkezik, akár 30 fps sebességgel, AF/AE-követéssel képes elsötétedésmentes sorozatfelvételt készíteni, torzításmentes zárral van ellátva, és továbbfejlesztette a képtisztaságot a közép- és magastónusok érzékenységénél.
Az új Sony objektív nagy felbontást, gyönyörű bokeh-t és fejlett autofókuszt kínál
A Sony bejelentésével új utat tör: az FE 28-70mm F2 GM prémium E-bajonettes objektív a teljes zoomtartományban nagy, F2-es rekesznyílással büszkélkedhet, így gyönyörű bokeh-t, nagy felbontást és egyedülálló autofókuszt biztosít állóképekhez és videófelvételekhez, nem beszélve a prímobjektívek minőségével vetekedő élességről és kontrasztról.
A digitális bankolás jövője: személyre szabott ügyfélélmény és új generációs technológiák
A Deloitte legfrissebb, Digital Banking Maturity 2024 kutatásának eredményeiből kiderül, hogy a COVID-19 járvány idején elindult digitalizációs folyamatok nemhogy nem lassultak, hanem új lendületet kaptak a bankszektorban az elmúlt évek során, alkalmazkodva az ügyfelek folyamatosan bővülő igényeihez. A fejlesztések fókuszában a funkciók mennyisége helyett, egyre inkább a személyre szabottság, az ügyfélélmény fokozása és a költséghatékonyság kapott hangsúlyt. Emellett a korábban elhanyagolt területek, például a digitális jelzálog is előtérbe kerültek.
OMV: 2025 végéig országszerte elérhető lesz az ultragyors töltőhálózat
Országszerte 15 helyszínen már igénybe vehetőek az OMV új gyorstöltői. A társaság még idén megduplázza ultragyors töltéssel üzemelő töltőállomásai számát, 2025 végéig pedig közel 50 helyszínen összesen 80 villámtöltő pont működik majd az országban. A töltők legalább 100 kW teljesítmény leadására képesek, ami később több helyszínen akár a 200 kW-ot is elérheti, a hálózati kapacitás függvényében. Az OMV saját applikációt is fejlesztett a töltőkhöz, amiben most különleges akciókkal várja az autósokat.
Nemzetközi szintre lép a karbonlábnyom-csökkentő magyar startup
Balogh Petya és az általa fémjelzett STRT Holding Nyrt., valamint két másik befektető látott fantáziát a digitális marketing tevékenységek, így a weboldalak és e-mail kampányok karbonlábnyomának csökkentésére specializálódott Carbon.Crane-ben. A világszinten naponta küldött 350 milliárd e-mail* és a 200 millió aktívan üzemelő weboldal** – a háttérben dolgozó szerverparkok miatt – egyre nagyobb, ráadásul egyre növekvő részét teszi ki a globális karbonkibocsátásnak, erre dolgozott ki egyedi megoldásokat a 100%-ban magyar tulajdonú és hazai alapítású startup. Az egyedi és innovatív szolgáltatásokat nemzetközi szinten is értékeli a szakma, amit legutóbb a MediaSpace Global Changemakers' Awards 2024 díjával ismert el.