Google GAudi online beszédfelismerő

Milkovits Gábor, 2008. szeptember 17. 21:11

A Google Labs nyilvános kipróbálás céljából beindította GAudi internetes beszédfelismerő alkalmazásának béta tesztváltozatát; az online program az elektronikus beszédhangot írott szöveggé alakítja.

A teljes nevén „Google Audio Indexing (kb. „Google hang-indexelő”)” megoldás egyelőre csak a YouTube videómegosztón található amerikai elnökválasztási beszédeken tesztelhető, a Google azonban a hivatalos közlemény szerint egyértelműen hosszú távú célokat szem előtt tartva dolgozik a fejlesztésen. A közlemény alapján a videókban szereplő beszédek átírása csak az első lépés; a jövőben egy olyan egységes platformot szeretnének kialakítani a GAudi-ból, amely alkalmas a „hangos internetes tartalmak” átfogó kezelésére. Ez például azt is jelenti, hogy a megoldás a későbbiekben a Google kereső részeként működhet, akárcsak a mostani képkereső. A keresés a mostani tesztverziónak is az egyik legfigyelemreméltóbb eleme: a keresősorba egy szót beírva a szoftver felsorolja az összes videót, amelyben az adott szó elhangzik, majd egy bizonyos mozgóképet kiválasztva leírva megjelennek azok a szövegrészletek is, ahol az a bizonyos szó szerepel.

Az alkalmazást már kipróbált felhasználók internetes beszámolói alapján a GAudi egyelőre korántsem tökéletes; a szoftver könnyen összekeveri a hasonló hangzású szavakat és beszédrészleteket, ráadásul a beszélők artikulációja alapvetően befolyásolja az átírás szöveghűségét. A megoldás ennek ellenére jól demonstrálja, hogy a beszédfelismerő technológia micsoda fejlődésen ment keresztül az utóbbi időben. A GAudi teljes egészében a Google saját fejlesztése: az angolul tudók kipróbálhatják a praktikus webes alkalmazást a http://labs.google.com/gaudi címen.

Kulcsszavak: Google beszédfelismerés

Szoftver ROVAT TOVÁBBI HÍREI

AI fotogrammetriával bővült az Artec Studio 19

A professzionális 3D szkenner megoldásokat gyártó Artec 3D bemutatta az Artec Studio, átfogó 3D szkennelő, adatfeldolgozó, reverse engineering és minőségellenőrzési célszoftver legújabb verzióját. Az AS19-et többek között széleskörű szkenner-integrációval, nagyobb teljesítménnyel és mesterséges intelligencia alapú fotogrammetriával fejlesztették, hogy még jobban megfeleljen a különböző iparágakból érkező szakemberek igényeinek. A szoftver egyik legizgalmasabb újítása, hogy már nemcsak 3D szkenek, de fényképek és videófelvételek alapján is képes 3D modellek létrehozására.

2024. november 24. 15:33

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Idén is keresi a digitális szakma női példaképeit az IVSZ és a WiTH

2024. november 22. 16:40

Huszadik alkalommal adták át a Hégető Honorka-díjakat

2024. november 21. 16:58

Hosszabbít ’Az Év Honlapja’ pályázat!

2024. november 19. 09:54

Törj be a digitális élvonalba: Nevezz ’Az Év Honlapja’ pályázatra!

2024. november 14. 16:36