Mesterséges intelligencia tökéletes magyarsággal?

forrás: Prím Online, 2024. január 31. 14:32

Az elmúlt évek a mesterséges intelligencia térhódításáról szóltak, hazánkban is mind a vállalatok, mind a lakosság egyre szélesebb körben használja az MI-t. Jelenleg azonban az alkalmazások többsége nem képes magyar nyelvű utasításokat megérteni vagy információkat elemezni, és amelyik igen, ott sok a pontatlanság.

 

Miért szükséges, hogy hibátlanul fussanak magyarul az alkalmazások?

 

A magyar köztudottan az egyik legnehezebb nyelv a világon, amit csak a tízmillió magyar beszél, így világnyelvnek sem tekinthető. Ráadásul más nemzetekkel összehasonlítva a magyar társadalom töredéke beszél idegen nyelveket. A fiatalok nyelvtanulási kedve erősebb és a mesterséges intelligenciával felszerelt fordítóprogramok is sokat javítottak ezen a hátrányos helyzeten, de kiugró fejlődés az angol vagy más nyelvek terén nem történt. 

 

Minden profitorientált céges fejlesztésnél szempont a megtérülés, jelen esetben, hogy az adott nyelvet mennyi felhasználó beszéli. Továbbá az új szoftverek, a megnövekedett számítási teljesítmény mellett az is meghatározza, hogy a mesterséges intelligencia milyen ütemben fejlődik, hogy az adott nyelven mekkora adatmennyiség áll rendelkezésre. A most elérhető, az életünkbe viharos gyorsasággal beépülő mesterséges intelligencia alapú alkalmazások ezért futnak a nagy világnyelveken tökéletesen, míg a magyar kérdésekre, nagyon sok hibás válasz érkezik.

 

 

Anyanyelvünk használata nincs a nemzetközi technológiai cégek fejlesztéseinek fókuszában, így kiemelten fontos, hogy megőrizzük a magyar nyelv gazdagságát és a lehető legnagyobb magyar nyelvű szöveges adatbázis felhasználásával elkészítsük a magyar nyelvi modellt, mely beépülhet a mesterséges intelligencia alapú alkalmazásokba. Minél több lesz a hiteles magyar nyelvű szövegrész, annál pontosabbak és választékosabbak az MI válaszai.

 

De mi is az a nagy nyelvi modell? A nagy nyelvi modell (angolul large language modell, vagy rövidítve LLM) olyan mesterséges intelligencia alapú algoritmus, amit hatalmas mennyiségű szöveges adaton, ún. korpuszon tanítottak be, és képes megérteni, feldolgozni az emberi beszélt és írott nyelv sajátosságait. 

 

Hazánkban két nagy projekt zajlik, mely a magyar nyelvi modell kifejlesztésén és tökéletesítésén dolgozik. 

• A Nyelvtudományi Intézet munkatársai kifejlesztették a magyar ChatGPT-t, egy mesterséges intelligencia-alapú szövegszerkesztő és nyelvelemző szoftvert, mely jelenleg csevegésre még nem képes, viszont meg tudja találni a szövegekben lévő összefüggéseket, alkalmas médiatartalom elemzésre. A Puli-GPT nevet viselő alkalmazás kidolgozásakor 41 milliárd szóból álló magyar (és 62 mrd szóból álló angol) szövegállományt tápláltak be a kutatók, összehasonlításul az OpenAI Chat GPT 120-130 millió magyar (és 180 mrd angol) szóból tanult. A Puli a közeljövőben bővül majd csevegési funkcióval, de már most képes megadott szavak alapján összefüggő szövegeket írni, vagy össze tudja foglalni egy cikk vagy egy könyv tartalmát.

• A magyar állam és az OTP bank közös finanszírozásában, hazai egyetemek bevonásával zajlik 2021 óta egy magyar mesterséges intelligencia nyelvi modell létrehozása. Első lépésben elkészült az alap nyelvi modell, mely 1,5 milliárd paramétert használt, most zajlik a 30 milliárd paraméterre bővítés.  A projekt célja, hogy olyan nyelvi modellt hozzanak létre, ami segíti a vállalati és a magán ügyfelek kiszolgálását, növeli a hatékonyságot, és hosszú hosszú távú versenyelőnyt biztosít nemcsak a banknak, hanem az egész magyar gazdaságnak.

 

„A nyelvi modelleken alapuló alkalmazások már megjelentek mind a köznevelésben, mind a felsőoktatásban. Ezek készségszintű, tudatos használata mind az egyén, mind a társadalom számára a jövőképesség, a siker feltétele. Jól működő magyar nyelvi modell, nemcsak szuverenitási, hanem jóléti kérdés is, mivel növeli az MI magyar haszonélvezőinek a körét. Gábor Dénes Egyetemen ezért, nemcsak az oktatásunkban, hanem a kutatásainkban is kiemelt terület a nyelvi modell használata” – mondta Dr. Dietz Ferenc, a Mesterséges Intelligencia Koalíció oktatási és tudatosítási munkacsoportjának a vezetője, a Gábor Dénes Egyetem elnöke.

Megoldás ROVAT TOVÁBBI HÍREI

Helyi rugalmassági piacot tesztelnek Róma villamosenergia-hálózatán

A Róma áramellátását biztosító hálózat csúcsigénye a következő tíz évben várhatóan 2200 MW-ról 3300 MW-ra fog nőni. Ezzel a kihívással nincs egyedül az olasz főváros: a növekvő energiaigények és a megváltozó fogyasztói szokások miatt világszerte és Magyarországon is egyre szükségesebb a villamos hálózatok kapacitásának bővítése.

2024. február 28. 10:13

Vállalati adatokon tanított generatív AI: a jövő útja a cégeknek

A nyilvános adatokon tanított AI modellek esetében mára egyértelművé vált, hogy nemcsak segíteni képesek a vállalatokat, hanem használatuk számos kockázatot is jelenthet azokra nézve. Ennek elkerülése érdekében, valamint a produktivitás javítása, a költségek optimalizálása és a komplex információk megértése céljából egyre többen saját adataikat használva tanítják a generatív mesterséges intelligenciát – derül ki a Deloitte TMT Predictions 2024 kutatásából. 

2024. február 27. 18:59

Hogyan járul hozzá a digitalizáció az energiaköltségek csökkentéséhez?

A digitalizáció már elkerülhetetlen, legyen szó akár irodáról, akár oktatási intézményről. Az átállást erősen sürgeti az egyre inkább elterjedő környezettudatos trend, de nyomós érv mellette az energiaárak kiugróan magas megemelkedése is. Hogy milyen eszközökben érdemes gondolkodnunk és azok milyen megtérülést hozhatnak már néhány éven belül, abba Herczog Gábor, a Legamaster magyarországi forgalmazójának, a Stiefel Magyarország Kft. ügyvezető igazgatója és Urbán Tamás vizuáltechnika üzletágvezető nyújtott betekintést.

2024. február 27. 11:26

Kövess minket a Facebookon!

Cikkgyűjtő

További fontos híreink

Magyar fejlesztők programján ámul a világ: Már nem csak tanul, teremt is a magyar MI

2024. február 27. 20:28

Magyar siker a bahreini Forma 1-en

2024. február 21. 16:15

Közös mentorprogramot indít a Corvinus és az OTP

2024. február 20. 11:27

Megvannak ‘Az Év Honlapja’ 2023 díjazottjai!

2024. február 8. 09:30