Magyar nyelvű adattisztítás a SAS-sal

forrás Prim Online, 2007. november 13. 14:36

A vezető üzleti intelligencia szállító SAS Adatminőség Konferenciáján mutatta be első magyar nyelvű adattisztítási megoldását. A nyelvi és nyelvtani sajátosságokat figyelembe vevő alkalmazás azzal is segíti a hazai vállalatok és intézmények munkáját, hogy az adatokat a magyar szokásoknak és formátumoknak megfelelően kezeli.

Az adatminőség fontos tényező a szervezetek életében, hiszen egy nyilvántartás rossz adatai könnyen és gyorsan elszaporodnak más rendszerekben is. Ha az adatok egymásnak ellentmondanak, következetlenek vagy pontatlanok, akkor az ügyfelekkel, beszállítókkal és más partnerekkel való interakciók is pontatlan információkon alapulnak, magasabb költségeket, csökkenő hitelképességet és elveszített üzleteket generálva. A helyzetet tovább nehezíti, hogy a szervezeteken belüli adatmennyiségek manapság exponenciálisan nőnek. Ezekkel a problémákkal elsősorban azok a vállalatok szembesülnek, amelyek nagy méretű adatbázisokat – ügyféladatbázist, alkatrész- vagy terméknyilvántartást – használnak napi munkájuk során, tehát például a bankok és a biztosítók.

Nem kérdés tehát, hogy a döntések alapjául szolgáló adatok megbízhatósága és minősége kulcsfontosságú egy szervezet életében. A SAS mostantól egyszerűbbé teszi a hazai vállalatok és intézmények munkáját, ugyanis immár magyar nyelvű kiegészítő csomag is elérhető DataFlux Data Quality Integration adatminőség megoldásához. Ennek köszönhetően jelentősen egyszerűsíthetők az adattisztítási és -feldolgozási folyamatok, melyek nem lehetnek teljes körűek az adott nyelv sajátosságainak figyelembe vétele nélkül.

Lokalizált alkalmazások


A SAS megoldásához kapcsolódó lokalizált kiegészítő csomagok túlmutatnak a hagyományos adatminőség-eljárásokon, ugyanis a nyelvi, nyelvtani és földrajz-specifikus szabályoknak köszönhetően az adatokat a különböző országok szokásainak megfelelően tudják kezelni. Ilyen lokális sajátosság például, hogy Magyarországon kilenc számjegyből állnak a mobiltelefonszámok, vagy hogy a címben szereplő Bp. rövidítés Budapestre utal. A magyar csomagnak köszönhetően az adattisztítási megoldás felismeri a személyneveket és a cégneveket is, s ezeket képes elkülöníteni, valamint a hibás mezőhasználatot is jelzi, ha például városnév szerepel az utca mezőben. A nyelvi sajátosságok alapján azt is értelmezi például, hogy a cím mezőben szereplő Ady E. u. kifejezés Ady Endre utcát jelöl.

Intelligens adatkezelés

Szintén gyakori, hogy egy cellában más fontos, de az adott mező szempontjából nem releváns adat szerepel - például a Kovács András egyéni vállalkozó összetétel a név mezőben. A rendszer felismeri, hogy az egyéni vállalkozó kifejezés nem a név részét képezi, s ezt további információként kinyeri az adatsorból. Ugyanilyen plusz információt jelent az ügyfél neme, amelyre az alkalmazás a név alapján következtet.
Ha nagy méretű ügyféladatbázisokat kell összehangolni - például két bank egyesülésekor -,  a duplikációkon túl az is megnehezítheti az adatok értelmezését, ha a nyilvántartásokban más-más formátumban szerepelnek az ügyféladatok. A megoldás azonban felismeri, hogy például mobiltelefonszámok esetén a +36-XX-XXX-XXXX vagy a 06-XX-XXX-XXXX alak egyaránt érvényes, s arra is képes, hogy egységes formátumra hozza ezeket az adatokat. A rendszer kiszűri, ha egy partner több néven szerepel az adatbázisban, így a vállalat világos képet kaphat arról, hogy milyen tranzakciókat folytatott az adott céggel.

A beépített szabályok mellett lehetőség van új adatminőségi szabályok alkotására is. Az alkalmazás további nagy előnye, hogy a programozási tudással nem rendelkező felhasználók is egyszerűen tudják kezelni.

A SAS adattisztítási megoldása számos más nyelven is elérhető (például angol, német, orosz, francia, lengyel, koreai stb.), amely szintén hatékonyan segítheti a nemzetközi partnerekkel rendelkező magyar vállalatok munkáját.