Hét lépés szükséges a big data kiaknázásához

forrás: Prím Online, 2013. április 15. 13:50

A big data jelenség napjaink egyik - nem alaptalanul - felkapott trendje. Ha a szervezetek teljes mértékben ki szeretnék aknázni a rendelkezésükre álló, intenzíven növekvő adatvagyon által kínált lehetőségeket, nem tekinthetnek el a megfelelő adatvagyon-gazdálkodástól (data governance) sem. Ennek egyik kulcsterülete az adatminőségkezelés, ugyanis a jobb minőségű adatok megalapozottabb döntéseket eredményeznek, és pozitív hozadékuk például az ügyféladatokkal foglalkozó marketingrészleg számára is kézzelfogható. Az adatvagyon-gazdálkodás tehát túlmutat az IT területen: üzleti szempontból is kiemelt jelentőséggel bír.

Jill Dyché, az üzleti analitikai szoftverek és szolgáltatások vezető szállítójának számító SAS Thought Leadership alelnöke szerint 1 az alábbi 7 lépés szükséges ahhoz, hogy egy szervezet teljes egészében kihasználhassa a big data-ban rejlő lehetőségeket:

Adatgyűjtés: Egy vállalat vagy intézmény különböző adatforrásokból gyűjti össze az adatokat, amelyeket aztán masszívan párhuzamosított rendszerek segítségével - gyakran grid technológia alkalmazásával - oszt szét; minden egyes csomópont az adatok egy részhalmazát dolgozza fel.
Feldolgozás: A rendszer ugyanezt a nagy teljesítményű párhuzamosságot használja fel annak érdekében, hogy gyors számításokat végezzen az adatokon minden egyes csomópontban, amelyek az eredményeket jobban felhasználható adathalmazokká csökkentik.
Adatkezelés: A feldolgozandó nagy mennyiségű adatok gyakran heterogének, mivel különböző tranzakciós rendszerekből származnak. Csaknem minden esetben szükség van az adatok értelmezésére, definiálására, tisztítására, gazdagítására és biztonsági célokból történő auditálására.
Mérés: A vállalatoknak folyamatosan mérniük, monitorozniuk kell adataik minőségét, biztosítaniuk kell adataik összekapcsolhatóságát. Az üzleti követelmények határozzák meg, hogy pontosan mit szükséges mérni és milyen célt érdemes kitűzni az adatok minőségével kapcsolatban.
Felhasználás: Az adatok felhasználásának összhangban kell lennie a feldolgozás eredeti követelményeivel. Például amennyiben a közösségi médiában zajló interakciókból kiderül, hogy ezek az adatok eredményeznek-e további termékvásárlásokat, és ha igen, hogyan, akkor a közösségi médiából származó adatok elérésére és frissítésére vonatkozó szabályokra van szükség.
Tárolás: Az adatfelhő (data-as-a-service) trend kialakulásával az adatok egyre inkább egy adott helyen találhatók meg, míg az azokat elérő programok helye nem rögzített. Akár rövid távú kötegelt feldolgozás, akár hosszú távú megőrzés céljából tárolja a szervezet az adatokat, a tárolási megoldásokat tudatosan kell kezelnie.
Adatvagyon-gazdálkodás: Az adatokkal kapcsolatos üzleti szempontú irányelveket és felügyeletet öleli fel, amely az előző 6 lépés mindegyikére vonatkozik.


A téma nemzetközileg elismert szakértőjének számító Dyché  szerint az adatmenedzsment folyamatok big data erőfeszítések érdekében történő kialakítása biztosítja többek között, hogy az üzleti érték és a kívánt eredmények világosan definiáltak, valamint a big data elemzések eredményei hasznosak és alkalmazhatóak. Így az új big data technológiák hatalmas ereje valóban kihasználható annak érdekében, hogy minden korábbinál nagyobb sebesség mellett költséghatékonyabbá váljon az adatfeldolgozás és -tárolás.

Adattengerből üzleti előny
A big data kiaknázása szempontjából is kiemelt fontosságú adatmenedzsment témakörét járja körül az április 19-i Adattengerből üzleti előny című rendezvény Budapesten, amelyen Jill Dyché vezérszónokként az adatvagyon hasznosításáról és kezeléséről tart majd előadást. Az  üzleti és IT vezetőknek szóló esemény arra a kérdésre is választ kíván adni, hogy miért nem csupán IT kérdés az adatminőség.