Magyarország BIG DATA nagyhatalom

forrás: Prím Online, 2014. február 26. 12:21

Számos nemzetközi versenyen értek el kiemelkedő helyezéseket a hazai adatbányász szakemberek 2011 és 2013 között. Az egymillió lakosra jutó versenyzők rangsorában Magyarország jelenleg világszinten az 5. helyet foglalja el, hét eredményes versenyzővel. A világ 100 legjobb versenyzője között pedig jelenleg öt magyar van, ezek közül kettő a DMLAB munkatársa.

„Vállalatunk támogatja, hogy munkatársaink egyénileg vagy csapatban induljanak nemzetközi adatbányászati versenyeken, hiszen pusztán a felkészüléssel is biztosítjuk szakmai fejlődésünket. A megmérettetéseken való sikeres részvétel pedig azt jelzi, hogy az adatbányászat csúcstechnológiája ma elérhető Magyarországon” – nyilatkozta Gáspár Csaba a DMLAB Kft. ügyvezető igazgatója.

A DMLAB munkatársai 2013-ban hét versenyen értek el kiváló eredményeket, ezek közül hármat a Kaggle.com szervezésében, amely a világ legnagyobb adatbányász verseny platformja. A Kaggle.com párhuzamosan több adatelemzési versenyt futtat. Ezek a versenykiírások valós prediktív adatelemzési problémák megoldását tűzik ki feladatul számos üzleti felhasználási területről: mint például az ipari termelés, a szállítmányozás, az energiagazdálkodás, a telekommunikáció, a pénzügyi szektor vagy a városszervezés. A versenyeik mindenki számára nyitottak és nemcsak a legfejlettebb technológiai színvonalat követelik meg az indulóktól, de sokoldalú képzettséget és kreativitást is. Az elmúlt 3 év 130 versenyére egyre növekvő számban jelentkeznek elemzők az egész világról, profik és fiatal feltörekvők egyaránt.


A DMLAB versenyzőinek eredményei 2013-ban


Deloitte – As the World Churns
Ügyfelek lemorzsolódásának előrejelzése egy biztosító adathalmazán.
Verseny link: http://www.kaggle.com/c/deloitte-churn-prediction
Helyezés: 3. egy amerikai versenyzővel párban

Global Energy Forecasting Competition 2012 – Wind Forecasting
Szélerőmű farmok energiatermelésének előrejelzése.
Verseny link: http://www.kaggle.com/c/GEF2012-wind-forecasting
Helyezés: 3.

CI Algorithm Competition
Egy brazil bank kihelyezett áruhitelei esetén annak előrejelzése, hogy ki lesz, aki a hitelt nem fizeti vissza.
Verseny link: http://brics-cci.org/ci-algorithms-competition-ciac/
Helyezés: 1.

Data Mining Cup 2013
Egy felsőoktatási hallgatóknak kiírt verseny, ahol azt kellett előrejelezni, hogy egy adott webshopban ki fog vásárolni.
Verseny link: http://www.data-mining-cup.de/en/press/press-releases/press-releases-details/article/studenten-der-universitaet-dortmund-und-der-budapester-university-of-technology-and-economics-zaehle
Helyezés: 1.

Yandex Personalized Web Search Challenge
A felhasználók preferenciái alapján a keresési találatok újrarendezése.
Verseny link: http://www.kaggle.com/c/yandex-personalized-web-search-challenge
Helyezés: 8.

Predict the next phone call
Az emberek viselkedése alapján annak előrejelzése, hogy hová fognak a jövőben telefonálni.
Verseny link: https://crowdanalytix.com/contests/modeling--predict-the-next-phone-call
Helyezés: 5.

Predict the marketing buzz

Marketing tevékenység visszhangját kellett előrejelezni.
Verseny link: https://crowdanalytix.com/contests/predict-the-buzz
Helyezés: 7.

A DMLAB munkatársainak régebbi versenyeredményei

IEEE ICDM Data Mining Contest (2007)
Beltéri pozicionálás: meg kell tippelni WiFi alapján, hogy hol van a felhasználó.
Verseny link: http://www.cs.ust.hk/~qyang/ICDMDMC07/
Helyezés: 5. helyezés

ACM SIGKDD Cup (2008)

Orvosi képalkotó rendszerek által rögzített képeken annak felismerése, hogy az adott páciensnek van-e mellrákja.
Verseny link: http://www.kdd2008.com/kddcup.html
Helyezés: 9. helyezés

2009 UC San Diego Data Mining Contest

E-commerce tranzakciókban előforduló anomáliák előrejelzése.
Verseny link: -
Helyezés: 4. helyezés

KDD Time Series Challenge (2007)
Idősoros adatok osztályozása.
Verseny link: http://www.cs.ucr.edu/~eamonn/SIGKDD2007TimeSeries.html
Helyezés: 3. helyezés

RSCTC data mining contest (2010)
DNS szekvenciák alapján betegségek előrejelzése
Verseny link: http://tunedit.org/challenge/RSCTC-2010-A
Helyezés: 6. helyezés

ACM SIGKDD Cup (2010)
Oktatási rendszerekből származó log adatok alapján annak előrejelzése, hogy melyik hallgató hogyan fog teljesíteni.
Verseny link: https://pslcdatashop.web.cmu.edu/KDDCup/
Helyezés: 6. helyezés

IEEE ICDM Data Mining Contest (2010)

Forgalom előrejelzése gépjárművekből származó GPS adatok alapján.
Verseny link: http://tunedit.org/challenge/IEEE-ICDM-2010/gps
Helyezés: 7. helyezés