elstartolt!

Data Science Klub:
1. Házi Data Science Verseny

belépő szintű és junior adatosoknak

VERSENYKIÍRÁS

SZITUÁCIÓ

A Data36 Data Science Klubjának első házi versenyén való részvétellel egy kitalált, mégis igazán életszerű helyzetben tesztelhetitek adat elemzői képességeiteket.

A verseny során azt fogjuk imitálni, hogy egy fiktív Flyball* csapat (Wild Runners Flyball Team – innentől csak WRFT) edzője felkereste a Data Science Klubot, hogy megtalálja azt a legrátermettebb elemzőt, aki segítene számára feldolgozni a csapata 2023-as verseny eredményeit. A cél, hogy az elemzéseket felhasználva a jövőben még jobb teljesítményt nyújthasson a csapat.

* A Flyball egy váltó csapatverseny kutyáknak, ahol a résztvevők akadályokat ugorva hoznak vissza egy labdát egy speciális dobozból.

data science verseny magyar

Tomi és Kriszta pedig ebben a kiválasztási folyamatban fog segíteni neki.

ADAT

Az elemzéseket Python-ban (és SQL-ben) vagy hasonló fejlettebb data science-t és adatelemzést lehetővé nyelvekben javasoljuk, de a nyersadatot Excel formátumban kapjátok majd kézhez:

  • 1 Excel tábla a csapatban versenyző kutyák alap adatairól (ezek mind valós Flyball versenyző kutyák maszkolt adatai)

    ÉS
  • 12 + 4 Excel adatlap a csapat 2023-as teljesítményéről – összesen 11 Flyball verseny eredményeivel (ezek is mind valós Flyball versenyek maszkolt adatai*)

Az adat-szettek ennek a weboldalnak alján, az 1. FORDULÓ nevű leckébe kattintva érhetőek el.

* Az adatok valós versenyek valós mért adatain alapulnak, amiért hálával tartozunk a Cseh Flyball Klubnak, akik beleegyeztek, hogy letölthetjük és elemezhetjük az általuk gyűjtött adatokat!

DOMAIN TUDÁS

Még egyszer tehát: a Flyball egy váltó csapatverseny kutyáknak, ahol a résztvevők akadályokat ugorva hoznak vissza egy labdát egy speciális dobozból.

Aki nem kutyasport rajongó, nagy eséllyel még nem ismeri a sportot és annak szabályait… De ez ne bátortalanítson el senkit! A Flyball-t magát nagyon egyszerű megérteni (hasonló bármilyen emberek által űzött váltósporthoz) és jó pár anyagot elérhetővé teszünk majd, hogy ha esetleg az apró finomságokba is belemennél.

Megjegyzés: a domain tudás elsajátításához való anyagok ennek a weboldalnak alján, az 1. FORDULÓ nevű leckébe kattintva érhetőek el.

Emellett az adatokkal való megismerkedés után, 2024. 02. 26-án hétfőn este lehetőségetek lesz egy élő Q&A keretein belül magával a sporttal kapcsolatos kérdéseiteket feltenni Kozma-Renge Krisztának, aki nem csak ennek a data science versenynek a főszervezője, de véletlenül még nagy Flyball-rajongó is. 🙂

A VERSENY FELÉPÍTÉSE

A verseny 2024. 02. 19-től május végéig tart. No nem azért, mert azt gondolnánk, hogy 3,5 hónapnyi kemény munkát bele kell tennetek, sokkal inkább azért, hogy kényelmesen teljesíthetőek legyenek az egyes fordulókhoz meghatározott feladatok.

A feladatok megoldására szerintünk egy belépő vagy junior szintű tudással rendelkező data scientist-nek fordulónként átlagosan minimum 4-5 órát rá kell majd szánnia. (Ideális minimum tudásszint: ha valaki már megcsinálta a Junior Data Scientist Akadémia — vagy azzal egyenértékű képzést.) De természetesen mint tudjuk az elemzésnél határ a csillagos ég – és ezt a mélységet (és szakmai fejlődési lehetőséget) a mi adataink is biztosítani fogják.

A pontos menetrend:

  • 1. FORDULÓ: 2024. február 19. – 2024. március 3.: ADATTISZTÍTÁS
    Itt indul a verseny, minden Data Science Klubtag hozzáfér a nyers adatokhoz és az első adattisztítási feladatokhoz. A nevezés maga nem más, mint az első feladat megoldása. Azaz, aki a március 3-i nevezési határidőig visszaküldi a kitisztított adathalmazt .csv formátumban, hivatalosan is részesévé válik a versenynek!
  • 2. FORDULÓ: 2024. március 04. – 2024. március 17.: ALAP ELEMZÉSI FELADATOK
  • 3. FORDULÓ: 2024. március 18. – 2024. március 31.: EXTRA ELEMZÉSI FELADATOK I. RÉSZ
  • 4. FORDULÓ: 2024. április 1. – 2024. április 21.: EXTRA ELEMZÉSI FELADATOK II. RÉSZ
  • 5. FORDULÓ: 2024. április 22. – 2024. május 12.: ADATVIZUALIZÁCIÓS ÉS EXTRA SZORGALMI FELADATOK

A döntőhöz közeledve:

  • 2024. május 12. (vasárnap): a végleges elemzések, prezentáció beküldésének határideje
  • 2024. május 19. (vasárnap): a döntősök kihirdetése
  • 2024. május 27-i héten: DÖNTŐ. A döntősök élőben, senior data scientist-ekből álló zsűri előtt is prezentálják eredményeiket egy élő Data36 Meetup-on.

ÉRTÉKELÉSI SZEMPONTOK, SUPPORT

A döntősök kiválasztásakor az értékelésnél tartani fogjuk a Junior Data Scientist Akadémia záró feladatánál alkalmazott 60-30-10%-os arányt, azaz a végső pontok:

  • 60%-át az “üzelti” találások,
  • 30%-át a kódolás,
  • 10%-át pedig a vizualizációs/prezentációs megoldások fogják adni.

Házi versenynek neveztük el, mégis ugyanennyire gondoljuk ezt egy remek lehetőségnek számotokra, aminek a végére egy igazán ütős kis anyaggal egészíthetitek ki a hobbi projektes portfoliótokat.

Ehhez mérten lehetőség lesz hint-eket (segítséget vagy segítő kérdéseket) kérni az egyes mérföldkövek teljesítéséhez. Ezeknek a hint-eknek viszont “ára” lesz: a döntősök kiválasztásánál minden hint kérés -10 pontot fog jelenteni (az összesen megszerezhető maximális 150 pontból).

A döntőben pedig egy független senior data scientist-ekből álló zsűri fogja értékelni a döntősök prezentációit.

KI NEVEZHET? EGYÉNI ÉS/VAGY CSAPATVERSENY?

A hivatalos nevezés már lezárult.

Ennek ellenére, ha data science klubtag vagy, le tudod tölteni a dataset-et és tudod elemezni, illetve portfólió projektet készíteni belőle!

DÍJAZÁS

A döntősöket természetesen meg is jutalmazzuk kemény munkájukért:

  • I. helyezett – Budapest DATA+ML fórum konferencia belépő (https://budapestdata.hu/2024/hu/) + Data Science könyvcsomag + 30 perces személyes DS learning curve konzultáció Mester Tomival
  • II. helyezett – DS könyvcsomag + 30 perces személyes DS learning curve konzultáció Mester Tomival
  • III. helyzett – DS könyvcsomag + 30 perces személyes DS learning curve konzultáció Mester Tomival

Különdíj: DS könyvcsomag

ha már a Data Science Klub tagja vagy:

ha még nem vagy a Data Science Klub tagja:

Csatlakozz a klubhoz itt:

üdvözlettel:

Kozma-Renge Kriszta
a verseny főszervezője és projektvezetője

Mester Tomi

Mester Tomi
a data science klub admin-ja és szakmai vezetője

data science verseny magyar