A Data36 Data Science Klubjának első házi versenyén való részvétellel egy kitalált, mégis igazán életszerű helyzetben tesztelhetitek adat elemzői képességeiteket.
A verseny során azt fogjuk imitálni, hogy egy fiktív Flyball* csapat (Wild Runners Flyball Team – innentől csak WRFT) edzője felkereste a Data Science Klubot, hogy megtalálja azt a legrátermettebb elemzőt, aki segítene számára feldolgozni a csapata 2023-as verseny eredményeit. A cél, hogy az elemzéseket felhasználva a jövőben még jobb teljesítményt nyújthasson a csapat.
* A Flyball egy váltó csapatverseny kutyáknak, ahol a résztvevők akadályokat ugorva hoznak vissza egy labdát egy speciális dobozból.
Tomi és Kriszta pedig ebben a kiválasztási folyamatban fog segíteni neki.
Az elemzéseket Python-ban (és SQL-ben) vagy hasonló fejlettebb data science-t és adatelemzést lehetővé nyelvekben javasoljuk, de a nyersadatot Excel formátumban kapjátok majd kézhez:
Az adat-szettek ennek a weboldalnak alján, az 1. FORDULÓ nevű leckébe kattintva érhetőek el.
* Az adatok valós versenyek valós mért adatain alapulnak, amiért hálával tartozunk a Cseh Flyball Klubnak, akik beleegyeztek, hogy letölthetjük és elemezhetjük az általuk gyűjtött adatokat!
Még egyszer tehát: a Flyball egy váltó csapatverseny kutyáknak, ahol a résztvevők akadályokat ugorva hoznak vissza egy labdát egy speciális dobozból.
Aki nem kutyasport rajongó, nagy eséllyel még nem ismeri a sportot és annak szabályait… De ez ne bátortalanítson el senkit! A Flyball-t magát nagyon egyszerű megérteni (hasonló bármilyen emberek által űzött váltósporthoz) és jó pár anyagot elérhetővé teszünk majd, hogy ha esetleg az apró finomságokba is belemennél.
Megjegyzés: a domain tudás elsajátításához való anyagok ennek a weboldalnak alján, az 1. FORDULÓ nevű leckébe kattintva érhetőek el.
Emellett az adatokkal való megismerkedés után, 2024. 02. 26-án hétfőn este lehetőségetek lesz egy élő Q&A keretein belül magával a sporttal kapcsolatos kérdéseiteket feltenni Kozma-Renge Krisztának, aki nem csak ennek a data science versenynek a főszervezője, de véletlenül még nagy Flyball-rajongó is. 🙂
A verseny 2024. 02. 19-től május végéig tart. No nem azért, mert azt gondolnánk, hogy 3,5 hónapnyi kemény munkát bele kell tennetek, sokkal inkább azért, hogy kényelmesen teljesíthetőek legyenek az egyes fordulókhoz meghatározott feladatok.
A feladatok megoldására szerintünk egy belépő vagy junior szintű tudással rendelkező data scientist-nek fordulónként átlagosan minimum 4-5 órát rá kell majd szánnia. (Ideális minimum tudásszint: ha valaki már megcsinálta a Junior Data Scientist Akadémia — vagy azzal egyenértékű képzést.) De természetesen mint tudjuk az elemzésnél határ a csillagos ég – és ezt a mélységet (és szakmai fejlődési lehetőséget) a mi adataink is biztosítani fogják.
A döntősök kiválasztásakor az értékelésnél tartani fogjuk a Junior Data Scientist Akadémia záró feladatánál alkalmazott 60-30-10%-os arányt, azaz a végső pontok:
Házi versenynek neveztük el, mégis ugyanennyire gondoljuk ezt egy remek lehetőségnek számotokra, aminek a végére egy igazán ütős kis anyaggal egészíthetitek ki a hobbi projektes portfoliótokat.
Ehhez mérten lehetőség lesz hint-eket (segítséget vagy segítő kérdéseket) kérni az egyes mérföldkövek teljesítéséhez. Ezeknek a hint-eknek viszont “ára” lesz: a döntősök kiválasztásánál minden hint kérés -10
pontot fog jelenteni (az összesen megszerezhető maximális 150
pontból).
A döntőben pedig egy független senior data scientist-ekből álló zsűri fogja értékelni a döntősök prezentációit.
A hivatalos nevezés már lezárult.
Ennek ellenére, ha data science klubtag vagy, le tudod tölteni a dataset-et és tudod elemezni, illetve portfólió projektet készíteni belőle!
A döntősöket természetesen meg is jutalmazzuk kemény munkájukért:
Különdíj: DS könyvcsomag
Csatlakozz a klubhoz itt: