Ha szeretnéd biztosabban értelmezni az adataid közötti kapcsolatokat, ez az előadás jó kiindulópont: az alapoktól mutatja meg, mit jelent a korreláció, hogyan számoljuk, mikor alkalmazható helyesen, és milyen félreértéseket érdemes elkerülni. A Statisztika Data Science-hez 1: Korrelációelemzés előadásban Kozma-Renge Kriszta (Data36, DataRock Labs) nemcsak az elméleti hátteret teszi érthetővé, hanem Pythonos példákon és vizualizációkon keresztül azt is megmutatja, hogyan ellenőrizd a módszerek feltételeit, hogyan értelmezd az eredményeket, és hogyan használd ezt a tudást adatelemzésben vagy modellépítésben. A mellékelt Jupyter Notebookokkal a tanultakat rögtön ki is próbálhatod.
Milyen főbb témákról van szó az előadásban?
- Korreláció: definíció és értelmezés – Mit mér a korreláció, mit jelent a kapcsolat iránya (pozitív/negatív) és erőssége, és hogyan olvasható le mindez a korrelációs együtthatóból.
- Pearson-korreláció a gyakorlatban – Mikor használható helyesen: lineáris kapcsolat, folytonos numerikus változók, és a definíció szerint normál eloszlású adatok esetén; azt is áttekinti, hogyan ellenőrizhetők a feltételek vizualizációval.
- Mi történik „a képlet mögött”? – Intuitív magyarázat az átlagtól való eltérések logikáján keresztül, arra is kitérve, hogyan adódhat akár pozitív értékekből is negatív korreláció.
- Spearman-féle rangkorreláció – Rugalmasabb alternatíva, amely nem igényel normáleloszlást, monoton (nem feltétlen lineáris) kapcsolatot mér, és rangokra épül, ezért ordinális adatoknál is hasznos.
- Szignifikancia és p-érték szerepe – Miért fontos különválasztani azt, hogy „van korreláció”, attól, hogy az eredmény „nem a véletlen műve” (nullhipotézis, p-érték küszöb).
- Vizualizáció: scatterplot, korrelációs mátrix, heatmap – Hogyan tehető áttekinthetővé több változó kapcsolatrendszere, és mire érdemes figyelni a színezés és a skálázás beállításánál.
- Korreláció vs. ok-okozat – Miért nem következik okság a korrelációból (klasszikus „fagyi vs. cápatámadás” példa), és miért lehet mégis kifejezetten hasznos data science feladatokban, például feature-választásnál.























































