Ha szeretnéd látni, hogyan néz ki egy életszerű machine learning projekt a „mi az üzleti cél?” kérdéstől a kódon át a kíméletlen kiértékelésig, ez az előadás neked szól. Mester Tomi egy szándékosan nehéz, valós adatokon futó whiskyár-előrejelzési kísérleten vezet végig Pythonban: először azt vizsgálja, hogy a következő hónapban fel- vagy lemegy-e az ár (klasszifikáció), majd azt is, mi történik, ha konkrét árat próbálunk becsülni (regresszió). Közben nemcsak azt látod, mi működik, hanem azt is, hol vannak a gyakorlati korlátok: miért lehet félrevezető egy 65%-os pontosság, és hogyan hozol jobb döntéseket metrikák, confusion matrix és ROC alapján.
Milyen főbb témákról van szó az előadásban?
- Üzleti cél és kontextus: miért csak akkor van értelme modellezni, ha pontosan tiszta, mire kell a predikció (pl. 1 hónapos irány-előrejelzés, később konkrét ár).
- Adatforrás és adatstruktúra: a viszkireturns.com aukciós másodpiaci adatai (több száz whisky, sok tízezer+ adatpont), és milyen mezőkkel dolgozik a projekt.
- Klasszifikációs megközelítés: „következő hónapban fel vagy le megy az ár?” bináris célváltozóval; Random Forest, LightGBM és XGBoost kipróbálása.
- Feature engineering, ami tényleg számít: lag-ek (előző hónapok árai), trend-meredekségek (3/6/12/24 hónap), mozgóátlagok, RSI, szezonalitás (hónap/quarter), valamint Google Trends keresleti jel.
- Kiértékelés és metrikák: accuracy, precision/recall, confusion matrix, ROC-AUC — és miért lehet félrevezető egyetlen számra ránézni.
- Idősoros validáció és finomhangolás: time series split és hiperparaméter-keresés gyakorlati tanulságai.
- „Vibe coding” ChatGPT-vel: gyors prototipizálás előnyei, és a kritikus hibák kockázata (pl. jövőből „szivárgó” feature).
- Regressziós irány: mi történik, ha nem irányt, hanem konkrét árat próbálunk becsülni (lineáris vs. boosting regresszor tapasztalatok).























































