Ha szeretnéd megérteni, miért számít a Gradient Boosting Machine (GBM) az egyik legerősebb eszköznek, amikor a predikció pontossága a cél, ez az előadás világos, gyakorlatias képet ad róla. Gáspár Csaba (dmlab) egy valós, regressziós problémán keresztül mutatja be a módszert: budapesti lakások négyzetméterárának becslésén, publikus 2015-ös hirdetési adatok alapján. Megnézed, hogyan működik a GBM Pythonban, miben más a logikája egy lineáris regresszióhoz képest, és hogyan építhetsz nemcsak pontosabb modellt, hanem olyat is, amelynek a tanulságai értelmezhetők. A bemutató kézzelfogható szemléletet ad a modellépítésről, a kiértékelésről és az interpretációról, így a látott lépések saját elemzésekben is közvetlenül alkalmazhatók.
Milyen főbb témákról van szó az előadásban?
- GBM alapötlet és működési logika: miért épül egymásra sok döntési fa, hogyan dolgozik a modell a reziduális hibával, és mi a learning rate szerepe.
- Pontosság vs. „csak cseréljük ki az algoritmust” szemlélet: mikor érdemes GBM-ben gondolkodni, ha a cél a minél jobb becslés, és miben tér el a megközelítés például a lineáris regressziótól.
- Ingatlanár-becslés end-to-end demó Pythonban: alapmodellek összevetése (lineáris regresszió vs. GBM), majd teljesítményjavítás releváns változókkal, például kerület, épülettípus, állapot, emelet, fűtés, erkély.
- Kiértékelés MAPE-pal és keresztvalidációval: mit jelent az „átlagos százalékos hiba”, és hogyan kapsz stabilabb képet a modell teljesítményéről.
- Model interpretáció Partial Dependency Plot (PDP) segítségével: hogyan deríthető ki, mit tanult a modell (például a kerület vagy az alapterület hatása), és hogyan érdemes ezt doménszakértőknek bemutatni.
- „Motorháztető alá nézés”: egy szintetikus példán, lépésről lépésre követhető, hogyan csökken a hiba, ahogy egyre több fa épül, és miért tanul jól a GBM.























































