8 Machine Learning Modell (előadó: Gáspár Csaba, senior data scientist @dmlab)

Letölthető prezentáció és jegyzetek:

És itt van néhány link, hivatkozás és tananyag az előadáshoz kapcsolódóan:

  1. Lineáris Regresszió (és implementáció Python-ban) részletesen — a sorozat harmadik leckéje is ez lesz, de itt a direkt link is, ha előre belekukkantanál: https://dataklub.hu/leckek/linearis-regresszio-pythonban-eloado-bojte-berta-senior-data-scientist-hiflylabs/
  2. Normalizálás rövid magyarázat:
    Tegyük fel, hogy ingatlanokkal foglalkozol és ehhez egy ML algoritmust építesz.
    A különböző bemeneti paramétereid pl. a ház ára, mérete, és a szobák száma. Az árakat forintban, a méretet négyzetméterben, a szobák számát egyszerű egész számként adhatjuk meg. A házak árai általában a tízmilliós nagyságrendben, a méretük általában tizes nagyságrendben, a szobák száma pedig általában az 1-5 nagyságrendben mozog. Ha ezeket a jellemzőket normalizáljuk, például a Q&A-ben említett Min-Max vagy Z-score normalizációval és az összes értéket 0 és 1 közé (de legalábbis ebbe a nagyságrendbe) szorítjuk, azzal segítjük a gépi tanuló algoritmust, hogy ne hagyja figyelmen kívül a kisebb nagyságrendű jellemzőket (mint például a szobák száma), és ne tulajdonítson túlzott jelentőséget a nagyobb értékekkel rendelkező jellemzőknek (mint az ár). Ez segít az algoritmusnak a hatékonyabb és pontosabb működésben.
  3. Döntési Fa vizuális magyarázat: http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
  4. Bias-Varriance trade-off magyarázat: http://www.r2d3.us/visual-intro-to-machine-learning-part-2/
  5. ChatGPT mögött levő tudományos anyag: Attention is All You Need paper
  6. Szövegfeldolgozáshoz ajánlott Python könyvtár: spacy.io
  7. Egy rövid videó Mester Tomitól a mesterséges neurális hálók megértéséhez: