Jdi na navigaci předmětu

Otázky ke zkoušce

  1. Rozhodovací stromy.
    • Algoritmus ID3, kritéria pro větvení (entropie, gini, MSE), použití pro klasifikaci a regresi, hyperparametry rozhodovacích stromů.
  2. Metoda nejbližších sousedů: kNN.
    • Popis metody, hyperparametrů a jejího použití pro klasifikaci a regresi. Pojem metrika a normalizace dat.
  3. Lineární regrese, metoda nejmenších čtverců.
    • Model lineární regrese, predikce, maticový zápis trénovací množiny. Metoda nejmenších čtverců: normální rovnice, řešení.
  4. Geometrická interpretace metody nejmenších čtverců.
    • Geometrická interpretace metody nejmenších čtverců, normální rovnice, řešení. Regularita versus lineární nezávislost sloupců matice X.
  5. Hřebenová regrese.
    • Regularizovaný reziduální součet čtverců, řešení. Modely bázových funkcí.
  6. Statistické vlastnosti modelů.
    • Rozklad očekávané chyby modelu, bias-variance tradeoff. Nestrannost odhadu v lineární regresi metodou nejmenších čtverců.
  7. Logistická regrese.
    • Použití pro binární klasifikaci, jak funguje model, vlastnosti.
  8. Logistická regrese.
    • Logistická regrese jako MLE odhad: sestavení optimalizační úlohy pro trénování, myšlenka MLE odhadů.
  9. Ensamble metody: bagging, boosting a náhodné lesy.
    • Rozdíl mezi baggingem a boostingem. Náhodné lesy a jejich hyperparamtery.
  10. Ensamble metody: bagging, boosting a AdaBoost.
    • Rozdíl mezi baggingem a boostingem. Popis metody AdaBoost.
  11. Evaluace modelů.
    • Vyhodnocovací metriky regrese a klasifikace (odvozené z matice záměn, ROC, AUC).
  12. Evaluace modelů.
    • Testovací chyba a její odhad. Evaluační scénáře - trénovací, validační a testovací množina versus křížová validace.
  13. Výběr příznaků.
    • Základní metody výběru příznaků (filtrační, obalové, vestavěné), Lasso.
  14. Hierarchické shlukování.
    • Cíle nesupervizovného učení a shlukování. Vzdálenost (metrika): definice a příklady. Aglomerativní algoritmus, měření vzdáleností shluků, dendrogram.
  15. Shlukování pomocí algoritmu k-means.
    • Cíle nesupervizovného učení a shlukování. Shlukování jako optimalizační úloha, algoritmus k-means a jeho účelová funkce. Vyhodnocování pomocí Silhouette skóre.
  16. Shlukování pomocí algoritmu DBSCAN.
    • Cíle nesupervizovného učení a shlukování. Algoritmus DBSCAN.
  17. Nesupervizovné učení, asociační pravidla.
    • Cíle nesupervizovného učení. Asociační pravidla.