Jdi na navigaci předmětu

Otázky ke zkoušce

Rozhodovací stromy.
- Algoritmus ID3, kritéria pro větvení (entropie, gini, MSE), použití pro klasifikaci a regresi, hyperparametry rozhodovacích stromů.
Metoda nejbližších sousedů: kNN.
- Popis metody, hyperparametrů a jejího použití pro klasifikaci a regresi. Pojem metrika a normalizace dat.
Lineární regrese, metoda nejmenších čtverců.
- Model lineární regrese, predikce, maticový zápis trénovací množiny. Metoda nejmenších čtverců: normální rovnice, řešení.
Geometrická interpretace metody nejmenších čtverců.
- Geometrická interpretace metody nejmenších čtverců, normální rovnice, řešení. Regularita versus lineární nezávislost sloupců matice X.
Hřebenová regrese.
- Regularizovaný reziduální součet čtverců, řešení. Modely bázových funkcí.
Statistické vlastnosti modelů.
- Rozklad očekávané chyby modelu, bias-variance tradeoff. Nestrannost odhadu v lineární regresi metodou nejmenších čtverců.
Logistická regrese.
- Použití pro binární klasifikaci, jak funguje model, vlastnosti.
Logistická regrese.
- Logistická regrese jako MLE odhad: sestavení optimalizační úlohy pro trénování, myšlenka MLE odhadů.
Ensamble metody: bagging, boosting a náhodné lesy.
- Rozdíl mezi baggingem a boostingem. Náhodné lesy a jejich hyperparamtery.
Ensamble metody: bagging, boosting a AdaBoost.
- Rozdíl mezi baggingem a boostingem. Popis metody AdaBoost.
Evaluace modelů.
- Vyhodnocovací metriky regrese a klasifikace (odvozené z matice záměn, ROC, AUC).
Evaluace modelů.
- Testovací chyba a její odhad. Evaluační scénáře - trénovací, validační a testovací množina versus křížová validace.
Výběr příznaků.
- Základní metody výběru příznaků (filtrační, obalové, vestavěné), Lasso.
Hierarchické shlukování.
- Cíle nesupervizovného učení a shlukování. Vzdálenost (metrika): definice a příklady. Aglomerativní algoritmus, měření vzdáleností shluků, dendrogram.
Shlukování pomocí algoritmu k-means.
- Cíle nesupervizovného učení a shlukování. Shlukování jako optimalizační úloha, algoritmus k-means a jeho účelová funkce. Vyhodnocování pomocí Silhouette skóre.
Shlukování pomocí algoritmu DBSCAN.
- Cíle nesupervizovného učení a shlukování. Algoritmus DBSCAN.
Nesupervizovné učení, asociační pravidla.
- Cíle nesupervizovného učení. Asociační pravidla.