Jdi na navigaci předmětu
Otázky ke zkoušce
- Rozhodovací stromy.
- Algoritmus ID3, kritéria pro větvení (entropie, gini, MSE), použití pro klasifikaci a regresi, hyperparametry rozhodovacích stromů.
- Metoda nejbližších sousedů: kNN.
- Popis metody, hyperparametrů a jejího použití pro klasifikaci a regresi. Pojem metrika a normalizace dat.
- Lineární regrese, metoda nejmenších čtverců.
- Model lineární regrese, predikce, maticový zápis trénovací množiny. Metoda nejmenších čtverců: normální rovnice, řešení.
- Geometrická interpretace metody nejmenších čtverců.
- Geometrická interpretace metody nejmenších čtverců, normální rovnice, řešení. Regularita versus lineární nezávislost sloupců matice X.
- Hřebenová regrese.
- Regularizovaný reziduální součet čtverců, řešení. Modely bázových funkcí.
- Statistické vlastnosti modelů.
- Rozklad očekávané chyby modelu, bias-variance tradeoff. Nestrannost odhadu v lineární regresi metodou nejmenších čtverců.
- Logistická regrese.
- Použití pro binární klasifikaci, jak funguje model, vlastnosti.
- Logistická regrese.
- Logistická regrese jako MLE odhad: sestavení optimalizační úlohy pro trénování, myšlenka MLE odhadů.
- Ensamble metody: bagging, boosting a náhodné lesy.
- Rozdíl mezi baggingem a boostingem. Náhodné lesy a jejich hyperparamtery.
- Ensamble metody: bagging, boosting a AdaBoost.
- Rozdíl mezi baggingem a boostingem. Popis metody AdaBoost.
- Evaluace modelů.
- Vyhodnocovací metriky regrese a klasifikace (odvozené z matice záměn, ROC, AUC).
- Evaluace modelů.
- Testovací chyba a její odhad. Evaluační scénáře - trénovací, validační a testovací množina versus křížová validace.
- Výběr příznaků.
- Základní metody výběru příznaků (filtrační, obalové, vestavěné), Lasso.
- Hierarchické shlukování.
- Cíle nesupervizovného učení a shlukování. Vzdálenost (metrika): definice a příklady. Aglomerativní algoritmus, měření vzdáleností shluků, dendrogram.
- Shlukování pomocí algoritmu k-means.
- Cíle nesupervizovného učení a shlukování. Shlukování jako optimalizační úloha, algoritmus k-means a jeho účelová funkce. Vyhodnocování pomocí Silhouette skóre.
- Shlukování pomocí algoritmu DBSCAN.
- Cíle nesupervizovného učení a shlukování. Algoritmus DBSCAN.
- Nesupervizovné učení, asociační pravidla.
- Cíle nesupervizovného učení. Asociační pravidla.