Kedy použiť odklad?

Kedy použiť odklad?
Kedy použiť odklad?
Anonim

Čo je to Holdout Set? Niekedy označované ako „testovacie“údaje, podmnožina odkladných údajov poskytuje konečný odhad výkonnosti modelu strojového učenia po jeho natrénovaní a overení. Zostavy výdrže by sa nikdy nemali používať na rozhodovanie o tom, ktoré algoritmy použiť, ani na zlepšovanie či ladenie algoritmov.

Je krížové overenie lepšie ako čakanie?

Krížová validácia je zvyčajne preferovanou metódou, pretože dáva vášmu modelu príležitosť trénovať na viacerých testoch vlaku. To vám dáva lepšiu predstavu o tom, ako dobre bude váš model fungovať s neviditeľnými údajmi. Na druhej strane, výdrž závisí len od jedného vlakového testovacieho rozdelenia.

Čo je zdržanlivý prístup?

Metóda vydržania je najjednoduchším druhom metódy na vyhodnotenie klasifikátora. Pri tejto metóde sa súbor údajov (kolekcia údajových položiek alebo príkladov) rozdelí na dva súbory, ktoré sa nazývajú tréningový súbor a testovací súbor. Klasifikátor vykonáva funkciu priraďovania údajových položiek v danej kolekcii k cieľovej kategórii alebo triede.

Mám vždy vykonať krížové overenie?

Vo všeobecnosti je krížová validácia potrebná vždy, keď potrebujete určiť optimálne parametre modelu, pre logistickú regresiu by to bol parameter C.

Aká je výhoda krížovej validácie K-fold?

ak porovnáte test-MSEs sú lepšie v prípade k-násobku CV ako LOOCV. K-násobok CV alebo akékoľvek CV alebo metódy prevzorkovania niezlepšiť chyby testov. odhadujú chyby testov. v prípade k-foldu robí lepšiu prácu pri odhadovaní chyby ako LOOCV.

Odporúča: