Pitanje:
Koje su korisne smjernice za GBM parametre?
Ram Ahluwalia
2012-04-03 08:27:15 UTC
view on stackexchange narkive permalink

Koje su neke korisne smjernice za ispitivanje parametara (npr. dubina interakcije, malo dijete, brzina uzorkovanja itd.) pomoću GBM-a?

Recimo da imam 70-100 značajki, 200 000 stanovnika i namjeravam kako bih testirao dubinu interakcije od 3 i 4. Jasno je da moram obaviti neko testiranje kako bih vidio koja kombinacija parametara najbolje drži izvan uzorka. Imate li prijedloga kako pristupiti ovom dizajnu testa?

Jedan odgovor:
Allan Engelhardt
2012-04-03 16:03:29 UTC
view on stackexchange narkive permalink

Paket caret može vam pomoći optimizirati izbor parametara za vaš problem. Vinjeta caretTrain pokazuje kako podesiti gbm parametre pomoću deset puta ponovljene unakrsne provjere valjanosti - dostupni su i drugi pristupi optimizaciji, a sve to može raditi paralelno pomoću paketa foreach. Za čitanje dokumenta koristite vinjetu ("caretTrain", package = "caret") .

Paket podržava podešavanje skupljanja , n. stabla i action.depth parametre za gbm model, iako možete dodati i svoje.

Za heuristiku, ovo je moj početni pristup:

skupljanje : Koliko god imao vremena za to (u priručniku za gbm ima više o tome, ali općenito nikad ne možete pogriješiti s manjom vrijednošću). Vaš je skup podataka mali pa bih vjerojatno započeo s 1e-3

n.trees : Obično uzgajam početni model dodajući sve više i više stabala do gbm. perf kaže da imam dovoljno (zapravo, obično 1,2 puta veću vrijednost) i onda to koristim kao vodič za daljnju analizu.

interact.depth : već imate imati ideju o ovome. Pokušajte i s manjim vrijednostima. Maksimalna vrijednost je pod (sqrt (NCOL (podaci)).

n.minobsinnode : Stvarno mi je važno podesiti ovu varijablu. Ne želite je tako malu da algoritam pronalazi previše lažnih značajki.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...