Pitanje:
Što je "zasićeni" model?
Graham Cookson
2010-07-20 17:09:08 UTC
view on stackexchange narkive permalink

Na što se misli kada kažemo da imamo zasićeni model?

Sedam odgovori:
#1
+40
James
2010-07-20 19:23:31 UTC
view on stackexchange narkive permalink

Zasićeni model je model u kojem postoji onoliko procijenjenih parametara koliko točaka podataka. Po definiciji, ovo će dovesti do savršenog uklapanja, ali statistički će biti od male koristi, jer vam više nema podataka za procjenu odstupanja.

Na primjer, ako imate 6 podatkovnih točaka i uklapate 5.- da biste poredali polinom podataka, imali biste zasićeni model (jedan parametar za svaku od 5 potencijala vaše neovisne varijable plus jedan za konstantni pojam).

Vidio sam primjere gdje model ima deset podatkovnih točaka i devet parametara. Ističući da model ima previše parametara, rečeno mi je da je R ^ 2 0,999 pa model mora biti točan!
Kao što se može pročitati u mom i Daveovom postu, zasićeni modeli po definiciji ne vode do savršenog uklapanja. ali ako koristite n-1 polinom kao model oni će. vidi uvodni rad Sue Doe Nihm o ovoj temi http://psych.fullerton.edu/mbirnbaum/papers/Nihm_18_1976.pdf
Oprostite ako je ovo SZ: kako se zove slučaj kada imamo uređenu zbirku podatkovnih točaka i postoji podatkovna točka izvan koje su svi slučajevi uspješni ili svi slučajevi nisu uspjeli?
#2
+26
Rich
2010-07-20 20:47:05 UTC
view on stackexchange narkive permalink

Zasićeni model je model koji je preparametariziran do te mjere da u osnovi samo interpolira podatke. U nekim postavkama, poput kompresije i rekonstrukcije slike, to nije nužno loše, ali ako pokušavate izgraditi prediktivni model, to je vrlo problematično.

Ukratko, zasićeni modeli dovode do izuzetno prediktori velike varijance koje buka gura više od stvarnih podataka.

Kao misaoni eksperiment, zamislite da imate zasićeni model, a u podacima ima buke, a zatim zamislite uklapanje model nekoliko stotina puta, svaki put s drugačijom realizacijom buke, a zatim predviđa novu točku. Vjerojatno ćete svaki put dobiti radikalno različite rezultate, kako za vašu kondiciju, tako i za vaše predviđanje (a polinomski su modeli u tom pogledu posebno nagli) drugim riječima, varijansa prikladnosti i prediktora izuzetno su velike.

Suprotno tome, model koji nije zasićen dat će (ako je razumno konstruiran) nalete koji su međusobno konzistentniji čak i pod različitom realizacijom buke , a varijanca prediktora također će se smanjiti.

Znači, vi ste pretjerano opremljeni?
#3
+19
Dave Kellen
2010-07-27 18:09:55 UTC
view on stackexchange narkive permalink

Kao što su svi drugi prije rekli, to znači da imate onoliko parametara koliko imate i podatkovnih točaka. Dakle, nema dobre provjere sposobnosti. Ali to ne znači da model "po definiciji" može savršeno odgovarati bilo kojoj točki podataka. Mogu vam reći po osobnom iskustvu rada s nekim zasićenim modelima koji nisu mogli predvidjeti određene podatke. To je prilično rijetko, ali moguće.

Još jedno važno pitanje je da zasićenost ne znači beskorisnost. Na primjer, u matematičkim modelima ljudske spoznaje, parametri modela povezani su s određenim kognitivnim procesima koji imaju teorijsku pozadinu. Ako je model zasićen, možete testirati njegovu primjerenost provodeći fokusirane eksperimente s manipulacijama koje bi trebale utjecati samo na određene parametre. Ako se teoretska predviđanja podudaraju s uočenim razlikama (ili nedostatkom) u procjenama parametara, tada se može reći da je model valjan.

Primjer: Zamislite na primjer model koji ima dva skupa parametara, jedan za kognitivnu obradu, a drugi za motoričke odgovore. Zamislite sada da imate eksperiment s dva stanja, jednim u kojem je sposobnost sudionika da reagira oslabljena (mogu koristiti samo jednu ruku umjesto dvije), a u drugom stanju nema oštećenja. Ako je model valjan, razlike u procjenama parametara za oba stanja trebale bi se pojaviti samo za parametre odziva motora.

Također, imajte na umu da, čak i ako je jedan model nezasićen, on i dalje može biti neidentificiran , što znači da različite kombinacije vrijednosti parametara daju isti rezultat, što kompromitira bilo koji model.

Ako želite pronaći više informacija o tim problemima općenito, možda biste trebali pogledati ove radove:

Bamber, D., & van Santen, JPH (1985). Koliko parametara model može imati i još uvijek ga je moguće testirati? Časopis za matematičku psihologiju, 29, 443-473.

Bamber, D., & van Santen, J. P. H. (2000). Kako procijeniti provjerljivost i prepoznatljivost modela. Časopis za matematičku psihologiju, 44, 20-40.

živjeli

#4
+17
Henrik
2010-07-27 16:56:42 UTC
view on stackexchange narkive permalink

Model je zasićen onda i samo ako ima onoliko parametara koliko ima podatkovnih točaka (opažanja). Ili drugačije rečeno, u nezasićenim modelima stupnjevi slobode veći su od nule.

To u osnovi znači da je ovaj model beskoristan, jer ne opisuje podatke štedljivije nego što to čine sirovi podaci (i opisivanje podataka općenito je ideja koja stoji iza upotrebe modela). Nadalje, zasićeni modeli mogu (ali ne nužno) pružiti (beskorisno) savršeno uklapanje, jer oni samo interpoliraju ili ponavljaju podatke.

Uzmimo za primjer srednju vrijednost kao model za neke podatke. Ako imate samo jednu podatkovnu točku (npr. 5), koristeći srednju vrijednost (tj. 5; imajte na umu da je srednja vrijednost zasićeni model samo za jednu podatkovnu točku) uopće ne pomaže. Međutim, ako već imate dvije podatkovne točke (npr. 5 i 7), koristeći sredinu (tj. 6) kao model, pruža vam se štedljiviji opis od izvornih podataka.

Ova točka o zasićenosti koja ne podrazumijeva savršeno uklapanje najzanimljiviji je dio ove teme. Prirodan primjer takve situacije bila bi [monotona regresija] (http://en.wikipedia.org/wiki/Isotonic_regression). Pretpostavimo, npr. Da znate da se vaše vrijednosti moraju povećavati s vremenom i radite polinomsku regresiju, * ograničavajući povećanje polinoma. * Razmotrite podatke koji imaju neku pogrešku, pa se ponekad malo smanje. Tada bez obzira na to koliko parametara koristite (čak i kad je * više * od broja vrijednosti podataka), nikada nećete savršeno odgovarati tim podacima.
#5
+3
Stephen Lien
2011-09-21 18:17:58 UTC
view on stackexchange narkive permalink

Korisno je i ako trebate izračunati AIC za model kvazi vjerojatnosti. Procjena disperzije treba doći iz zasićenog modela. LL koji vam odgovara podijelili biste procijenjenu disperziju od zasićenog modela u izračunu AIC.

#6
+3
Ehsan88
2015-11-19 21:01:28 UTC
view on stackexchange narkive permalink

U kontekstu SEM-a (ili analize puta), zasićeni model ili tek identificirani model je model u kojem je broj slobodnih parametara točno jednak broju varijanci i jedinstvenih kovarijancija. Na primjer, sljedeći je model zasićeni model jer postoje 3 * 4/2 podatkovne točke (varijance i jedinstvene kovarijancije) i također 6 besplatnih parametara za procjenu:

a saturated model

#7
+2
Richard DiSalvo
2019-12-05 21:04:02 UTC
view on stackexchange narkive permalink

U regresiji, mislim da je uobičajena upotreba izraza "zasićeni model" sljedeća. Zasićeni model ima onoliko neovisnih varijabli koliko ima jedinstvenih razina (kombinacija) kovijarata. To je naravno moguće samo s kategoričkim kovarijantima. Dakle, ako imate dvije lažne varijable X1 i X2, regresija je zasićena ako su neovisne varijable koje uključite X1, X2 i X1 * X2.

To je povoljno jer je funkcija uvjetnog očekivanja Y danih X1 i X2 nužno linearna u parametrima kada je model zasićen (linearna je u X1, X2, X1 * X2). Važno je da ovaj model općenito nema "toliko procijenjenih parametara koliko točaka podataka", niti općenito ima "savršeno uklapanje".

Evo jednog izvora za to, ima mnogo drugih: "Kada bismo očekivali da je CEF linearni? Dva slučaja. Jedan je ako su podaci (ishod i kovarijante) multivarijatni Normalni. Drugi je ako su linearni regresija je saturirani. Zasićeni regresijski model je onaj u kojem postoji parametar za svaku jedinstvenu kombinaciju kovarijanata. U ovom slučaju, regresija savršeno odgovara CEF-u jer je CEF linearna funkcija lažnih kategorija. " Prof. Biljekove predavanja, stranica 2.

Karakterizacija u prvom odlomku samo je poseban slučaj citata u trećem (što je samo po sebi izvrstan odgovor).


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...