Pitanje:
Pod kojim uvjetima treba koristiti višerazinsku / hijerarhijsku analizu?
Patrick
2010-08-22 05:22:34 UTC
view on stackexchange narkive permalink

Pod kojim bi uvjetima netko trebao razmotriti upotrebu višerazinske / hijerarhijske analize za razliku od temeljnijih / tradicionalnih analiza (npr. ANOVA, OLS regresija itd.)? Postoje li situacije u kojima bi se to moglo smatrati obveznim? Postoje li situacije u kojima je korištenje višerazinske / hijerarhijske analize neprimjereno? Konačno, koji su dobri resursi za početnike za učenje višerazinske / hijerarhijske analize?

Također pogledajte: http://stats.stackexchange.com/a/38430/5739
Osam odgovori:
#1
+23
ars
2010-08-22 05:40:31 UTC
view on stackexchange narkive permalink

Kad je struktura vaših podataka prirodno hijerarhijska ili ugniježđena, modeliranje na više razina dobar je kandidat. Općenito, to je jedna metoda za modeliranje interakcija.

Prirodan je primjer kada su vaši podaci iz organizirane strukture kao što su država, država, okruga, gdje želite ispitati učinke na tim razinama. Još jedan primjer gdje možete uklopiti takvu strukturu je longitudinalna analiza, gdje ste tijekom vremena ponavljali mjerenja kod mnogih ispitanika (npr. Neki biološki odgovor na dozu lijeka). Jedna razina vašeg modela pretpostavlja grupni prosječni odgovor svih ispitanika tijekom vremena. Druga razina vašeg modela tada omogućuje perturbacije (slučajne učinke) iz srednje vrijednosti grupe, za modeliranje individualnih razlika.

Popularna i dobra knjiga za početak je Gelmanova Analiza podataka korištenjem regresije i višerazinskih / hijerahijskih modela .

Podržavam ovaj odgovor i želio bih dodati još jednu sjajnu referencu na ovu temu: Singer-ov primijenjeni uzdužni tekst analize podataka . Iako je specifičan za longitudinalnu analizu, daje lijep pregled MLM-a općenito. Također sam smatrao da su Snidjers i Boskerova višerazinska analiza dobri i čitljivi . John Fox također pruža lijep uvod u ove modele u R ovdje .
Hvala svima na odgovorima :) Kao sljedeće pitanje, nije li se većina podataka mogla shvatiti kao prirodno hijerarhijska / ugniježđena? Na primjer, u većini psiholoških studija postoji niz ovisnih varijabli (upitnici, odgovori na podražaje, itd.) Ugniježđene unutar pojedinaca, koje su dalje ugniježđene u dvije ili više skupina (slučajno ili ne slučajno dodijeljene). Biste li se složili da ovo predstavlja prirodno hijerarhijsku i / ili ugniježđenu strukturu podataka?
Ako bi itko od vas višerazinskih / hijerarhijskih gurua mogao odvojiti nekoliko minuta, bio bih vrlo zahvalan ako biste mogli razmotriti pitanja iz analize postavljena u drugom postu (http://stats.stackexchange.com/questions/1799/recommendations-or -best-prakse-za-analizu-nesamostalnih-podataka-specifi). Konkretno, mislite li da bi podaci o percepciji boli navedeni u tom postu bili bolje analizirani hijerarhijskim analizama nego nehijerarhijskim analizama? Ili to ne bi promijenilo ili čak bilo neprikladno? Hvala: D
#2
+18
Andy W
2010-08-22 07:48:21 UTC
view on stackexchange narkive permalink

Centar za višerazinsko modeliranje ima nekoliko dobrih besplatnih mrežnih vodiča za modeliranje na više razina, a imaju i softverske vodiče za ugradnju modela u njihov MLwiN softver i STATA.

Shvatite to kao herezu, jer u knjizi nisam pročitao više od jednog poglavlja, već hijerarhijski linearni modeli: primjene i metode analize podataka Stephen W. Raudenbush, Anthony S. Bryk dolazi u veliku preporuku. Također sam se zakleo da postoji knjiga o višerazinskom modeliranju pomoću R softvera u Springer Use R! seriju, ali čini se da je trenutno ne mogu pronaći (mislio sam da su je napisali isti ljudi koji su napisali knjigu A Beginner's Guide to R).

uredi: Knjiga o korištenju R za višerazinske modele je Modeli s mješovitim efektima i proširenja u ekologiji s R Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM

sretno

#3
+9
Galit Shmueli
2010-12-13 11:08:36 UTC
view on stackexchange narkive permalink

Evo još jedne perspektive korištenja multilevel vs. regresijskih modela: U zanimljivom radu Afshartousa i de Leeuwa pokazuju da je svrha modeliranja prediktivna (to jest predviđanje novih opažanja), izbor modela je različit od cilja zaključivanja (gdje pokušavate uskladiti model sa strukturom podataka). Rad na koji se pozivam je

Afshartous, D., de Leeuw, J. (2005). Predviđanje u višerazinskim modelima. J. Educat. Ponašaj se. Statist. 30 (2): 109–139.

Ovdje sam upravo pronašao još jedan srodni članak ovih autora: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

#4
+6
Cyrus S
2010-12-14 01:08:54 UTC
view on stackexchange narkive permalink

Evo primjera gdje bi višerazinski model mogao biti "bitan". Pretpostavimo da želite ocijeniti "kvalitetu" obrazovanja koje pruža niz škola koristeći ocjene učenika. Jedan od načina definiranja kvalitete škole je u smislu prosječnog uspjeha na testu nakon što se uzmu u obzir karakteristike učenika. To biste mogli konceptualizirati kao: $$ y_ {is} = \ alpha_s + X_ {is} '\ beta_s + \ epsilon_ {is}, $$ gdje je $ y_ {is} $ rezultat kontinuiranog testa za student $ i $ in škola $ s $, $ X_ {is} $ su atributi učenika usredotočeni na školu, $ \ beta_s $ je koeficijent specifičan za školu na tim atributima, $ \ alpha_s $ je "efekt škole" koji mjeri kvalitetu škole i $ \ epsilon_ {is} $ su idiosinkrazije na razini učenika u izvedbi polaganja ispita. Interes se ovdje fokusira na procjenu $ \ alpha_s $ -a, koji mjere "dodanu vrijednost" koju škola pruža učenicima nakon što se uračunaju njihovi atributi. Želite uzeti u obzir atribute učenika, jer ne želite kazniti dobru školu koja se mora nositi s učenicima s određenim nedostacima, stoga su depresivni prosječni rezultati testova unatoč visokoj "dodanoj vrijednosti" koju škola pruža svojim učenicima.

S modelom u ruci, problem postaje problem procjene. Ako imate puno škola i puno podataka za svaku školu, lijepa svojstva OLS-a (pogledajte Angrist i Pischke, Uglavnom neškodljivi ... , za trenutni pregled) sugeriraju da biste željeli koristiti to, s prikladnim prilagodbama standardnih pogrešaka radi uzimanja u obzir ovisnosti, i korištenjem lažnih varijabli i interakcija kako bi se postigli učinci na školskoj razini i presretnuti presjeci za školu. OLS je možda neučinkovit, ali toliko je proziran da će možda biti lakše uvjeriti skeptičnu publiku ako ga koristite. Ali ako su vaši podaci na određeni način rijetki - pogotovo ako imate malo zapažanja za neke škole - možda biste željeli nametnuti više "strukture" problemu. Možda ćete htjeti "posuditi snagu" od škola s većim uzorkom kako biste poboljšali bučne procjene koje biste dobili u školama s malim uzorkom da je procjena rađena bez strukture. Tada biste se mogli obratiti modelu slučajnih efekata koji se procjenjuje putem FGLS-a, ili možda aproksimaciji za usmjeravanje vjerojatnosti zadanom parametrijskom modelu, ili čak Bayes-u o parametarskom modelu.

U ovom primjeru, upotreba višerazinski model (međutim, u konačnici ga odlučimo prilagoditi) motiviran je izravnim zanimanjem za presretanje na razini škole. Naravno, u drugim situacijama ovi parametri na razini grupe mogu biti ništa drugo nego smetnje. Hoćete li se trebati prilagoditi ili ne (i, prema tome, i dalje raditi s nekakvim višerazinskim modelom), ovisi o tome jesu li određene pretpostavke uvjetne egzogenosti. U vezi s tim, preporučio bih konzultacije s ekonometrijskom literaturom o metodama podataka panela; većina uvida odatle prenosi se na općeniti kontekst grupiranih podataka.

Ovo je stara nit, ali u slučaju da ovo pročitate: OLS s lažnim varijablama i interakcijama ne posuđuje snagu kao ostale tehnike koje spominjete, zar ne? Imam neke podatke u kojima sam analizu podijelio na dva dijela i koristio dvije naredbe lm (R linearni model) za modeliranje dva dijela. Uveo sam lažnu varijablu da naznačim dva dijela, a zatim ponovno upotrijebio lm na ovom "objedinjenom" modelu i odgovori su bliski, ali ne i isti. Moje pitanje bi bilo: je li taj odgovor "bolji" ili jednostavno drugačiji zbog algoritma?
@Wayne: ako ste u drugom koristili lutke i cijeli skup interakcija, procjene bodova trebale bi biti jednake. Standardne pogreške mogu se razlikovati jer druga metoda može pretpostaviti viši stupanj slobode, ali trebali biste provjeriti je li to ispravna pretpostavka modeliranja.
#5
+6
probabilityislogic
2011-05-22 09:40:26 UTC
view on stackexchange narkive permalink

Višerazinsko modeliranje prikladno je, kao što i samo ime govori, kada vaši podaci utječu na različite razine (pojedinačno, s vremenom, preko domena itd.). Jednorazinsko modeliranje pretpostavlja da se sve događa na najnižoj razini. Još jedna stvar koju model na više razina čini je uvođenje korelacija između ugniježđenih jedinica. Dakle, jedinice razine 1 u istoj jedinici razine 2 bit će povezane.

U nekom smislu o višerazinskom modeliranju možete razmišljati kao o pronalaženju sredine između "individualističke zablude" i "ekološke zablude ". Individualistička zabluda je kada se zanemaruju "učinci zajednice", na primjer, kompatibilnost stila učitelja sa stilom učenja učenika, na primjer (pretpostavlja se da učinak dolazi samo od pojedinca, pa samo napravite regresiju na razini 1). dok je "ekološka zabluda" suprotno, i bilo bi kao da pretpostavimo da je najbolji učitelj imao učenike s najboljim ocjenama (i tako da razina 1 nije potrebna, samo napravite regresiju u potpunosti na razini 2). U većini postavki nijedno nije prikladno (učenik-učitelj je "klasičan" primjer).

Imajte na umu da je u školskom primjeru postojalo "prirodno" grupiranje ili struktura podataka. Ali to nije bitna značajka višerazinskog / hijerahijskog modeliranja. Međutim, prirodno grupiranje čini matematiku i proračune lakšima. Ključni sastojak su prethodne informacije koje govore da postoje procesi koji se događaju na različitim razinama. U stvari možete osmisliti algoritme klasteriranja nametanjem višerazinske strukture vašim podacima s nesigurnošću koja je jedinica na kojoj višoj razini. Dakle, imate $ y_ {ij} $ s nepoznatim indeksom $ j $.

#6
+4
user28
2010-08-22 06:04:55 UTC
view on stackexchange narkive permalink

Općenito govoreći hijerarhijskom Bayesovom (HB) analizom dovest će se do učinkovitih i stabilnih procjena pojedinačne razine, osim ako su vaši podaci takvi da su učinci pojedinačne razine potpuno homogeni (nerealan scenarij). Procjene učinkovitosti i stabilnih parametara HB modela postaju zaista važne kada imate oskudne podatke (npr. Manje broja obs nego broja parametara na pojedinačnoj razini) i kada želite procijeniti procjene pojedinačne razine.

Međutim, HB modele nije uvijek lako procijeniti. Stoga, iako analiza HB obično prevladava analizu koja nije HB, vi morate vagati relativne troškove u odnosu na koristi na temelju vašeg prošlog iskustva i vaših trenutnih prioriteta u smislu vremena i troškova.

Kad ste rekli da ako niste zainteresirani za procjene pojedinačne razine, tada možete jednostavno procijeniti agregatni model razine, ali čak i u tim kontekstima procjena agregirajućih modela putem HB-a pomoću pojedinačnih procjena razine može imati puno smisla.

Ukratko, postavljanje HB modela preporučuje se dok god imate vremena i strpljenja da ih uklopite. Tada možete koristiti agregatne modele kao mjerilo za procjenu izvedbe svog HB modela.

Hvala vam na detaljnom odgovoru Srikant :) Trenutno nisam upoznat s Bayesovim analizama, ali ja sam jedna od tema koju sam namjeravao istražiti. Razlikuje li se hijerarhijska Bayesova analiza od ostalih višerazinskih / hijerarhijskih analiza o kojima se raspravlja na ovoj stranici? Ako je tako, imate li preporučeni resurs za zainteresirane strane da saznaju više?
Iz analitičke perspektive HB analiza = modeli na više razina. Međutim, pojam višerazinskih modela koristi se kada imate različite razine koje se javljaju prirodno (vidi primjer @ars). Pojam HB modeli koriste se kada u situaciji ne morate nužno imati različite razine. Na primjer, ako modelirate potrošačev odgovor na različite marketinške varijable (npr. Cijena, adv. Potrošnja itd.), Možda imate sljedeću strukturu na potrošačkoj razini: $ β_i \ sim N (\ bar {\ beta}, \ Sigma ) $ i $ \ bar {\ beta} \ sim N (.,.) $ na razini populacije. Za reference: Pogledajte ostale odgovore.
#7
+4
Chris Beeley
2010-12-13 13:47:49 UTC
view on stackexchange narkive permalink

Naučio sam od Snijdersa i Boskera, Analiza više razina: Uvod u osnovno i napredno modeliranje na više razina. Mislim da je to vrlo dobro za početnike, mora da je to zato što sam glup kad se radi o tim stvarima i to mi je imalo smisla.

Podržavam i Gelmana i Hill, uistinu briljantne knjiga.

#8
+1
StatisticsDoc Consulting
2012-11-20 11:01:29 UTC
view on stackexchange narkive permalink

Višerazinske modele treba koristiti kada su podaci ugniježđeni u hijerarhijsku strukturu, posebno kada postoje značajne razlike između jedinica više razine u zavisnoj varijabli (npr. orijentacija postignuća učenika varira između učenika, a također i između razreda s koje su učenici ugniježđeni). U tim okolnostima opažanja su skupljena, a ne neovisna. Ne uzimajući u obzir klasteriranje dovodi do podcjenjivanja pogrešaka u procjenama parametara, pristranog ispitivanja značajnosti i tendencije odbijanja nule kada bi je trebalo zadržati. Obrazloženje upotrebe višerazinskih modela, kao i temeljita objašnjenja kako provesti analize, pružaju

Raudenbush, S. W. Bryk, A. S. (2002). Hijerarhijski linearni modeli: primjene i metode analize podataka. 2. izdanje. Newbury Park, CA: Sage.

Knjiga R & B također je dobro integrirana s autorskim programskim paketom HLM, što uvelike pomaže u učenju paketa. Objašnjenje zašto su višerazinski modeli potrebni i poželjniji od nekih alternativa (poput lažnog kodiranja jedinica više razine) nalazi se u klasičnom radu

Hoffman, D.A. (1997). Pregled logike i obrazloženja hijerahijskih linearnih modela. Journal of Management, 23, 723-744.

Hoffmanov rad možete besplatno preuzeti ako Google "Hoffman 1997 HLM" i pdf pristupite na mreži.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...