Pitanje:
Zašto bi netko provodio t-test, radije pretpostavio (ili testirao) jednake varijance, nego uvijek koristio Welchovu aproksimaciju df-a?
russellpierce
2010-07-20 19:19:41 UTC
view on stackexchange narkive permalink

Čini se da su, kad se ispuni pretpostavka homogenosti varijance, rezultati Welcheva prilagođenog t-testa i standardnog t-testa približno isti. Zašto jednostavno ne uvijek koristiti Welch prilagođenu t?

Sedam odgovori:
#1
+36
Henrik
2010-07-27 20:14:23 UTC
view on stackexchange narkive permalink

Želio bih se suprotstaviti druga dva odgovora temeljena na radu (na njemačkom jeziku) Kubinger, Rasch i Moder (2009).

Oni tvrde na temelju " opsežne "simulacije iz distribucija koje zadovoljavaju ili ne ispunjavaju pretpostavke nametnute t-testom (normalnost i homogenost varijance) koje Welch-testovi izvode jednako dobro kada su pretpostavke zadovoljene (tj. u osnovi ista vjerojatnost počinjenja alfa i beta pogreške), ali nadmašuje t-test ako pretpostavke nisu ispunjene, posebno u pogledu snage. Stoga preporučuju da se uvijek koristi Welch-test ako veličina uzorka prelazi 30.

Kao metakomentar: Za ljude zainteresirane za statistiku (poput mene i vjerojatno većine ostalih) argument zasnovan na podacima (kao moj) trebao bi se barem jednako računati kao argumente isključivo temeljene na teoretskim osnovama (kao i ostali ovdje).


Ažuriranje:
Nakon razmišljanja o ovoj temi opet, pronašao sam dvije daljnje preporuke od kojih mi nova pomaže. Pogledajte izvorne radove (koji su, barem za mene, slobodno dostupni) za argumentacije koje vode do ovih preporuka.

Prva preporuka dolazi od Graemea D. Ruxtona iz 2006. godine: " Ako želite usporediti središnju tendenciju 2 populacije na temelju uzoraka nepovezanih podataka, tada bi se uvijek trebao koristiti nejednaki t-test varijance u odnosu na Studentov t-test ili Mann-Whitney U test. " U:
Ruxton, GD, 2006. Nejednaka varijanta t-testa nedovoljno je iskorištena alternativa Studentovom t-testu i Mann-Whitney U-testu. Behav. Ecol . 17, 688–690.

Druga (starija) preporuka je Coombs i sur. (1996., str. 148): " Ukratko, neovisni uzorak t test je općenito prihvatljiv u smislu kontrole stope pogrešaka tipa I pod uvjetom da postoji dovoljno velikih uzoraka jednake veličine, čak i kada se krši pretpostavka jednake varijance populacije . Međutim, za uzorke nejednake veličine poželjnija je alternativa koja ne pretpostavlja jednake varijance populacije. Koristite Jamesov test drugog reda kada su raspodjele kratkotrajne simetrične ili normalne. Obećavajuće alternative uključuju Wilcox H i Yuen obrubljeni testovi znači, koji pružaju širu kontrolu stope pogrešaka tipa I od Welch testa ili James testa i imaju veću snagu kada su podaci dugorepi. " (naglasak dodan)
U:
Coombs WT, Algina J, Oltman D. 1996. Testovi hipoteza univarijantnih i multivarijantnih omnibusa odabrani za kontrolu stope pogrešaka tipa I kada varijacije populacije nisu nužno jednake. Rev Educ Res 66: 137–79.

Meta-odgovor: Dobra poanta. Ali vaši se podaci možda neće ponašati kao moji! :-)
Henrik, hoćeš li zamjeriti ako uredim odgovor na: (1) promjenu terminologije pozivanjem testova Studentov t-test i Welchov t-test (kao što sam pronašao u većini literature);(2) uključiti još jedan rad koji to sugerira u raspravu: https://www.rips-irsp.com/article/10.5334/irsp.82/ (naglašava pristranost koja se događa kada odaberete testove temeljene na Levenovom testuhomogenosti).
#2
+13
Dave Kellen
2010-07-27 20:43:52 UTC
view on stackexchange narkive permalink

naravno, moglo bi se odustati od oba testa i početi koristiti Bayesov t-test (test omjera Savage-Dickey), koji može uzeti u obzir nejednake i nejednake varijance, a što je najbolje od svega, omogućuje kvantificiranje dokaza u naklonost nultoj hipotezi (što znači da nema više starih "neuspjeha u odbijanju")

Ovaj test vrlo je jednostavan (i brz) za primjenu, a postoji rad koji čitateljima koji nepoznatima jasno objašnjavaju s Bayesovom statistikom kako ga koristiti, zajedno s R skriptom. u osnovi možete jednostavno umetnuti svoje podatke i poslati naredbe na R konzolu:

Wetzels, R., Raaijmakers, J. G. W., Jakab, E., & Wagenmakers, E.-J. (2009.). Kako kvantificirati podršku za i protiv nultih hipoteza: Fleksibilna WinBUGS implementacija zadanog Bayesova t-testa.

za sve to postoji i vodič s primjerima podataka:

http://www.ruudwetzels.com/index.php?src=SDtest

Znam da ovo nije izravan odgovor na ono što je traženo, ali znam mislio sam da bi čitatelji mogli uživati ​​u ovoj lijepoj alternativi

živjeli

uvijek ti Bayesovci ...
Druga Bayesova alternativa t-testu je Kruschkeova NAJBOLJA (Bayesova procjena zamjenjuje t test) rutina. Više informacija ovdje: http://www.indiana.edu/~kruschke/BEST/. Internetska inačica ovdje: http://www.sumsar.net/best_online/.
#3
+7
Rich
2010-07-20 21:43:43 UTC
view on stackexchange narkive permalink

Budući da su točniji rezultati poželjniji od aproksimacijskih, i izbjegavajte slučajeve neobičnih rubova u kojima aproksimacija može dovesti do drugačijeg rezultata od točne metode.

Welchova metoda nije brži način za izvođenje bilo kojeg starog t-testa, to je slikovita aproksimacija inače vrlo teškog problema: kako konstruirati t-test pod nejednakim varijantama. Slučaj jednake varijance dobro je razumljiv, jednostavan i točan te ga stoga treba uvijek koristiti kad je to moguće.

Mislim da se više slažem s Johnom Tukeyem - "* Daleko bolji približni odgovor na pravo pitanje, koji je često nejasan, nego točan odgovor na pogrešno pitanje, koji se uvijek može precizirati. *"
Sam testa testa jednake varijance samo je (nerazumljiva) aproksimacija kada su varijanse uzorka * populacije * nejednake.Stoga, osim ako je poznato da su varijance populacije jednake, bolje je koristiti aproksimaciju ispravne raspodjele uzorka (Welch-Satterthwaite) nego koristiti savršeno točnu raspodjelu koja se ne odnosi na model podataka.
#4
+4
dsimcha
2010-09-21 06:36:25 UTC
view on stackexchange narkive permalink

Dva se razloga mogu sjetiti:

  1. Redoviti Studentov T prilično je robustan prema heteroskedastici ako su veličine uzorka jednake.

  2. Ako čvrsto vjerujete a priori da su podaci homoscedastični, tada nećete izgubiti ništa i možda ćete dobiti malu količinu energije koristeći Studen'ts T umjesto Welchove T.

Jedan od razloga koji ne bih dao je taj što je Studentova T točna, a Welchova T nije. IMHO je točnost Studentova T akademska jer je točna samo za normalno distribuirane podatke, a nijedan stvarni podatak nije točno normalno distribuiran. Ne mogu se sjetiti niti jedne veličine koju ljudi zapravo statistički mjere i analiziraju gdje bi distribucija vjerovatno imala potporu svih stvarnih brojeva. Na primjer, u svemiru ima samo toliko atoma, a neke veličine ne mogu biti negativne. Stoga, kada koristite bilo koju vrstu T-testa na stvarnim podacima, ionako napravite aproksimaciju.

(1) nije točan kada su osnovne razlike u populaciji znatno različite.Kao krajnji slučaj - da bismo vidjeli zašto je to tako - razmotrite što se događa kada jedna populacija uopće nema odstupanja.Student t zapravo bi uspoređivao podatke druge populacije sa konstantom, ali mislio bi da ima dvostruko više stupnjeva slobode.Pogreška koju čini bila bi usporediva s korištenjem Z testa.
Iako je ovo istina, @whuber to je samo za vrlo ekstremne slučajeve.Upravo sam gledao razliku varijance 1e6: 1 i p ≈ .053.Tako se može dogoditi, ali svejedno bih tvrdio da je prilično robustan s jednakim N.
@John Omjer varijance 1e6: 1 je * ogroman *, bez obzira na to što $ n_i $ može biti.Studentova t vjerojatno će u tom slučaju zavarati.
@whuber, Samo sugeriram da, iako je vaš gornji komentar tehnički istinit, Welchova korekcija nije rješenje problema koji postavljate kao primjer, a nije čak ni vrlo kritična prema robusnosti testa u smislu alfa stopa (štoje ono što (1) obično znači).Kao što sugerirate, kada je problem (ekstremno) nejednaka varijanca i drugi problemi, ali to je zapravo druga tema.
#5
+3
user88
2010-07-20 19:40:33 UTC
view on stackexchange narkive permalink

Činjenica da se nešto složenije svodi na nešto manje složeno kada se provjeri neka pretpostavka nije dovoljna da odbaci jednostavniju metodu.

Pogotovo kad su studenti u pitanju.
#6
+2
Sympa
2010-09-17 04:53:00 UTC
view on stackexchange narkive permalink

Ovdje bih zauzeo suprotno mišljenje. Zašto se gnjaviti s Welchovim testom kad vam standardni nespareni studentski t test daje gotovo identične rezultate. Proučavao sam ovaj problem neko vrijeme i istražio sam niz scenarija pokušavajući razbiti t test i favorizirao Welchov test. Da bih to učinio, koristio sam do 5 puta veće uzorke za jednu skupinu u odnosu na drugu. Istražio sam varijacije i do 25 puta veće za jednu skupinu u odnosu na drugu. I, stvarno nije napravilo nikakvu materijalnu razliku. Neparni t test i dalje je generirao raspon p vrijednosti koji su bili gotovo identični Welch testu.

Moj rad možete vidjeti na sljedećoj poveznici i usredotočiti se posebno na slajd 5 i 6.

http://www.slideshare.net/gaetanlion/unpaired-t -test obitelj

Žao mi je, kakvu razliku razlikujete između formule velikog uzorka i formule malog uzorka? Izračunavate li varijance pomoću formule populacije u velikim uzorcima, a ne pomoću procjene uzorka varijance populacije?
Neupareni studentski t test ima dvije formule. Formula velikog uzorka primjenjuje se na uzorke s više od 30 promatranja. Formula malog uzorka primjenjuje se na uzorke s manje od 30 promatranja. Glavna razlika u tim formulama je kako izračunavaju skupnu standardnu ​​pogrešku. Formula za mali uzorak mnogo je složenija i kontraintuitivnija. A u stvarnosti to doista ima vrlo malo razlike. To sam testirao nekoliko puta. Zato mislim da je većina ljudi zaboravila na ovu razliku. I oni većinu vremena koriste formulu velikog uzorka.
#7
  0
John
2017-06-28 00:09:27 UTC
view on stackexchange narkive permalink

Istina je da su frekvencijska svojstva Welch ispravljenog testa bolja od uobičajenog Studentova T, barem za pogreške. Slažem se da je samo to prilično dobar argument za Welchov test. Međutim, obično nerado preporučujem Welchovu korekciju jer je njezina uporaba često varljiva. Što, doduše, nije kritika samog testa.

Razlog zašto ne preporučujem Welchovu korekciju je taj što ne mijenja samo stupnjeve slobode i naknadnu teoretsku raspodjelu iz koje se crpi p-vrijednost. Čini test neparametarskim. Da bi se izveo Welch -ov korigirani t-test, još uvijek se udružuje varijansa kao da se može pretpostaviti jednaka varijansa, ali zatim se mijenja konačni postupak ispitivanja, podrazumijevajući da se ne može pretpostaviti jednaka varijanca ili da vam je stalo samo do varijanci uzorka. To ga čini neparametarskim testom, jer se objedinjena varijanca smatra nereprezentativnim za populaciju, a vi ste priznali da samo testirate svoje promatrane vrijednosti.

Samo po sebi s tim nema ništa posebno loše. Međutim, smatram da je varljiv jer a) obično nije prijavljen s dovoljno specifičnosti; i b) ljudi koji ga koriste imaju tendenciju da o tome razmišljaju naizmjenično s t-testom. Jedini način na koji ikad znam da je to učinjeno u objavljenim radovima je kad vidim čudan DF za t-distribuciju. To je ujedno bio i jedini način na koji je Rexton (naveden u Henrikovom odgovoru) mogao reći u pregledu. Nažalost, neparametarska priroda Welch ispravljenog testa javlja se bez obzira jesu li se promijenili stupnjevi slobode ili ne (tj. Čak i ako su varijance uzorka jednake). No, ovo je pitanje izvještavanja simptomatično zbog činjenice da većina ljudi koji koriste Welchovu korekciju ne prepoznaju da se dogodila ova promjena na testu. Upravo sam intervjuirao nekoliko kolega i priznali su da nikada nisu ni pomislili na to.

Stoga, zbog toga, vjerujem da ako ćete preporučiti neparametarski test, nemojte koristiti onaj koji se često čini parametarskim ili barem budite vrlo jasni u tome što radite.Službeni naziv testa trebao bi biti T-test koji nije korišten u parametrima Welch-a.Da ljudi to tako prijave, bio bih puno sretniji s Henrikovom preporukom.

U vašem odgovoru nisam mogao pronaći potporu zašto je Welchov test možda "varljiv".Možete li objasniti osnovu za to?
Možda su moje izmjene pojasnile stvari @whuber.Trebao sam biti jasan da nije zajamčeno da je varljiv, ali često je i za korisnika testa i za čitatelja rezultata testa.
Hvala vam.Osim problema s izvještavanjem - koji bi bilo nepravedno okarakterizirati kao grešku testa! - čini se da se ovo svodi na neku vrstu prigovora s vaše strane da je Welchov test neparametarski.Što bi moglo biti s tim?* Ceteris paribus *, to se mora smatrati prednošću, a ne problemom.
To je razlika koja se općenito ne razjašnjava.U odgovoru priznajem da to samo po sebi nije problem, ali većina ljudi obično ga tretira parametarski, što je pogreška.Mislim da ovdje nije mjesto za raspravu o prednostima ili troškovima neparametarskog ispitivanja.Također, nije spomenuto u niti i možda predstavlja problem mnogim ljudima.Osim toga, dva naša razreda uvodne statistike podučavaju ga paralelno sa Studentovim t-testom i promoviraju ga, ali imaju čitav zaseban odjeljak o neparametarskim testovima.
Možete li pojasniti što podrazumijevate pod "čini test neparametrijskim"?
Nije li paragraf 2 dovoljan?
Umm, ne baš;pogotovo jer me upravo taj dio naveo na pitanje.Možda počinjemo s različitih mjesta.Koju definiciju riječi 'neparametarski' ovdje upotrebljavate?
Statistika je parametarska ako se temelji na parametrima populacije.Ono što ovo neparametarsko čini testom jest to što, iako procjenjujete varijancu učinka koja izgleda poput procjene parametra u t-testu jednake varijance, zapravo ne radite test koji održava tu pretpostavku fiksnog parametra populacijei dopustiti da varira.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...