Pitanje:
Ako su t-test i ANOVA za dvije skupine jednaki, zašto njihove pretpostavke nisu jednake?
Chris Beeley
2010-08-13 14:41:13 UTC
view on stackexchange narkive permalink

Siguran sam da sam ovo potpuno omotao oko glave, ali jednostavno ne mogu shvatiti.

T-test uspoređuje dvije normalne distribucije pomoću Z distribucije. Zbog toga postoji pretpostavka normalnosti u DATA-u.

ANOVA je ekvivalent linearnoj regresiji s lažnim varijablama i koristi sume kvadrata, baš kao i OLS. Zbog toga postoji pretpostavka normalnosti REZIDUALA.

Trebalo mi je nekoliko godina, ali mislim da sam napokon shvatila te osnovne činjenice. Pa zašto je t-test ekvivalentan ANOVA-i s dvije skupine? Kako mogu biti jednaki ako čak i ne pretpostavljaju iste stvari u vezi s podacima?

Jedna točka: t-testovi koriste t distribuciju, a ne Z distribuciju
Iako pitanje nije točno, vrlo je korisno.Također, mislim da će spominjanje "dvostranog t-testa" negdje pitanja / odgovore učiniti potpunijima.
Pet odgovori:
#1
+32
Rob Hyndman
2010-08-13 14:52:45 UTC
view on stackexchange narkive permalink

T-test s dvije skupine pretpostavlja da se svaka skupina normalno distribuira s jednakom varijancom (iako se sredstva mogu razlikovati pod alternativnom hipotezom). To je ekvivalentno regresiji s lažnom varijablom jer regresija omogućuje da se prosjek svake skupine razlikuje, ali ne i varijansa. Stoga rezidualni ostaci (jednaki podacima s oduzetim sredstvima grupe) imaju istu raspodjelu - to jest, oni se normalno raspodjeljuju s nultom sredinom.

T-test s nejednakim varijantama nije ekvivalentan jednosmjerna ANOVA.

Mogu potražiti citat, ali ovo je dovoljno jednostavno za empirijsko testiranje. F iz ANOVA s dvije skupine točno je jednak t ^ 2 i p-vrijednosti bit će potpuno jednake. Jedini razlog zbog kojeg ne bi bio ekvivalentan u slučaju nejednakih varijanci jest ako primijenite ispravak. Inače su isti.
F-test je generalizacija t testa. t-test je za usporedbu 2 tretmana, a F test je za više tretmana. Izvođenje je u Casellinom statističkom dizajnu, poglavlje 3 i 4. Međutim, kako ističe prof. Hyndman, s nejednakim varijantama, to više nije t-test. To je problem Fishera Behrena. Uglavnom ne koristimo Fisherovo rješenje, nego Welchov test ili Bayesov pristup.
T-test s dva uzorka s nejednakim varijancama doista je jednak jednosmjernom ANOVA-i s dvije skupine.Možda ste mislili da t-test koji koristi korekciju za nejednake varijance (tj. Welch) nije isto što i jednosmjerna ANOVA koja nije ispravljena (premda zašto bi)?
#2
+21
Brett
2010-08-13 20:24:20 UTC
view on stackexchange narkive permalink

T-test je jednostavno poseban slučaj F-testa gdje se uspoređuju samo dvije skupine. Rezultat bilo kojeg od njih bit će potpuno jednak u smislu p-vrijednosti, a postoji i jednostavan odnos između F i t statistike. F = t ^ 2. Dva testa su algebarski ekvivalentna i njihove su pretpostavke iste.

U stvari, ove se ekvivalencije protežu na cijelu klasu ANOVA, t-testova i modela linearne regresije. T-test je poseban slučaj ANOVE. ANOVA je poseban slučaj regresije. Svi su ti postupci podvedeni pod Opći linearni model i dijele iste pretpostavke.

  1. Neovisnost opažanja.
  2. Normalnost reziduala = normalnost u svakoj skupini u posebnom slučaju .
  3. Jednake varijance ostataka = jednake varijance među skupinama u posebnom slučaju.

Možda ćete to smatrati normalnošću podataka, ali provjeravate postoji li normalnost u svakoj skupini - što je zapravo isto kao i provjera normalnosti u rezidualima kada je jedini prediktor u modelu pokazatelj grupe. Isto tako s jednakim varijantama.

Baš kao po strani, R nema zasebne rutine za ANOVA. Anova funkcije u R-u samo su omoti funkcije lm () - ista stvar koja se koristi za uklapanje u modele linearne regresije - upakirane malo drugačije kako bi pružile ono što se obično nalazi u sažetku ANOVA, a ne sažetku regresije. / p>

Bilo bi zainteresirano da znam kako uklopiti ANOVA modele s ponovljenim mjerama koristeći lm.
Pitanja kodiranja kategorijalnih varijabli, ekvivalencije regresije i ANOVA modela te regresijskog kodiranja za ponovljene mjere opisana su u ovom članku. http://dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/Wendorf2004a.pdf Evo citata ... Wendorf, C. A. (2004). Primer o kodiranju s višestrukom regresijom: Uobičajeni oblici i dodatni slučaj ponovljenih kontrasta. Razumijevanje statistike 3, 47-57.
@AndyF Nije `lm ()`, osim ako ne prijeđete na mješovite modele s paketom `nlme` ili` lme4`, ali postoji zgodan način za rukovanje ponovljenim mjerenjima kroz odgovarajuću specifikaciju izraza `Greška` u` aov () `, pogledajte više detalja o vodiču Baron & Li, §6.9, http://j.mp/c5ME4u
@AndyF `aov ()` je izgrađen na vrhu funkcije `lm ()`, ali uključuje dodatni argument, nazvan * Posebni * izrazi, poput `Pogreška`.
aov () je jednostavno omot za lm (). Izvodi neko kontrastno kodiranje iza kulisa i pakira rezultat u ANOVA stilu. Sve to modelira lm (). U članku na koji sam se gore pozvao, govori vam kako postaviti kodiranje za ponavljanje kontrasta u regresijskim modelima, uključujući lm ().
"Zapravo, ove se ekvivalencije protežu na cijelu klasu ANOVA, t-testova i modela linearne regresije. T-test je poseban slučaj ANOVE. ANOVA je poseban slučaj regresije. Svi su ti postupci podvedeni podOpći linearni model i dijele iste pretpostavke. "sjajan sažetak.tada je ANOVA općenitiji slučaj kada samo mi imamo više od dvije skupine.
#3
+17
Henrik
2010-08-13 17:24:12 UTC
view on stackexchange narkive permalink

Potpuno se slažem s Robovim odgovorom, ali dopustite mi da kažem drugačije (pomoću wikipedije):

Pretpostavke ANOVA:

  • Neovisnost slučajeva - ovo je pretpostavka modela koji pojednostavljuje statističku analizu.
  • Normalnost - raspodjela ostataka je normalna.
  • Jednakost (ili "homogenost") varijansi, nazvana homoscedastičnost

Pretpostavke t-test:

  • Svaka od dvije populacije koje se uspoređuju treba slijediti normalnu raspodjelu ...
  • ... dvije populacije koje se uspoređuju trebale bi imati istu varijansu ...
  • Podaci korišteni za provođenje testa trebali bi se uzorkovati neovisno o dvije populacije koje se uspoređuju.

Stoga bih pobio pitanje, jer očito imaju iste pretpostavke (premda u drugom redoslijedu :-)).

Vidi komentar Robu.
@Alexis Nisam siguran da razumijem vaše negativne glasove. Pažljivo razraditi.
Druga pretpostavka testa * t * nije istinita. Studentov izvorni rad pretpostavio je da je to, ali "nejednake varijance" dovoljno je česta pretpostavka u kasnijem tretiranju testa.
#4
+5
dsimcha
2011-02-04 07:30:00 UTC
view on stackexchange narkive permalink

Jedna očita stvar koju su svi previdjeli: s ANOVA-om testirate nulu da je srednja vrijednost identična bez obzira na vrijednosti vaših objašnjavajućih varijabli. T-testom možete testirati i jednostrani slučaj da je srednja vrijednost posebno veća s obzirom na jednu vrijednost vaše objašnjavajuće varijable nego na drugu.

Ako se ne varam, to NIJE razlika.Ako napravite ANOVA na dvije skupine, tada možete napraviti "jednostrani test" baš kao što možete i u t-testu."Jednostrani test" stavio sam u navodnike jer zapravo nema razlike u "testu" između "jednostranog testa" i "dvostranog testa".Jedina je razlika u tome kako tumačite statističku značajnost p-vrijednosti.Dakle, jednostrani i dvostrani "testovi" potpuno su isti "test".Samo je način ispravnog tumačenja rezultata različit.
#5
-4
syed
2013-01-08 21:26:46 UTC
view on stackexchange narkive permalink

Radije ću koristiti t-test za usporedbu dviju skupina, a ANOVA ću koristiti za više od 2 skupine, iz razloga. Važan razlog je pretpostavka jednakih varijanci.

Dobrodošli na stranicu, @syed. Možete li proširiti svoj odgovor? Na primjer, na koje "razloge" mislite? Imajte na umu da * i * t-test i ANOVA imaju jednake varijance.
Možete li razjasniti svoje obrazloženje?Nisam to mogao pratiti.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...