Pitanje:
Pod kojim uvjetima korelacija podrazumijeva uzročnost?
Rob Hyndman
2010-07-23 06:56:03 UTC
view on stackexchange narkive permalink

Svima nam je poznata mantra "korelacija ne podrazumijeva uzročnost" koja se ubraja u sve studente prve godine statistike. Postoji nekoliko lijepih primjera ovdje koji ilustriraju ideju.

Ali ponekad korelacija podrazumijeva uzročnost. Sljedeći je primjer preuzet s ove stranice Wikipedije

Na primjer, mogao bi se pokrenuti eksperiment na jednojajčanim blizancima za koje se znalo da na svojim testovima dosljedno dobivaju iste ocjene. Jedan blizanac poslan je na učenje šest sati, dok je drugi poslan u zabavni park. Ako bi se njihovi rezultati na testima odjednom u velikoj mjeri odvojili, to bi bio snažan dokaz da je proučavanje (ili odlazak u zabavni park) uzročno utjecalo na rezultate testova. U ovom bi slučaju korelacija između rezultata studija i testova gotovo sigurno podrazumijevala uzročnost.

Postoje li druge situacije u kojima korelacija podrazumijeva uzročnost?

Korelacija i snažni temeljni razlog veze povezuju uzročnost dok se drugačije ne dokaže vjerojatno najbolje što možete dobiti.
Nije li Karl Popper taj koji je rekao da čovjek ne može utvrditi uzročnost: znanstvene su teorije apstraktne prirode. Mogu se krivotvoriti i činjenica da potičemo poteškoće u falsificiranju nečega natjera nas na razmišljanje o uzročnosti ...
Zanimljiv kontra-primjer Jaynesa: Imamo deduktivni odnos "bez oblaka" podrazumijeva "bez kiše"; pa ipak, tko bi vjerovao da je "nema oblaka" fizički uzrok "nema kiše"?
Upotrijebimo drugačiji izraz od "implicirati", jer u rječniku njegova značenja uključuju i 1. Predloži i 2. Potrebno je (!)
Ima li blizanac taj primjer uopće smisla? Podrazumijeva se uzročnost da razlike između metoda / režima proučavanja uzrokuju razlike u rezultatima testa blizanaca. Ali to je uzorak jednog, pa čak i za velik uzorak, potreban je samo jedan skup blizanaca da bi imali suprotnu reakciju da razbiju hipotezu, stil crnog labuda ... @probabilityislogic: ima li koncept "nema oblaka" fizičko značenje? Ako da, onda ne vidim zašto drugi dio nije vjerodostojan.
@Rob Hyndman, gospodine, možete li molim vas odgovoriti na [moje pitanje] (https://stats.stackexchange.com/questions/459216/shouldnt-we-take-absolute-values-when-or-sign-indicates-only-direction-not).Radi se o korelaciji.Iznio sam detalje u pitanju.
@Rob Hyndman, u osnovi pod istim uvjetima na temelju kojih je moguće zaključiti uzročnost iz regresije.Neki donji odgovori su vrlo dobri, ali pogledajte ovdje mogu vam pomoći: https://stats.stackexchange.com/questions/377004/regression-and-causality-in-econometrics
šesnaest odgovori:
#1
+39
Hbar
2010-07-23 09:49:41 UTC
view on stackexchange narkive permalink

Korelacija nije dovoljna za uzročnost. Primjer Wikipedije može se zaobići zamišljajući da su ti blizanci uvijek varali na testovima imajući uređaj koji im daje odgovore. Blizanac koji ode u zabavni park izgubi uređaj, pa stoga i nizak stupanj.

Dobar način da se te stvari raščiste je razmišljati o strukturi Bayesove mreže koja možda generira izmjerene količine, učinio Pearl u svojoj knjizi Uzročnost . Njegova je osnovna poanta tražiti skrivene varijable. Ako postoji skrivena varijabla koja se slučajno ne mijenja u mjerenom uzorku, korelacija ne bi podrazumijevala uzročnost. Izložite sve skrivene varijable i imate uzročno-posljedičnu vezu.

Imam problema s razumijevanjem zašto smjerovi strelica u odgovarajućoj Bayesovoj mreži imaju bilo kakve veze s uzročno-posljedičnom povezanošću. Na primjer, A-> B i B-> A predstavljaju različite smjerove uzročnosti, ali Bayesove mreže za te dvije strukture jednake su
Nisu jednaki u slučaju intervencija.
Te Bayesove mreže ekvivalentne su u smislu da ako se uzmu uzorci s jedne od njih, ne možete reći koja je to bila
Ovaj ... nisam upoznat sa pravom statistikom iz daljine ... ali nije li "izlaganje svih skrivenih varijabli" po definiciji nemoguće? Kako znati kada više nema "skrivenih" varijabli?
@Craig To je poanta; nije moguće.
#2
+39
chl
2010-09-10 17:33:09 UTC
view on stackexchange narkive permalink

Samo ću dodati nekoliko dodatnih komentara o uzročnosti gledano iz epidemiološke perspektive . Većina ovih argumenata preuzete su iz Praktične psihijatrijske epidemiologije, autora Prince et al. (2003).

Uzročnost ili interpretacija uzročnosti , daleko su najteži aspekti epidemiološkog istraživanja. Studije kohorte i presjeka mogle bi, na primjer, dovesti do zbunjujućih učinaka. Citirajući S. Menarda ( Longitudinal Research , Sage University Paper 76, 1991), H.B. Asher u Uzročnom modeliranju (Sage, 1976.) u početku je predložio sljedeći niz kriterija koje treba ispuniti:

  • Dotični fenomeni ili varijable moraju biti kovarija, kao što je na primjer naznačeno razlikama između eksperimentalne i kontrolne skupine ili nula-korelacijom između dviju varijabli.
  • Odnos se ne smije pripisati bilo kojoj drugoj varijabli ili skupu varijabli, tj. ne smije biti lažan, već mora postojati čak kada se kontroliraju druge varijable, kao što je na primjer prikazano uspješnim nasumičnim odabirom u eksperimentalnom dizajnu (nema razlike između eksperimentalnih i kontrolnih skupina prije tretmana) ili ne-nultom djelomičnom korelacijom između dvije varijable s drugom varijablom koja je konstantna. > Pretpostavljeni uzrok mora prethoditi ili biti simultan s pretpostavljenim učinkom u vremenu, na što ukazuje promjena uzroka koja se javlja najkasnije do povezane promjene učinka.

Dok su prva dva kriteriji se lako mogu provjeriti pomoću studija presjeka ili vremenski poredanog presjeka, potonja se može procijeniti samo uzdužnim podacima, osim bioloških ili genetskih karakteristika za koje se vremenski poredak može pretpostaviti bez longitudinalnih podataka. Naravno, situacija postaje složenija u slučaju nerekurzivne uzročne veze.

Također mi se sviđa sljedeća ilustracija (poglavlje 13, u spomenutoj referenci) koja sažima pristup koji je objavio Hill (1965.) koji uključuje 9 različitih kriterija povezanih s uzročno-posljedičnim učinkom, kao što ih navodi @James. Izvorni je članak doista naslovljen "Okoliš i bolest: povezanost ili uzročnost?" ( PDF verzija).

Hill1965

Napokon, poglavlje 2. najpoznatije Rothmanove knjige, Moderna epidemiologija (1998. , Lippincott Williams & Wilkins, 2. izdanje), nudi vrlo cjelovitu raspravu o uzročno-posljedičnoj povezanosti i uzročnom zaključivanju, kako sa statističke tako i s filozofske perspektive.

Želio bih dodati sljedeće reference (grubo preuzete iz internetski tečaj iz epidemiologije) također su vrlo zanimljivi:

Konačno, ovaj pregled nudi širu perspektivu o uzročnom modeliranju, Uzročno zaključivanje u statistici: Pregled (J Pearl, SS 2009 (3)).

#3
+19
Graham Cookson
2010-07-23 21:49:47 UTC
view on stackexchange narkive permalink

U središtu vašeg pitanja je pitanje "kada je veza uzročna?" To ne treba biti samo korelacija koja podrazumijeva (ili ne) uzročnost.

Dobra knjiga na ovu temu nazvana je Uglavnom neškodljiva ekonometrija autora Johua Angrist i Jorn-Steffen Pischke. Oni polaze od eksperimentalnog ideala gdje smo na neki način u mogućnosti randomizirati "tretman" koji se proučava, a zatim prelaze na alternativne metode za generiranje ove randomizacije kako bi se povukli uzročni utjecaji. To započinje proučavanjem takozvanih prirodnih pokusa.

Jedan od prvih primjera prirodnog eksperimenta koji se koristi za identificiranje uzročno-posljedičnih veza je Angristov rad iz 1989. godine o "Životna zarada i nacrt lutrije doba Vijetnama". Ovaj rad pokušava procijeniti učinak vojne službe na doživotnu zaradu. Ključni problem procjene bilo kakvog uzročnog učinka je taj što će se vjerojatnije prijaviti određene vrste ljudi, što može biti pristrano u bilo kojem mjerenju odnosa. Angrist koristi prirodni eksperiment stvoren vijetnamskom lutrijom za učinkovito "nasumično dodjeljivanje" tretmana "vojne službe" grupi muškaraca.

Pa kad imamo uzročnost? U eksperimentalnim uvjetima. Kad se približimo? Pod prirodnim pokusima. Postoje i druge tehnike koje nas približavaju "uzročnosti", tj. Mnogo su bolje od jednostavnog korištenja statističke kontrole. Uključuju regresijski diskontinuitet, razlike u razlikama itd.

#4
+15
user88
2010-07-23 13:33:04 UTC
view on stackexchange narkive permalink

Postoji i problem sa suprotnim slučajem, kada se nedostatak korelacije koristi kao dokaz za nedostatak uzročnosti. Ovaj problem je nelinearnost; gledajući korelaciju, ljudi obično provjeravaju Pearsona, koji je samo vrh sante leda.

#5
+14
user28
2010-07-23 07:42:40 UTC
view on stackexchange narkive permalink

Vaš je primjer kontroliranog eksperimenta. Jedini drugi kontekst koji znam gdje korelacija može implicirati uzročnost je kontekst prirodnog eksperimenta.

U osnovi, prirodni eksperiment koristi prednost dodjele nekih ispitanika tretmanu koji se prirodno događa u stvarnom svijetu. Budući da eksperimentator ne kontrolira raspoređivanje ispitanika u tretmanske i kontrolne skupine, mjera u kojoj bi korelacija implicirala uzročnost je možda donekle slabija.

Pogledajte wiki poveznice za više informacija kontroliranih / prirodnih eksperimenata.

#6
+13
Jeromy Anglim
2010-07-23 11:17:57 UTC
view on stackexchange narkive permalink

Po mom mišljenju, APA Statistička radna skupina to je prilično dobro sažela

'' Utvrđivanje uzročnosti iz nerandomiziranih dizajna rizično je poduzeće. Istraživači koji koriste nerandomizirane dizajne imaju dodatnu obvezu objasniti logiku kovarijata uključenih u njihove dizajne i upozoriti čitatelja na vjerojatne suparničke hipoteze koje bi mogle objasniti njihove rezultate. Čak i u randomiziranim eksperimentima, pripisivanje uzročno-posljedičnih učinaka bilo kojem aspektu stanja liječenja zahtijeva podršku dodatnih eksperimentiranja. '' - APA Task Force

#7
+11
James Scott-Brown
2010-08-15 02:19:58 UTC
view on stackexchange narkive permalink

Obraćanje predsjednika Austina Bradford Hilla Kraljevskom medicinskom društvu ( Okoliš i bolesti: udruživanje ili uzročnost?) objašnjava devet kriterija koji pomažu u prosudbi postoji li uzročno-posljedična veza između dva korelirana ili pridružene varijable.

Oni su:

  1. Snaga asocijacije
  2. Dosljednost: "da li su je više puta promatrale različite osobe, ravnodušna mjesta, okolnosti i vremena ? "
  3. Specifičnost
  4. Privremenost: "koja je kolica, a koji konj?" - uzrok mora prethoditi učinku
  5. Biološki gradijent (krivulja doza-odgovor) - na koji način veličina učinka ovisi o veličini (sumnjive) uzročne varijable?
  6. Uvjerljivost - postoji li vjerovatno objašnjenje za uzročnost?
  7. Usklađenost - bi li uzročnost proturječila ostalim utvrđenim činjenicama?
  8. Eksperiment - utječe li eksperimentalna manipulacija (sumnjive) uzročne varijable na (sumnjivu) ovisnu varijablu
  9. Analogija - u prošlosti smo se susretali sa sličnim uzročnim vezama?
#8
+9
Thylacoleo
2010-08-04 13:39:22 UTC
view on stackexchange narkive permalink

U primjeru blizanaca nije samo korelacija ono što sugerira uzročnost, već i povezane informacije ili prethodno znanje.

Pretpostavimo da dodam još jedan podatak. Pretpostavimo da je marljivi blizanac proveo 6 sati učeći za ispit iz statistike, ali zbog nesretne pogreške ispit je bio u povijesti. Bi li i dalje zaključili da je studija uzrok superiorne izvedbe?

Određivanje uzročnosti jednako je filozofsko pitanje koliko i znanstveno, pa otuda i tendencija pozivanja na filozofe poput Davida Humea i Karla Poppera kad je uzročnost raspravljali.

Nije iznenađujuće što je medicina značajno doprinijela uspostavljanju uzročnosti putem heuristike, poput Kochovih postulata za utvrđivanje uzročno-posljedične veze između mikroba i bolesti. Oni su prošireni na "molekularne Kochove postulate" potrebne da bi se pokazalo da gen u patogenu kodira proizvod koji doprinosi bolesti uzrokovanoj patogenom.

Nažalost, ne mogu postavljati hiperveze navodno ZATO što sam novi korisnik (nije točno) i nemam dovoljno "bodova reputacije". Pravi je razlog bilo tko nagađati.

#9
+9
Andi F
2010-08-13 20:21:55 UTC
view on stackexchange narkive permalink

Korelacija sama po sebi nikada ne podrazumijeva uzročnost. To je tako jednostavno.

Ali vrlo je rijetko imati samo korelaciju između dvije varijable. Često također znate nešto o tome što su te varijable i teorija ili teorije, sugerirajući zašto između varijabli može postojati uzročno-posljedična veza. Ako ne, onda se mučimo provjeriti korelaciju? (Međutim, ljudi koji vade masovne matrice korelacije za značajne rezultate često nemaju slučajnu teoriju - inače, zašto se mučiti s rudarstvom. Protuargument tome je da je često potrebno neko istraživanje kako bi se dobile ideje za slučajne teorije. I tako dalje i tako dalje ...)

Odgovor na uobičajenu kritiku "Da, ali to je samo korelacija: ne podrazumijeva uzročnost":

  1. Za ležernu vezu korelacija je neophodna. Ponovljeni neuspjeh u pronalaženju korelacije zaista bi bila loša vijest.
  2. Nisam vam dao samo korelaciju.
  3. Zatim nastavite objašnjavati moguće uzročne mehanizme koji objašnjavaju korelaciju .. .
Suprotni primjer vašoj točki # 1: u kaotičnom sustavu mogli biste imati uzročnost bez očite korelacije.
#10
+8
Łukasz Lew
2010-07-23 23:29:41 UTC
view on stackexchange narkive permalink

Jedan koristan dovoljan uvjet za neke definicije uzročnosti:

Uzročnost se može zatražiti kada se može kontrolirati jedna od koreliranih varijabli (možemo izravno postaviti njezinu vrijednost), a korelacija je i dalje prisutna.

Mogao bi upotrijebiti i Pearlovu riječ za "izravno postavljanje vrijednosti [varijable]": intervencija.
#11
+8
Wojtek
2010-08-02 22:05:49 UTC
view on stackexchange narkive permalink
  1. Gotovo uvijek u randomiziranim pokusima
  2. Gotovo uvijek u promatračkom istraživanju kada netko mjeri sve konfundere (gotovo nikad)
  3. Ponekad kada netko mjeri neke kontunktor (IC * algoritam Otkrivanje DAG-a u Pearlovoj knjizi Uzročnost)
  4. U ne-gausovim linearnim modelima s dvije ili više varijabli, ali bez korištenja korelacije kao mjere odnosa ( LiNGAM)

Većina algoritama otkrivanja implementirana je u Tetrad IV

#12
+6
Yaroslav Bulatov
2010-08-15 05:35:01 UTC
view on stackexchange narkive permalink

Srodno pitanje moglo bi biti - pod kojim uvjetima možete pouzdano izvući uzročno-posljedične veze iz podataka?

radionica NIPS-a za 2008. pokušati empirijski riješiti to pitanje. Jedan od zadataka bio je zaključiti smjer kauzalnosti iz promatranja parova varijabli gdje je poznato da jedna varijabla uzrokuje drugu, a najbolja metoda uspjela je ispravno izvući uzročni smjer u 80% slučajeva.

#13
+3
ars
2010-07-23 07:00:12 UTC
view on stackexchange narkive permalink

Gotovo sigurno u dobro osmišljenom eksperimentu. (Dizajniran, naravno, da izazove takvu povezanost.)

#14
+3
hungh3
2010-09-03 11:03:54 UTC
view on stackexchange narkive permalink

Pretpostavimo da mislimo da je faktor A uzrok pojave B. Tada ga pokušavamo varirati kako bismo vidjeli mijenja li se B. Ako se B ne promijeni i ako možemo pretpostaviti da je sve ostalo nepromijenjeno, snažni dokazi da A nije uzrok B. Ako se B ipak promijeni, ne možemo zaključiti da je A uzrok jer je promjena A mogla uzrokovati promjena stvarne uzročnosti C, zbog čega se B promijenila.

Možete li napraviti varijablu A?
#15
+2
Glenn Charles
2015-08-30 00:39:59 UTC
view on stackexchange narkive permalink

Primijetio sam da se ovdje koristio 'dokaz' kada se raspravljalo o empirijskoj paradigmi. Ne postoji takva stvar. Prvo dolazi hipoteza, gdje je ideja napredna; zatim dolazi testiranje, pod "kontroliranim uvjetima" [napomena a] i ako se nađe "dovoljan" nedostatak otpora , napreduje u fazu hipoteze ... razdoblja. Nema dokaza, osim ako netko može 1) uspjeti biti pri svakoj pojavi spomenutog događaja [napomena b] i naravno 2) utvrditi uzročnost. 1) je nevjerojatan u beskonačnom svemiru [napomena da se beskonačnost po prirodi ne može dokazati]. Napomena A; ne poduzima se eksperiment u potpuno kontroliranim uvjetima i što su kontroliraniji uvjeti to je manja sličnost s vanjskim svemirom s naizgled beskonačnim linijama uzroka. Napomena b; pazite, rečeni događaj morali ste savršeno opisati, što vjerojatno znači savršeno ispravan jezik = vjerojatno nije ljudski jezik. Za kraj, svi uzroci vjerojatno se vraćaju na Prvi događaj. Sad idi razgovarati sa svima s teorijom. Da, studirao sam formalno i neformalno. Na kraju; ne, blizina ne podrazumijeva uzročno-posljedičnu vezu, pa čak ni ništa drugo osim privremene povezanosti. Vremenski raspon planine (s obzirom na to da su živi; dokažite da nisu) i stoga percepcija ... nije percepcija (wo) čovjeka.

#16
+1
user172578
2017-08-06 05:54:09 UTC
view on stackexchange narkive permalink

Ako želite utvrditi uzrokuje li $ X $ $ Y $, i pokrenete regresiju

$ Y = bX + u $

Tada je $ b $ nepristrani procjenitelj učinka causal od $ X $ na $ Y $ (to je $ \ mathrm {E} (b) = B $) ako i samo ako nema korelacije između $ X$ i $ u $, to jest $ \ mathrm {E} (u | X) = 0 $.To je zato što $ u $ možemo smatrati d bilo čega drugog što uzrokuje $ Y $.Dakle, ako vrijedi ova pretpostavka, b je nepristrana procjena učinka $ X $ na $ Y $ ceteris paribus (u ostalim okolnostima).

Nepristranost je poželjno svojstvo procjenitelja, ali željeli biste i da vaš procjenitelj bude učinkovit (mala varijanca) i dosljedan (vjerojatnost teži istinskoj vrijednosti).Vidi Gauss-Markovljeve pretpostavke.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...