Pitanje:
Podrazumijeva li jednostavna linearna regresija uzročnost?
user4572
2011-05-12 04:05:00 UTC
view on stackexchange narkive permalink

Znam da korelacija ne podrazumijeva uzročnost, već snagu i smjer veze. Podrazumijeva li jednostavna linearna regresija uzročnost? Ili je za to potreban inferencijalni (t-test, itd.) Statistički test?

Što podrazumijevate pod "smjernicom"? Jeste li pročitali odgovore na slična pitanja http://stats.stackexchange.com/search?q=causal? Kratki odgovor je negativan!
Nijedan od vaših prijedloga ne implicira uzročnost (ili smjer).
Mislim da je OP značio "smjer" u smislu pozitivne nasuprot negativne korelacije, a ne smjer bilo kakve uzročne veze između X i Y.
Sedam odgovori:
bill_080
2011-05-12 04:44:01 UTC
view on stackexchange narkive permalink

Brzi odgovor je, ne. Možete lako doći do nepovezanih podataka koji će, kad se povuku, proći sve vrste statističkih testova. Ispod je stara slika s Wikipedije (koja je iz nekog razloga nedavno uklonjena) koja je korištena za ilustraciju "uzročnosti" na temelju podataka.

Treba nam više pirata za hlađenje planeta?

enter image description here

Za vremenske serije postoji izraz nazvan "Granger-ova uzročnost" koji ima vrlo određeno značenje.

http://en.wikipedia.org/wiki/Granger_causality

Osim toga, "uzročnost" je u očima promatrač.

Mislio sam na pozitivnu korelaciju ili negativnu prema smjeru. Hvala na odgovoru i poveznici na slična pitanja.
To je prilično luda X os na toj slici! (Ali dobar primjer!)
Još jedan ..... Sir, Maslac i Ovce u Bangladešu, naspram S & P500 (R ^ 2 = 0,99) ...... http://nerdsonwallstreet.typepad.com/my_weblog/files/dataminejune_2000.pdf .. ..
Taj je graf * očito * zastario. Ili to ili postoji pristranost zbog nedostatka geodeta dostupnih za uzorkovanje u [Adenskom zaljevu] (http://en.wikipedia.org/wiki/Gulf_of_Aden)
Ti su podaci bili prije nego što je Al Gore postao gusar.
Andy W
2011-05-12 10:15:59 UTC
view on stackexchange narkive permalink

U matematičkoj regresiji ne postoji ništa izričito što navodi uzročno-posljedične veze, pa stoga ne treba izričito tumačiti nagib (snagu i smjer) niti p-vrijednosti (tj. vjerojatnost da bi veza bila jaka ili jača promatrano ako je odnos u populaciji nula) na uzročni način.

S obzirom na to, rekao bih da regresija ima puno jaču konotaciju da se procjenjuje eksplicitni smjerni odnos nego što se procjenjuje korelacija između dvije varijable. Pod pretpostavkom da pod korelacijom mislite Pearsonov r, obično nema izričitu uzročnu interpretaciju jer je metrika simetrična (tj. Možete promijeniti koja je varijabla X, a koja Y i imat ćete i dalje istu mjeru ). Također je kolokvijalnost "Korelacija ne podrazumijeva uzročno-posljedičnu povezanost" pretpostavljam da je toliko poznata da je navođenje dvije varijable u korelaciji pod pretpostavkom da jedna ne daje uzročnu izjavu.

Procijenjeni učinci u regresiji analiza ipak nije simetrična, pa odabirom varijable s desne nasuprot lijeve strane daje se implicitna izjava za razliku od korelacije. Pretpostavljam da se u velikoj većini okolnosti u kojima se koristi regresija (uz zaključivanje i predviđanje na stranu) namjerava dati neka uzročna izjava. Čak i u slučajevima jednostavnog navođenja korelacija, pretpostavljam da ljudi često imaju na umu neke implicirane ciljeve uzročnog zaključivanja. S obzirom da su ispunjena neka ograničenja korelacija može implicirati uzročnost!

DQdlM
2011-05-12 16:56:46 UTC
view on stackexchange narkive permalink

Ni korelacija ni regresija ne mogu ukazivati ​​na uzročnost (kao što ilustrira odgovor @ bill_080), ali kako @Andy W ukazuje, regresija se često temelji na izričito fiksnoj (tj. neovisnoj) varijabli i eksplicitnoj (tj. slučajnoj) ovisnoj varijabli. Ove oznake nisu prikladne u korelacijskoj analizi.

Za citiranje Sokal i Rohlf, 1969, str. 496

"U regresiji namjeravamo opisati ovisnost varijable Y o neovisnoj varijabli X ... kako bismo pružili podršku hipoteze u vezi s mogućim uzrokom promjena u Y promjenama u X..."

"U korelaciji nas, nasuprot tome, uglavnom zanima dvije su varijable međusobno ovisne ili kovarijske - odnosno variraju zajedno. Jednu ne izražavamo u funkciji druge. "

Sokal, RR i FJ Rohlf , 1969. Biometrija. Freeman i Co.

b_dev
2011-05-12 23:16:47 UTC
view on stackexchange narkive permalink

Iz semantičke perspektive, alternativni je cilj stvoriti dokaze za dobar prediktivni model umjesto dokazivanja uzročnosti. Jednostavan postupak za prikupljanje dokaza za prediktivnu vrijednost regresijskog modela jest podijeliti podatke u dva dijela i prilagoditi vašu regresiju jednim dijelom podataka, a drugim dijelom testa podataka koliko dobro predviđa.

Zanimljiv je pojam Granger-ove uzročnosti.

Alfred Beit
2019-12-16 17:29:59 UTC
view on stackexchange narkive permalink

Ako mislite na regresijske koeficijente: $$ \ hat {\ beta} = \ frac {Cov (x, y)} {Var (x)} $$ $$ \ hat {\ alpha} = \ bar {y} - \ hat {\ beta} \ bar {x}, $$

gdje su Var (.) i Cov (.) procjene iz uzorka (podataka).

Prema tome, sami ti parametri nisu ništa drugo do neke funkcije korelacije između x i y. Pogotovo je beta samo "normalizirani" koeficijent korelacije. Dakle, tu ništa više nije implicirana uzročnost u regresiji nego u korelaciji. Uzročna regresija posebna je tehnika u ekonometriji gdje bi se trebalo osloniti na na pr. instrumentalne varijable kako bi se zaobišle ​​pojave poput zbunjivanja koje zaklanjaju uzročno-posljedičnu interpretaciju bilo kojeg određenog modela regresije.

Moja poanta je: regresija se može uzrokovati uzročnom, ali nije uzročno zadana.

Za više pogledajte ove videozapise: https://www.youtube.com/watch?v=Sqy_b5OSiXw&list=PLwJRxp3blEvaxmHgI2iOzNP6KGLSyd4dz&index=55&t=0s

"Rubinov model" samog Rubina: http://www.stat.columbia.edu/~cook/qr33.pdf

Sjajan uvodni tečaj o uzročnosti (doduše, još nema regresije): https://www.coursera.org/learn/crash-course-in-causality

Dobri bodovi.Dobrodošli u CV.
mlstudent
2019-03-03 12:11:02 UTC
view on stackexchange narkive permalink

Moje razumijevanje (početnik sam uzročnosti) je sljedeće:

  • Linearna regresija podrazumijeva uzročnost ako su vaše kovarijate iz kontroliranog eksperimenta, a vaš eksperiment dobro izolira pretpostavljeni uzročni faktor (pogledajte Linearna regresija i uzročnost u randomiziranom kontroliranom eksperimentu).

  • Alternativno, (ažurirano zahvaljujući komentarima), mnoga kršenja uzročnosti dovode do $ E (\ epsilon | X) \ neq 0 $ .Imajte na umu da $ E (\ epsilon | X) \ neq 0 $ znači da ne možemo donijeti uzročno-posljedične zaključke, ali $E (\ epsilon | X) = 0 $ ne znači da možemo.

Imajte na umu da ne možemo provjeriti je li $ E (\ epsilon | X) = 0 $ , a ovdje ima nekih cirkularnosti u argumentima.

Možete li objasniti kako $ E (\ epsilon | X) = 0 $ podrazumijeva uzročnost?
Pogledajte ovo za detaljnu raspravu https://stats.stackexchange.com/questions/59588/what-do-endogeneity-and-exogeneity-mean-substantivno, uz neke lijepe točke.
možete li biti malo izravniji.Ne vidim dokaz ili objašnjenje kako i zašto $ E (\ epsilon | X) = 0 $ podrazumijeva uzročnost.
Pomalo sam nov u kauzalnosti, ali koliko razumijem, postoje tri glavne zabrinutosti zbog kojih $ y = \ alpha + \ beta x + \ epsilon $ ne može implicirati kauzalnost.Jedna je ako postoji neka druga izostavljena varijabla koja uzrokuje $ y $, druga je ako postoji izostavljena varijabla koja uzrokuje $ x $, i na kraju treća je da $ y $ može uzrokovati $ x $.Sve će dovesti do kršenja uvjeta egzogenosti.Nemam matematiku točno zašto, ali ovo ću zapravo potražiti / pokušati izvesti.
Jednostavan kontra primjer.Kada generirate podatke $ Y \ sim N (\ mu_Y, \ sigma_Y) $ i $ X | Y \ sim N (a + bY, \ sigma_X) $, tada još uvijek imate $ E (\ epsilon | X) = 0 $ (X i Y su zajednički normalno raspoređeni).
Jesi li siguran u vezi toga?Možete li navesti više detalja?Ako imamo $ E (\ epsilon | X) = 0 $, prema iteriranim očekivanjima imamo i $ E (\ epsilon_i) = 0 $ i $ Cov (E (\ epsilon_i | X), X) = 0 $, ali uizgleda da ćemo imati vašu kovarijanciju između $ \ epsilon $ i $ X $, a koja nije nula
$ X | Y \ sim N (a + bY, \ sigma_X) $ možete zamijeniti s $ X = a + bY + \ epsilon $ s $ \ epsilon \ sim N (0, \ sigma_X) $ i $ Y \ perp \! \! \!\ perp \ epsilon $.Dakle, X je zbroj dviju neovisnih normalno distribuiranih varijabli.To čini parove $ X, Y $ zajednički bivarijatnim normalno distribuiranima.Ova je situacija simetrična (ista raspodjela može se opisati inverziranjem smjera uzroka, tj. Opisati $ Y $ kao $ Y = a ^ \ prime + b ^ \ prime X + \ epsilon ^ \ prime $ i $ X \ perp\! \! \! \ perp \ epsilon ^ \ prime $).
Dopustite nam [nastaviti ovu raspravu u chatu] (https://chat.stackexchange.com/rooms/90525/discussion-between-mlstudent-and-martijn-weterings).
Gary Jakacky
2015-01-20 07:18:54 UTC
view on stackexchange narkive permalink

Regresija PRETPOSTAVLJA uzročno-posljedičnu vezu .... ako ne postoji osnova za uzročnost kao rezultat fizičke / intelektualne / znanstvene analize problema, ne postoji osnova za uzročnu analizu i osnova za regresiju. Zbog toga FDA i slične vladine agencije uvijek izgovaraju "Ovo uzrokuje!" da bi ga kasnije povukao godinama i milijardama dolara štete. Primjeri su legiona: kava, čokolada, kofein, slanina, jaja itd.

Još je gore kada dvije varijable imaju povratnu spregu. Jedno u jednom trenutku može uzrokovati drugo; samo da bi drugi uzrokovao jedan, kasnije. To se uvijek događa u mom području ekonomije: zbog toga većina ekonomskih analiza nije vrijedna papira na kojem je tiskana.

Ovo je potpuno pogrešno.Regresija samo pronalazi vezu između dva skupa brojeva.Postoji li taj odnos zbog izravne uzročne veze ili ne, sasvim je drugo pitanje.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...