Pitanje:
Što je razlika u razlikama?
Graham Cookson
2010-07-23 21:57:50 UTC
view on stackexchange narkive permalink

Razlike u razlikama odavno su popularne kao neeksperimentalni alat, posebno u ekonomiji. Može li netko dati jasan i netehnički odgovor na sljedeća pitanja o razlici u razlikama.

Što je procjenjivač razlike u razlici?
Zašto je razlika u procjenitelj razlike koristi li se?
Možemo li zapravo vjerovati procjenama razlike u razlici?

Zna li netko kako procijeniti razliku u regresiji razlike u gretlu? Moram li raditi s OLS-om ili podacima s ploče?
@Pyca Tamo zvuči kao neprikladno korištenje komentara. Trebali biste objaviti novo pitanje, s osvrtom na ovo pitanje.
četiri odgovori:
#1
+69
Andy
2014-11-24 19:27:26 UTC
view on stackexchange narkive permalink

Što je razlika u procjenitelju razlika
Razlika u razlikama (DiD) alat je za procjenu učinaka liječenja uspoređujući razlike u ishodu liječenja prije i poslije liječenja i kontrolna skupina. Općenito nas zanima procjena učinka liječenja $ D_i $ (npr. Status sindikata, lijekovi itd.) Na ishod $ Y_i $ (npr. Plaće, zdravstvo itd.) Kao u $$ Y_ {it} = \ alpha_i + \ lambda_t + \ rho D_ {it} + X '_ {it} \ beta + \ epsilon_ {it} $$ gdje su $ \ alpha_i $ pojedinačni fiksni učinci (karakteristike pojedinaca koji se s vremenom ne mijenjaju), $ \ lambda_t $ su vremenski fiksni efekti, $ X_ {it} $ su vremenski kovarijante poput starosti pojedinaca, a $ \ epsilon_ {it} $ je izraz pogreške. Pojedinci i vrijeme indeksiraju se s $ i $, odnosno $ t $. Ako postoji korelacija između fiksnih efekata i $ D_ {it} $, tada će procjena ove regresije putem OLS-a biti pristrana s obzirom na to da fiksni efekti nisu kontrolirani. To je tipična izostavljena varijabilna pristranost.

Da bismo vidjeli učinak tretmana, željeli bismo znati razliku između osobe u svijetu u kojem je dobila tretman i one u kojem ona nema. Naravno, samo je jedan od njih ikad uočljiv u praksi. Stoga u ishodu tražimo ljude s istim trendovima prije liječenja. Pretpostavimo da imamo dva razdoblja $ t = 1, 2 $ i dvije skupine $ s = A, B $. Tada, pod pretpostavkom da bi se trendovi u liječenju i kontrolnim skupinama nastavili na isti način kao i prije u odsutnosti liječenja, možemo procijeniti učinak liječenja kao $$ \ rho = (E [Y_ {ist} | s = A, t = 2] - E [Y_ {ist} | s = A, t = 1]) - (E [Y_ {ist} | s = B, t = 2] - E [Y_ {ist} | s = B, t = 1]) $$

Grafički bi ovo izgledalo otprilike ovako: enter image description here

Ta sredstva možete jednostavno izračunati ručno, tj. dobiti srednji ishod grupe $ A $ u oba razdoblja i uzeti njihovu razliku. Zatim dobijte srednji ishod grupe $ B $ u oba razdoblja i uzmite njihovu razliku. Zatim uzmite razliku u razlikama i to je učinak liječenja. Međutim, prikladnije je to učiniti u okviru regresije jer vam to omogućava

  • kontrolu kovarijata
  • kako biste dobili standardne pogreške za učinak liječenja kako biste vidjeli je li to je značajno

Da biste to učinili, možete slijediti bilo koju od dvije ekvivalentne strategije. Generirajte lutku kontrolne grupe $ \ text {treat} _i $ koja je jednaka 1 ako je osoba u grupi $ A $, a inače 0, generirajte vremensku lutku $ \ text {time} _t $ koja je jednaka 1 ako $ t = 2 $ i 0 u suprotnom, a zatim regresirajte $$ Y_ {it} = \ beta_1 + \ beta_2 (\ text {treat} _i) + \ beta_3 (\ text {time} _t) + \ rho (\ text {poslastica } _i \ cdot \ text {time} _t) + \ epsilon_ {it} $$

Ili jednostavno generirate lutku $ T_ {it} $ koja je jednaka jedinici ako je osoba u grupi za liječenje I vremensko razdoblje je razdoblje nakon tretmana, a inače je nula. Tada biste regresirali $$ Y_ {it} = \ beta_1 \ gamma_s + \ beta_2 \ lambda_t + \ rho T_ {it} + \ epsilon_ {it} $$

gdje je $ \ gamma_s $ opet lutka za kontrolnu skupinu i $ \ lambda_t $ vremenske su lutke. Dvije regresije daju vam iste rezultate za dva razdoblja i dvije skupine. Druga je jednadžba ipak općenitija jer se lako proteže na više skupina i vremenskih razdoblja. U oba slučaja, ovo je način na koji možete procijeniti parametar razlike u razlikama na takav način da možete uključiti kontrolne varijable (izostavio sam ih iz gornjih jednadžbi da ih ne bih zatrpao, ali ih jednostavno mogu uvrstiti) i dobiti standardne pogreške za zaključivanje.

Zašto je korisna procjena razlika u razlikama?
Kao što je prethodno rečeno, DiD je metoda za procjenu učinaka liječenja s neeksperimentalnim podacima. To je najkorisnija značajka. DiD je također verzija procjene fiksnih efekata. Dok model fiksnih efekata pretpostavlja $ E (Y_ {0it} | i, t) = \ alpha_i + \ lambda_t $, DiD iznosi sličnu pretpostavku, ali na razini grupe, $ E (Y_ {0it} | s, t) = \ gamma_s + \ lambda_t $. Dakle, ovdje je očekivana vrijednost ishoda zbroj skupine i vremenski učinak. Pa u čemu je razlika? Za DiD vam nisu nužno potrebni podaci na ploči sve dok su vaši ponovljeni presjeci izvučeni iz iste agregatne jedinice $ s $. To čini DiD primjenjivim na širi niz podataka od standardnih modela fiksnih efekata koji zahtijevaju podatke na ploči.

Možemo li vjerovati razlikama u razlikama?
Najvažnija pretpostavka u DiD je pretpostavka paralelnih trendova (vidi gornju sliku). Nikada ne vjerujte studiji koja grafički ne prikazuje ove trendove! Radovi iz 1990-ih možda su se izvukli, ali danas je naše razumijevanje DiD-a puno bolje. Ako ne postoji uvjerljiv grafikon koji pokazuje paralelne trendove u ishodima prije liječenja za liječenje i kontrolne skupine, budite oprezni. Ako pretpostavka o paralelnim trendovima vrijedi i možemo vjerodostojno isključiti bilo kakve promjene vremenske varijante koje mogu zbuniti liječenje, tada je DiD pouzdana metoda.

Još jedna riječ opreza treba primijeniti kada je riječ o liječenje standardnih pogrešaka. S dugogodišnjim podacima trebate prilagoditi standardne pogreške za autokorelaciju. U prošlosti je to bilo zanemareno, ali od Bertrand i sur. (2004) "Koliko bismo trebali vjerovati procjenama razlika u razlikama?" znamo da je to problem. U radu pružaju nekoliko lijekova za rješavanje autokorelacije. Najlakše je grupirati se na pojedinačnom identifikatoru panela što omogućuje proizvoljnu korelaciju reziduala između pojedinih vremenskih serija. To ispravlja i autokorelaciju i heteroscedastičnost.

Za daljnje reference pogledajte ove bilješke predavanja Waldinger i Pischke.

#2
+6
Stephen Turner
2010-07-24 01:42:43 UTC
view on stackexchange narkive permalink

Wikipedia ima pristojan uvod o ovoj temi, ali zašto se ne bi koristila linearna regresija koja omogućava interakciju između vaših neovisnih varijabli od interesa? Ovo mi se čini više razumljivim. Tada biste mogli pročitati analizu jednostavnih kosina (u knjizi Cohen i dr. Besplatno na Google Books) ako su vaše varijable od interesa kvantitativne.

#3
  0
Carlos Dutra
2016-02-14 09:07:54 UTC
view on stackexchange narkive permalink

To je tehnika koja se široko koristi u ekonometriji za ispitivanje utjecaja bilo kojeg egzogenog događaja u vremenskom nizu. Odabirete dvije odvojene skupine podataka koje se odnose na prije i nakon proučenog događaja. Dobra referenca za saznanje više je knjiga Uvod u ekonometriju autora Wooldridgea.

Kao jezgrovit netehnički odgovor ovo je dodatak Andyjevom odgovoru, ali mislim da ne obuhvaća "Možemo li zapravo vjerovati procjenama razlike u razlici?"
#4
  0
New in Here
2018-11-17 03:59:44 UTC
view on stackexchange narkive permalink

Oprezno:

Vrijedne su pažnje dvije dodatne točke. Prvo, 80 od izvornih 92 rada iz DD imaju potencijalni problem s grupiranim terminima pogrešaka jer je jedinica promatranja detaljnija od razine varijacije (točka o kojoj su raspravljali Donald i Lang [2001]). Samo 36 ovih radova bavi se ovim problemom bilo grupiranjem standardnih pogrešaka ili agregiranjem podataka. Drugo, nekoliko tehnika se koristi (više ili manje neformalno) za rješavanje moguće endogenosti intervencijske varijable. Na primjer, tri rada uključuju zaostalu zavisnu varijablu u jednadžbi (1), sedam uključuje vremenski trend specifičan za tretirana stanja, petnaest ucrtava neke grafikone za ispitivanje dinamike učinka liječenja, tri ispituju postoji li "učinak" prije zakon, dvoje testiraju je li učinak trajan, a jedanaest formalno pokušava napraviti trostruke razlike (DDD) pronalaskom druge kontrolne skupine. U Bertrandu, Duflou i Mullainathanu [2002] pokazali smo da većina ovih tehnika ne ublažava probleme serijske korelacije.

(Bertrand, Duflo i Mullainathan 2004, 253)



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...