Pitanje:
Kada je u linearnoj regresiji prikladno koristiti dnevnik neovisne varijable umjesto stvarnih vrijednosti?
d_2
2010-07-20 18:11:50 UTC
view on stackexchange narkive permalink

Tražim li distribuciju s boljim ponašanjem za dotičnu neovisnu varijablu, ili da smanjim učinak odstupanja ili nešto drugo?

Pitate li kako smanjiti učinak izvanrednih vrijednosti ili kada koristiti zapisnik neke varijable?
Mislim da OP kaže "Čuo sam za ljude koji koriste zapise o ulaznim varijablama: zašto to rade?"
Zašto baš trupac? Ne bi li se ovo pitanje trebalo primijeniti na bilo koju tehniku ​​transformacije podataka koja se može koristiti za smanjivanje ostataka povezanih s mx + b?
@AsymLabs - Dnevnik može biti poseban u regresiji, jer je jedina funkcija koja pretvara proizvod u zbroj.
Upozorenje čitateljima: Pitanje se postavlja o transformiranju IV-a, ali čini se da neki od odgovora govore o razlozima za transformaciju DV-a.Ne zavaravajte se da su to također razlozi za preobrazbu IV-a - neki to mogu biti, drugi sigurno nisu.Konkretno, raspodjela IV nije općenito od značaja (uistinu, nije ni marginalna raspodjela DV).
Osam odgovori:
#1
+184
whuber
2010-10-12 23:59:34 UTC
view on stackexchange narkive permalink

Uvijek se ustručavam uskočiti u nit s toliko izvrsnih odgovora kao što je ovaj, ali čini mi se da malo koji od odgovora daje bilo kakav razlog da se logaritam više voli nego neka druga transformacija koja "zgužva" podatke, poput korijena ili uzajamno.

Prije nego što dođemo do toga, idemo rekapitulirati mudrost iz postojećih odgovora na općenitiji način. Neki nelinearni ponovni izraz ovisne varijable naznačen je kada se primjenjuje bilo što od sljedećeg:

  • Preostali dijelovi imaju iskrivljenu raspodjelu. Svrha transformacije je dobiti ostatke koji su približno simetrično raspoređeni (oko nule, naravno).

  • Širenje ostataka sustavno se mijenja s vrijednostima zavisne varijable ("heteroscedastičnost"). Svrha je transformacije ukloniti tu sustavnu promjenu širenja, postižući približnu "homoscedastičnost".

  • Lineariziranje odnosa.

  • Kad znanstvena teorija ukazuje. Na primjer, kemija često predlaže da se koncentracije izraze kao logaritmi (davanje aktivnosti ili čak dobro poznati pH).

  • Kad nebuloznija statistička teorija sugerira da ostaci odražavaju "slučajne pogreške" koji se ne akumuliraju aditivno.

  • Da pojednostavimo model. Na primjer, ponekad logaritam može pojednostaviti broj i složenost izraza "interakcija".

(Te se indikacije mogu međusobno sukobljavati; u takvim je slučajevima potrebna prosudba. )

Dakle, kada je logaritam posebno naznačen umjesto neke druge transformacije?

  • Preostali ostaci imaju "jako" pozitivno iskrivljenu raspodjelu. U svojoj knjizi o EDA, John Tukey nudi kvantitativne načine za procjenu transformacije (unutar obitelji Box-Cox, ili transformacije moći) na temelju statistike ranga reziduala. Doista se svodi na činjenicu da je uzimanje dnevnika simetriziralo ostatke, vjerojatno to bio pravi oblik ponovnog izražavanja; u suprotnom je potreban neki drugi ponovni izraz.

  • Kad je SD reziduala izravno proporcionalan ugrađenim vrijednostima (a ne nekoj snazi ​​uklopljenih vrijednosti).

  • Kada je veza bliska eksponencijalnoj.

  • Kad se vjeruje da rezidualni elementi odražavaju multiplikativno gomilajuće pogreške.

  • Zaista želite model u kojem se rubne promjene u objašnjenim varijablama tumače u smislu multiplikativnih (postotnih) promjena u zavisnoj varijabli.

Konačno, nekoliko ne - razloga za upotrebu ponovnog izraza :

  • Izrada izvanrednih rezultata ne izgleda kao odstupanja. Izuzetak je podatak koji ne odgovara nekom štetnom, relativno jednostavnom opisu podataka. Promjena nečijeg opisa kako bi outliersi izgledali bolje obično je netočno preokretanje prioriteta: prvo pribavite znanstveno valjani, statistički dobar opis podataka, a zatim istražite bilo koje odstupanja. Ne dopustite da povremeni odbacivači odrede kako će opisati ostatak podataka!

  • Jer softver je to automatski učinio. (Dosta je rečeno!)

  • Budući da su svi podaci pozitivni. (Pozitivnost često podrazumijeva pozitivan iskorak, ali ne mora. Nadalje, druge transformacije mogu raditi bolje. Na primjer, korijen često najbolje radi s prebrojanim podacima.)

  • Za čine da se "loši" podaci (možda niske kvalitete) čine dobro ponašanju.

  • Da biste mogli crtati podatke. (Ako je transformacija potrebna da bi se podaci mogli nacrtati, vjerojatno je potrebna iz jednog ili više već spomenutih dobrih razloga. Ako je jedini razlog transformacije uistinu crtanje, samo naprijed i učinite to - ali samo za ucrtavanje podataka. Ostavite podatke nepreobraženi za analizu.)

Što je s varijablama poput gustoće naseljenosti u regiji ili omjera djece i učitelja za svaki školski okrug ili broja ubojstava na 1000 stanovnika? Vidio sam kako profesori uzimaju zapisnik ovih varijabli. Nije mi jasno zašto. Na primjer, nije li stopa ubojstava već postotak? Zapisnik bi mijenjao postotak u postotku? Zašto bi se preferirao dnevnik odnosa djece i učitelja? Treba li se transformacija dnevnika uzeti za svaku kontinuiranu varijablu kad ne postoji temeljna teorija o istinskom funkcionalnom obliku?
@J G Mali omjeri obično imaju iskrivljene raspodjele; logaritmi i korijeni vjerojatno će ih učiniti simetričnijima. Ne razumijem vaša pitanja vezana uz postotke: možda povezujete različite upotrebe postotaka (jedan da izrazi nešto kao udio u cjelini, a drugi da izrazi relativnu promjenu)? Ne vjerujem da sam išta napisao zagovarajući da se logaritmi uvijek primjenjuju - daleko od toga! Dakle, ne razumijem osnovu za vaše posljednje pitanje.
"Kad se vjeruje da reziduali odražavaju multiplicirajuće gomilajuće pogreške."Imam problema s tumačenjem ove fraze.Je li moguće to malo raščlaniti s još jednu ili dvije rečenice?Na koju akumulaciju mislite?
@user1690130 za omjere i gustoće, ovi bi se općenito trebali prilagoditi raspodjeli obitelji poissona za brojanja s pomakom za izloženost.Npr.broj ljudi je broj, a pomak je područje regije.Pogledajte ovo pitanje za dobro objašnjenje - https://stats.stackexchange.com/questions/11182/when-to-use-an-offset-in-a-poisson-regression
@Hatshepsut jednostavan primjer multiplikativno gomilanja pogrešaka bio bi volumen kao ovisna varijabla i pogreške u mjerenjima svake linearne dimenzije.
Imajte na umu da ovaj odgovor opravdava pretvaranje objašnjenih varijabli kako bi statistički model bio valjan (s bolje raspodijeljenim ostacima), ali imajte na umu da će ove transformacije utjecati na hipoteze koje testirate s ovim modelom: na primjer, testiranje efekta transformiranog u dnevnikprediktora na odgovor nije isto što i testiranje njegovog ne transformiranog, linearnog učinka na taj odgovor.
#2
+80
Graham Cookson
2010-07-23 19:43:14 UTC
view on stackexchange narkive permalink

Uvijek kažem studentima da postoje tri razloga za transformiranje varijable uzimanjem prirodnog logaritma. Razlog zapisivanja varijable odredit će želite li evidentirati neovisne varijable, ovisne ili oboje. Da budem jasan kroz cijelo vrijeme, govorim o uzimanju prirodnog logaritma.

Prvo, radi poboljšanja uklapanja modela kao što su primijetili i drugi plakati. Na primjer, ako se vaši reziduali obično ne distribuiraju, uzimanje logaritma iskrivljene varijable može poboljšati prilagodbu mijenjanjem ljestvice i čineći varijablu "normalno" distribuiranom. Primjerice, zarada je skraćena na nuli i često pokazuje pozitivan iskorak. Ako varijabla ima negativni iskorak, prvo biste mogli invertirati varijablu prije nego što uzmete logaritam. Ovdje posebno mislim na Likertove ljestvice koje se unose kao kontinuirane varijable. Iako se to obično odnosi na ovisnu varijablu, povremeno imate problema s rezidualima (npr. Heteroscedastičnost) uzrokovane neovisnom varijablom koja se ponekad može ispraviti uzimanjem logaritma te varijable. Na primjer, kada je pokrenut model koji je objašnjavao ocjene predavača na skupu predavača i kovarijacije varijable "veličina predavanja" (tj. Broj učenika na predavanju) imali su izvanredne vrijednosti koje su inducirale heteroskedastičnost, jer je varijansa u ocjenama predavača bila manja u većim kohorte nego manje kohorte. Zapisivanje studentske varijable pomoglo bi, iako u ovom primjeru ili izračunavanje robusnih standardnih pogrešaka ili korištenje ponderiranih najmanjih kvadrata može olakšati tumačenje.

Drugi razlog za bilježenje jedne ili više varijabli u modelu je interpretacija. To nazivam razlogom pogodnosti. Ako prijavite i ovisne (Y) i neovisne (X) varijable, vaši koeficijenti regresije ($ \ beta $) bit će elastični, a interpretacija će ići na sljedeći način: povećanje X za 1% dovelo bi do ceteris paribus $ \ beta $% porast Y (u prosjeku). Zapisivanje samo jedne strane regresijske "jednadžbe" dovelo bi do alternativnih interpretacija kako je navedeno u nastavku:

Y i X - povećanje jedinice X za jednu jedinicu dovelo bi do $ \ beta $ povećanja / smanjenja Y

Log Y i Log X - povećanje X za 1% dovelo bi do $ \ beta $% povećanja / smanjenja Y

Log Y i X - jedna jedinica povećanje X-a dovelo bi do $ \ beta * 100% -tnog povećanja / smanjenja Y

Y i Log X - porast X-a od 1% dovelo bi do $ \ beta / 100 $ povećanja / smanjenje Y

I konačno, za to bi mogao postojati teoretski razlog. Na primjer, neki modeli koje bismo željeli procijeniti multiplikativni su i stoga nelinearni. Uzimanje logaritama omogućuje procjenu ovih modela linearnom regresijom. Dobri primjeri za to uključuju Cobb-Douglasovu proizvodnu funkciju u ekonomiji i Mincer jednadžbu u obrazovanju. Funkcija proizvodnje Cobb-Douglasa objašnjava kako se ulazi pretvaraju u izlaze:

$$ Y = AL ^ \ alpha K ^ \ beta $$

gdje

$ Y $ je ukupna proizvodnja ili proizvodnja nekog entiteta, npr firma, poljoprivredno gospodarstvo itd.

$ A $ je ukupna faktorska produktivnost (promjena u proizvodnji koja nije uzrokovana ulaznim podacima, npr. promjenom tehnologije ili vremenskim prilikama)

$ L $ je ulaganje rada

$ K $ je ulaganje kapitala

$ \ alpha $ & $ \ beta $ su izlazne elastičnosti.

Uzimanje logaritama ovoga čini funkciju lako procijeniti pomoću OLS linearne regresije kao takve:

$$ \ log (Y) = \ log (A) + \ alpha \ log (L) + \ beta \ log (K) $$

"Log Y i X - povećanje jedinice X za jednu jedinicu dovelo bi do β ∗ 100% povećanja / smanjenja Y": Mislim da se to odnosi samo kada je β malen tako da exp (β) ≈ 1 + β
lijepo i jasno hvala! Jedno pitanje, kako tumačite presretanja u slučaju Log Y i X? i općenito me muči kako prijaviti regresije transformirane u dnevnik ...
Ja sam naivčina za odgovore koji sadrže primjere iz ekonomije ["Imali ste me na '** Cobb-Douglasovoj proizvodnoj funkciji **'"] .... Ipak, jedno bi trebalo promijeniti u drugoj jednadžbi do ** log (A) ** kako bi bio u skladu s prvom jednadžbom.
@Ida doista.Za zainteresiranog čitatelja moj post [ovdje] (https://stats.stackexchange.com/a/320815/8013) opisuje zašto bi za zabilježeno "y" analitičar trebao interpetirati 100 dolara \ puta (e ^ \ beta-1) $ kao promjena postotka.
#3
+20
onestop
2010-10-13 01:26:53 UTC
view on stackexchange narkive permalink

Da biste saznali više o izvrsnoj navici whubera o razlozima za preferiranje logaritma u odnosu na neke druge transformacije poput korijenske ili uzajamne, ali usredotočujući se na jedinstvenu interpretabilnost regresijskih koeficijenata koji proizlaze iz log-transformacije u odnosu ostale transformacije, vidi:

Oliver N. Keene. Transformacija dnevnika je posebna. Statistika u medicini 1995; 14 (8): 811-819. DOI: 10.1002 / sim.4780140810. (PDF sumnjive zakonitosti dostupan na http://rds.epi-ucsf.org/ticr/syllabus/courses/25/2009/04/21/Lecture/readings/log.pdf).

Ako prijavite neovisnu varijablu x na bazu b , koeficijent regresije (i CI) možete protumačiti kao promjena zavisne varijable y po b -struko povećanje x . (Zapisnici u bazu 2 stoga su često korisni jer odgovaraju promjeni y po udvostručenju x ili zapisnici u bazu 10 ako x varira u mnogim redovima veličine, što je rjeđe). Ostale transformacije, poput kvadratnog korijena, nemaju tako jednostavno tumačenje.

Ako prijavite ovisnu varijablu y (ne izvorno pitanje već ono koje obrađivalo se nekoliko prethodnih odgovora), tada smatram da je ideja Tima Colea o "simpercentima" privlačna za predstavljanje rezultata (čak sam ih jednom koristio u radu), iako se čini da se nisu toliko uhvatili:

Tim J Cole. Znakovi: simetrične postotne razlike na skali 100 log (e) pojednostavljuju prikaz podataka transformiranih u dnevnik. Statistika u medicini 2000; 19 (22): 3109-3125. DOI: 10.1002 / 1097-0258 (20001130) 19: 22<3109 :: AID-SIM558> 3.0.CO; 2-F [Tako mi je drago Stat Med prestao je koristiti SICI kao DOI ...]

Hvala na referenci i vrlo dobrim točkama. Pitanje od interesa je odnosi li se ovo pitanje na sve transformacije, a ne samo na zapisnike. Za nas je statistika / vjerojatnost korisna utoliko što omogućuje učinkovito predviđanje učinka ili učinkovite kriterije / smjernice. Tijekom godina koristili smo pretvorbe snage (zapisnici pod drugim imenom), polinomske transformacije i druge (čak i dijelom transformirane) kako bismo pokušali smanjiti ostatke, pooštrili intervale pouzdanosti i općenito poboljšali predviđanje iz određenog skupa podataka. Govorimo li sada da je to netočno?
@AsymLabs, koliko su Breimanove dvije kulture odvojene (otprilike prediktori i modelatori)? Usp. [Dvije kulture] (http://stats.stackexchange.com/questions/6/the-two-cultures-statistics-vs-machine-learning) - sporno.
#4
+14
Shane
2010-07-20 18:16:29 UTC
view on stackexchange narkive permalink

Obično se uzima dnevnik ulazne varijable da bi se povećao i promijenio raspored (npr. da bi se normalno distribuirao). Međutim, to se ne može učiniti slijepo; morate biti oprezni prilikom izrade skaliranja kako biste bili sigurni da se rezultati i dalje mogu interpretirati.

O tome se govori u većini uvodnih tekstova o statistici. Također možete pročitati članak Andrewa Gelmana o "Skaliranje regresijskih ulaza dijeljenjem s dvije standardne devijacije" za raspravu o tome. O tome također vodi vrlo lijepu raspravu na početku "Analiza podataka korištenjem regresije i višerazinskih / hijerarhijskih modela".

Uzimanje dnevnika nije prikladna metoda za rješavanje problema loši podaci / outliers.

#5
+11
csgillespie
2010-07-20 18:22:40 UTC
view on stackexchange narkive permalink

Obično zapisujete podatke kada postoji problem s ostacima. Na primjer, ako zacrtate ostatke prema određenom kovarijatnom i primijetite obrazac povećanja / smanjenja (oblik lijevka), tada bi transformacija mogla biti prikladna. Ne slučajni reziduali obično ukazuju na to da su pretpostavke vašeg modela pogrešne, tj. Nenormalni podaci.

Neke se vrste podataka automatski podvrgavaju logaritamskim transformacijama. Na primjer, obično uzimam zapisnike kada se bavim koncentracijom ili dobom.

Iako se transformacije primarno ne koriste za rješavanje izvanrednih rezultata, one pomažu jer uzimanje dnevnika zbija vaše podatke.

Ali, ipak, upotreba dnevnika mijenja model - za linearnu regresiju to je y ~ a * x + b, za linearnu regresiju na log to je y ~ y0 * exp (x / x0).
Slažem se - uzimanje dnevnika mijenja vaš model. Ali ako morate transformirati svoje podatke, to znači da vaš model uopće nije bio prikladan.
Koncentracije @cgillespie:, da; ali dob? To je čudno.
@whuber: Pretpostavljam da to vrlo ovisi o podacima, ali skupovi podataka koje sam koristio, vidjeli biste veliku razliku između 10 i 18 godina, ali malu razliku između 20 i 28 godina. Čak i za malu djecu razlika između 0-1 god. Nije ista kao razlika između 1-2.
Da, ovisit će o podacima: vaša sposobnost provođenja pronicljive i učinkovite analize konačni je arbitar ovog problema, a ne moja predrasuda. Samo sam pokušavao zamisliti situacije u kojima bi dob kao * neovisna * varijabla zaslužila tako snažnu transformaciju. Neke čudne stvari će se dogoditi i s novorođenčadi ;-).
@whuber "Ne-slučajni ostaci obično ukazuju na to da su pretpostavke vašeg modela pogrešne, tj. Nenormalni podaci." Na drugim mjestima na ovom mjestu dobio sam razumijevanje da OLS ne nameće nikakve pretpostavke o distribuciji osnovnih podataka, već nameće takve uvjete samo rezidualima kada radite normalno zaključivanje. Dakle, ne razumijem li gore navedeno ili je to loše sročeno?
@landroni Ukratko je sročeno. Ne bih rekao da je siromašan, osim što je vjerojatno "npr." bio namijenjen umjesto "tj." Razumijem upotrebu "slučajnog" ovdje u smislu "neovisnog i identično raspoređenog", što je doista najopćenitija pretpostavka koju pretpostavlja OLS. U * nekim * postavkama ljudi dodatno pretpostavljaju da je ova uobičajena osnovna raspodjela normalna, ali to nije nužno potrebno u praksi ili u teoriji: sve što je potrebno jest da raspodjela uzoraka relevantnih statistika bude blizu normalne.
#6
+10
Frank Harrell
2015-10-19 16:37:38 UTC
view on stackexchange narkive permalink

Transformacija neovisne varijable $ X $ jedna je prilika kada čovjek može biti samo empirijski bez narušavanja zaključka sve dok je iskren u pogledu broja stupnjeva slobode u igri. Jedan od načina je korištenje regresijskih splainova za kontinuirane $ X $ za koje još nije poznato da djeluju linearno. Za mene to nije pitanje dnevnika u odnosu na izvornu ljestvicu; pitanje je koja transformacija $ X $ odgovara podacima. Normalnost reziduala ovdje nije kriterij.

Kada je $ X $ izrazito iskrivljen, kockanje $ X $, koliko je potrebno u kubnim funkcijama сплаjna, rezultira ekstremnim vrijednostima koje ponekad mogu uzrokovati numeričke probleme. To rješavam postavljanjem funkcije kubnog сплаjna na $ \ sqrt [3] {X} $. Paket R rms uzima unutarnju varijablu kao prediktor, pa će crtanje predviđenih vrijednosti imati $ X $ na osi $ x $. Primjer:

  require (rms) dd <- datadist (mydata); options (datadist = 'dd') cr <- funkcija (x) x ^ (1/3) f <- ols (y ~ rcs (cr (X), 5), data = mydata) ggplot (Predict (f)) # plot spline cr (X) nasuprot X  

Ovo se uklapa u ograničeni kubni сплаjn u $ \ sqrt [3] {X} $ s 5 čvorova na zadanim mjestima kvantila. $ X $ fit ima 4 d.f. (jedan linearni član, 3 nelinearna člana). Opsezi pouzdanosti i testovi pridruživanja poštuju ove 4 d.f., u potpunosti prepoznajući "nesigurnost transformacije".

(+1) Ako postoji bilo kakva nejasnoća u vezi s funkcionalnim oblikom $ E [Y | X] = f (X) $, pod uvjetom da postoji dovoljno podataka, analitičar bi trebao koristiti postupke zaglađivanja poput splina ili lokalne regresije, umjesto da "promatra očinajbolje odgovara".Za zaključivanje, log i linearni trendovi često se slažu oko smjera i veličine asocijacija.Glavna prednost transformacije dnevnika je interpretacija.
#7
+9
Sannita
2015-10-19 16:24:59 UTC
view on stackexchange narkive permalink

Želio bih odgovoriti na pitanje korisnika user1690130 koje je ostavljeno kao komentar na prvi odgovor 26. listopada 12. i glasi kako slijedi: "Što je s varijablama poput gustoće naseljenosti u regiji ili omjera djece i učitelja za svaki školski okrug ili broj ubojstava na 1000 stanovnika? Vidio sam da profesori uzimaju evidenciju ovih varijabli. Nije mi jasno zašto. Na primjer, nije li stopa ubojstava već postotak? postotak promjene stope? Zašto bi se preferirao zapisnik odnosa djece i učitelja? "

Tražio sam odgovor na sličan problem i želio sam podijeliti ono što je moja stara knjiga sa statistikama ( Jeffrey Wooldridge, 2006. Uvodna ekonometrija - moderni pristup, 4. izdanje. Poglavlje 6 Analiza višestruke regresije: daljnja pitanja. 191 ) kaže o tome. Wooldridge savjetuje:

Varijable koje se pojavljuju u omjeru ili postotku, poput stope nezaposlenosti, stope sudjelovanja u mirovinskom planu, postotka učenika koji polažu standardizirani ispit i stope uhićenja o prijavljenim zločinima - mogu se pojaviti u izvornom ili logaritamskom obliku, iako postoji tendencija da ih se upotrebljava u ravninskim oblicima . To je zato što će bilo koji regresijski koeficijenti koji uključuju izvornu varijablu - bila ona ovisna ili neovisna varijabla - imati interpretaciju promjene postotnog boda. Ako koristimo, recimo, log ( unem ) u regresiji, gdje je unem postotak nezaposlenih osoba, moramo biti vrlo oprezni pri razlikovanju promjene u postotnom bodu i postotna promjena. Zapamtite, ako unem prijeđe s 8 na 9, to je porast od jedan postotni bod, ali 12,5% porast od početne razine nezaposlenosti. Korištenje dnevnika znači da gledamo postotak promjene stope nezaposlenosti: log (9) - log (8) = 0,118 ili 11,8%, što je logaritamsko približavanje stvarnom porastu od 12,5%.

Na temelju ovoga i praćenja na prethodni komentar whubera na pitanje korisnika user1690130, izbjegavao bih koristiti logaritam varijable gustoće ili postotka stope kako bi interpretacija bila jednostavna, osim ako upotreba obrasca dnevnika ne stvara veći kompromis kao što je mogućnost kako bi se smanjio iskrivljenost varijable gustoće ili brzine.

Često se za postotke (tj. Omjere na (0,1) koristi logit transformacija. To je zato što proporcionalni podaci često krše pretpostavku o normalnosti reziduala, na način da log transformacija neće ispraviti.
#8
+3
russellpierce
2010-07-20 19:13:50 UTC
view on stackexchange narkive permalink

Shaneov stav da je uzimanje dnevnika za rješavanje loših podataka dobro prihvaćeno. Kao i Colinov u pogledu važnosti normalnih ostataka. U praksi nalazim da obično možete dobiti normalne ostatke ako su ulazne i izlazne varijable također relativno normalne. U praksi to znači promatranje distribucije transformiranih i netransformiranih skupova podataka i osiguravanje da su oni postali normalniji i / ili provođenje testova normalnosti (npr. Shapiro-Wilk ili Kolmogorov-Smirnov testovi) i utvrđivanje je li ishod normalniji. Interpretabilnost i tradicija također su važni. Primjerice, u kognitivnoj psihologiji često se koriste log transformacije vremena reakcije, međutim, barem za mene, interpretacija log RT nije jasna. Nadalje, treba biti oprezan s vrijednostima transformiranim u dnevnik, jer pomicanje skale može glavni efekt promijeniti u interakciju i obrnuto.

Odgovori će se preuređivati ​​na temelju glasova, stoga se nemojte pozivati ​​na druge odgovore.
Test normalnosti obično je prestrog. Često je dovoljno dobiti simetrično raspoređene ostatke. (U praksi, reziduali imaju tendenciju snažne vršne raspodjele, djelomično kao artefakt procjene, pretpostavljam, i stoga će se testirati kao "značajno" nenormalni, bez obzira na to kako netko ponovno izrazi podatke.)
@whuber: se složio. Zbog toga sam odredio "postani normalniji". Cilj bi trebao biti uočiti statistiku testa za promjene, a ne prihvatiti / odbiti odluku na temelju p-vrijednosti testa.
Uvijek se treba pozivati na druge odgovore prema potrebi!
@abalter?Ne slijedim.
Oprostite, mislio sam na komentar @VebjornLjosa's.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...