Pitanje:
Kako prikazati trake pogrešaka za unakrsne (uparene) eksperimente
Dieter Menne
2013-06-03 21:33:35 UTC
view on stackexchange narkive permalink

Sljedeći je scenarij postao najčešće postavljana pitanja u trojku istražitelj (I), recenzent / urednik (R, nije povezan s CRAN-om) i ja (M) kao kreator zavjere. Možemo pretpostaviti da je (R) tipični medicinski recenzent velikog šefa, koji samo zna da svaka parcela mora imati traku pogreške, inače je pogrešna. Kada je uključen statistički preglednik, problemi su mnogo manje kritični.

Scenarij

U tipičnom farmakološkom unakrsnom ispitivanju dva lijeka A i B su testiran na njihov učinak na razinu glukoze. Svaki se pacijent dva puta testira slučajnim redoslijedom i pod pretpostavkom da nema prijenosa. Primarna krajnja točka je razlika između glukoze (B-A) i pretpostavljamo da je upareni t-test primjeren.

(I) želi grafikon koji pokazuje apsolutnu razinu glukoze u oba slučaja. Strahuje od (R) želje za trakama pogrešaka i traži standardne pogreške u stupčastim grafikonima. Ne započinjmo ovdje rat s grafikonima ._)

bar graphs and SE glucose for two treatments

(I): To ne može biti istina. Šipke se preklapaju, a imamo p = 0,03? To nisam naučio u srednjoj školi.

(M): Ovdje imamo upareni dizajn. Tražene trake pogrešaka potpuno su irelevantne, ono što se računa je SE / CI uparenih razlika koje nisu prikazane na grafikonu. Da imam izbora i da nema previše podataka, preferirao bih sljedeći zaplet

Joined lines show the pairing, dots the original values

Dodano 1: Ovo je paralela koordinatna parcela spomenuta u nekoliko odgovora

(M): Linije prikazuju uparivanje, a većina linija ide prema gore, i to je pravi dojam, jer je važan nagib (ok, ovo je kategorično, ali bez obzira na to ).

(I): Ta slika zbunjuje. Nitko to ne razumije i nema traka s pogreškama (R vreba).

(M): Mogli bismo dodati i još jedan grafikon koji prikazuje relevantan interval pouzdanosti razlike. Udaljenost od nulte crte daje dojam veličine učinka.

(I): Nitko to ne čini

(R): I troši dragocjena stabla

(M): (Kao dobar Nijemac): Da, zauzeta je točka na drveću. Ali to ipak koristim (i nikada ne objavljujem) kada imamo više tretmana i više kontrasta.

confidence interval of the difference

Imate li prijedloga ? R-kôd je ispod, ako želite stvoriti zaplet.

  # Grafika za unakrsne eksperimentelibrary (ggplot2) library (plyr) theme_set (theme_bw () + theme (panel.margin = grid :: jedinica (0, "crte"))) n = 20efekt = 5 set.seed (4711) glu0 = rnorm (n, 120,30) glu1 = glu0 + rnorm (n, efekt, 7) dt = data.frame (pacijent = rep (paste0 ("P", 10: (9 + n))), liječenje = rep (c ("A", "B"), svaki = n), glukoza = c (glu0, glu1)) dt1 = ddply (dt,. (liječenje), funkcija (x) {data.frame (glukoza = srednja vrijednost (x $ glukoza), se = sqrt (var (x $ glukoza) / nrow (x)))}) tt = t.test (liječenje glukozom ~, upareno = TRUE, podaci = dt, conf.int = TRUE) dt2 = data.frame (razlika = -tt $ procjena, niska = -tt $ conf.int [2], gore = - tt $ conf.int [1]) p = paste ("p =", signif (tt $ p.value, 2)) png (visina = 300, širina = 300) ggplot (dt1, aes (x = tretman, y = glukoza, ispun = tretman)) + geom_bar (stat = "identitet") + geom_errorbar (aes (ymin = glukoza-se, ymax = glukoza + se), veličina = 1, širina = 0,3) + geom_text (aes (1,5 , 150), oznaka = p, veličina = 6) ggplot (dt, aes (x = liječenje, y = glukoza, skupina = pacijent)) + y lim (0,190) + geom_line () + geom_point (size = 4,5) + geom_text (aes (1,5,60), label = p, size = 6) ggplot (dt2, aes (x = "", y = diff)) + geom_errorbar (aes (ymin = nizak, ymax = gore), veličina = 1,5, širina = 0,2) + geom_text (aes (1, -0,8), label = p, size = 6) + ylab ("95% CI razlike glukoza BA ") + ylim (-10,10) + tema (panel.border = element_blank (), panel.grid.major.x = element_blank (), panel.grid.major.y = element_line (veličina = 1, boja = "grey88")) dev.off ()  
O moj bože @dieter-menne, sjajno pitanje! Toliko ovisi o vrsti časopisa kojem šaljete članak. Klonit ću se ratova grafikona, ali volim grafikone 2 i 3: toliko informacija u tako malo prostora.
[Masson i Loftus (2003)] (http://web.uvic.ca/psyc/masson/ML03.pdf) često je navedena referenca. Oni pokazuju primjere crteža na kojima se na drugoj ploči istog grafa prekriva CI razlike. Hoće li to obradovati sve ljude u cirkusu, ne znam (ipak, osjećam vas!)
Hvala, @AndyW, na referenci. To je do točke, ali ima problema: to je iz psihologije. Na tu temu postoji mnogo više dobrih radova psihologa koji imaju puno bolju statističku pozadinu u usporedbi s medicinskim recenzentima. Volio bih da mogu pronaći neki vodič visokog ranga o toj temi, to je jedini oštri mač s kojim sam mogao rukovati.
Pet odgovori:
Henrik
2013-06-04 02:38:21 UTC
view on stackexchange narkive permalink

Potpuno ste u pravu u pretpostavci da su trake pogrešaka koje predstavljaju standardnu ​​pogrešku srednje vrijednosti potpuno neprikladne za unutarpredmetne dizajne. Međutim, pitanje preklapanja traka pogrešaka i značaja još je jedna tema na koju ću se vratiti na kraju ovog komentiranog popisa referenci.

Postoji bogata literatura iz psihologije o intervalima povjerenja unutar subjekta ili trake pogrešaka koje rade točno ono što želite. Referentni rad je jasno:

Loftus, G. R., & Masson, M. E. J. (1994). Korištenje intervala povjerenja u dizajnu unutar predmeta. Psihonomski bilten & Review , 1 (4), 476–490. doi: 10.3758 / BF03210951

Međutim, njihov je problem što koriste isti izraz pogreške za sve razine unutar subjekt faktora. Čini se da ovo nije veliki problem za vaš slučaj (2 razine). Ali postoje moderniji pristupi rješavanju ovog problema. Najvažnije:

Franz, V., & Loftus, G. (2012). Standardne pogreške i intervali pouzdanosti u dizajnu unutar predmeta: Generaliziranje Loftusa i Massona (1994) i izbjegavanje pristranosti alternativnih računa. Pregled psihološkog biltena & , 1–10. doi: 10.3758 / s13423-012-0230-1

Baguley, T. (2011). Izračunavanje i graficiranje intervala povjerenja subjekta za ANOVA. Metode istraživanja ponašanja . doi: 10.3758 / s13428-011-0123-7 [ ovdje možete pronaći]

Daljnje reference mogu se naći u posljednja dva rada (koja mislim da su oba vrijedna čitanja ).


Kako istraživači tumače KI? Loše prema sljedećem radu:

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). Istraživači pogrešno razumiju intervale povjerenja i standardne trake pogrešaka. Psihološke metode , 10 (4), 389–396. doi: 10.1037 / 1082-989X.10.4.389

Kako trebamo tumačiti preklapajuće i nepreklapajuće CI-je?

Cumming, G., & Finch, S. (2005.). Zaključivanje očima: intervali povjerenja i kako čitati slike podataka. Američki psiholog , 60 (2), 170–180. doi: 10.1037 / 0003-066X.60.2.170


Posljednja misao (iako ovo nije relevantno za vaš slučaj): Ako imate dizajn podijeljene parcele (tj. unutar i između -predmetni čimbenici) u jednoj parceli možete zajedno zaboraviti na trake pogrešaka. (Ponizno) bih preporučio svoju funkciju raw.means.plot u R paketu plotrix .

Vrlo korisna referentna lista. Cumming je okupio mnoge od svojih ideja na http://www.amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/B007M9D76G/ (Što god želite reći o izrazu "nova statistika", Vjerojatno se slažem.)
Vidi također [Morey 2008 Povjerenje Intervali iz Normalizirano Podaci: A ispravak do Cousineau (2005.)] (http://pcl.missouri.edu/sites/default/files/morey.2008.pdf)
@amoeba Baguleyev papir koji navodim koristi Moreyovu tehniku papira.
Nick Cox
2013-06-04 02:18:13 UTC
view on stackexchange narkive permalink

Čini se da se pitanje ne odnosi toliko na trake pogrešaka koliko na najbolje načine crtanja uparenih podataka.

Ovdje su u osnovi trake pogrešaka u najvećoj mjeri način sažimanja nesigurnosti: ne čine, a nužno i ne mogu reći puno o bilo kojoj finoj strukturi podataka.

U pitanju su spomenuti paralelni koordinatni crteži - koji se ponekad nazivaju i grafički profili, pojam koji znači različite stvari u različitim poljima. Osnovne plohe raspršivanja već je predložio @Ray Koopman.

Specijalizirana raspršena parcela popularna ovdje i postoji ploha razlike (ovdje $ A - B $, recimo) naspram srednje vrijednosti (ili zbroja) $ (A + B) / 2 $ ili $ A + B $ U medicini je to često poznato kao (možda zato što ga je Oldham ranije koristio), a u statistici je često poznato kao Tukey-ova srednja razlika.

Drugi izvor ove radnje su Neyman, J., Scott, E. L. i Shane, C. D. 1953. O prostornoj raspodjeli galaksija: specifičan model. Astrophysical Journal 117: 92–133.

U širokom smislu takve parcele nalikuju ideji crtanja ostataka naspram uklopljenih, koju su također popularizirali Tukey i njegov zet-kvadrat Anscombe .

Ključna ideja takvih ploha je da je vodoravna crta bez razlike $ A - B = 0 $ prirodno ekvivalentna liniji jednakosti $ A = B $, ali često je psihološki lakše raditi s vodoravnom referentnom crtom. Uz to, ako su $ A $ i $ B $ u velikoj mjeri slični, raspršena parcela koristi velik dio svog prostora naglašavajući tu činjenicu, dok bi struktura razlika trebala biti od većeg interesa.

Zanemareni dizajn je crta paralelnih linija McNeila, D.R. 1992. O grafiranju uparenih podataka. Američki statističar 46: 307–310. O tome se govori i u dvije dolje navedene reference.

Recenzije povezane s statistikom, s nekoliko referenci, nalaze se u

2004., Grafički sporazum i neslaganje. Stata Journal 4: 329-349.

.pdf dostupan na http://www.stata-journal.com/sjpdf.html?articlenum=gr0005

Uparene, paralelne ili profilne crteže za promjene, korelacije i druge usporedbe. Stata Journal 9: 621-639.

.pdf dostupan na http://www.stata-journal.com/sjpdf.html?articlenum=gr0041

Korisnici koji nisu Stata trebaju da preskaču i pjevuše kroz Stata kod dok razrađuju kako implementirati grafikone u svoj omiljeni softver.

U svim slučajevima ako omjer $ A $ i $ B $ zanima, a ne njegova razlika, trebaju se koristiti potpuno iste ideje, ali koristeći logaritamske skale.

Ray Koopman
2013-06-04 00:19:58 UTC
view on stackexchange narkive permalink

Isprobajte grafikon raspršenja pojedinih točaka (A, B). Većina njih trebala bi ležati samo na jednoj strani dijagonale (linija A = B). Postoje dva analoga traka pogrešaka. Konvencionalni, ekvivalentan CI za srednju razliku, bio bi pojas pouzdanosti za srednju razliku. Opseg bi bio područje između dvije linije, obje koje su paralelne dijagonali. Upareni t-test bio bi značajan ako i samo ako su oba ruba trake na istoj strani dijagonale.

Konzervativniji analog trake pogreške bio bi elipsa pouzdanosti za centroid.

@dieter-menne: Bi ​​li klinička kemija bila dovoljno medicinska? Morali biste tamo pronaći puno $ c_ {metode B} $ preko $ c_ {metode A} $ parcela. Papir je 2d, upareni podaci 2d, zvuči mi kao lijepo prilagođena situacija ... To bi čak omogućilo daljnju dimenziju (oblik ili boja simbola) koja ukazuje na to tko je prvi dobio tretman A, a tko započeo s tretmanom B (tako da možete provjerite postoji li zaista razlika između te dvije skupine)
Ne, cl. - :) Klinička kemija je previše sofisticirana. Možda ste dodali referencu u "tamo"; Nisam siguran o kojem papiru govorite.
Dieter Menne
2013-06-04 21:39:35 UTC
view on stackexchange narkive permalink

Preliminarni sažetak:

Masson / Loftus vrlo je iscrpan i nije lako pročitati moje kolege liječnike koji ne bi nešto prihvatili poput "interakcije". Oni također imaju neke prijedloge za višestruke usporedbe, koji pokazuju da je međusobne intervale pouzdanosti teško ilustrirati kada se ne želi jako pojednostaviti.

Masson Loftus

Ne volim ovaj stil: šipke s greškama izgledaju prošlo tisućljeće Izvrsno. Međutim, oni koriste i malo elegantniji stil:

Masson Loftus without bars

Cumming / Finch i Belia et al. su čitanja mošta. Prvi je savršen izbor za pružanje prijatelju koji zadrhti kad vidi riječ interakcija . Naručio sam Cummingovu knjigu nakon što sam pročitao taj članak. Drugi prikazuje test koji ću provesti u Shiny za sljedeći sastanak medicinskog istražitelja.

Cumming/Finch

Sviđa mi se ova zavjera, čak i ako postoji druga os koju nikada prije nisam koristio; provjerite Henrikov i neki drugi doprinos na StackOverflow kako biste pronašli R-base grafičku metodu da biste je dobili. Radije bih stavio drugu os lijevo od razlike kako bih bio apsolutno jasan da su se vrijednosti promijenile, i možda dodati os p-vrijednosti.

Snima li netko iz frakcije rešetke / ggplot? Sva isporučena rješenja osnovna su grafika i nisu panelizabilna / facetable.

Međutim: imajte na umu da komentari i radovi uglavnom dolaze s odjela za psihologiju (i @cbeleites iz hardcore kemije). Bilo bi dobro dobiti komentare od recenzenata medicinskih časopisa.

Emil Friedman
2013-06-05 01:54:35 UTC
view on stackexchange narkive permalink

Zašto jednostavno ne zacrtati razliku * za svakog pacijenta? Tada biste mogli upotrijebiti histogram, grafikon okvira ili grafikon normalne vjerojatnosti i pokriti 95% interval pouzdanosti za razliku.

  • U nekim scenarijima to može biti razlika u logaritmima. Vidjeti, na primjer, Patterson & Jones, "Bioekvivalencija i statistika u kliničkoj farmakologiji", Chapman, 2006.
Zašto ne? Može pružiti valjane informacije, ali grafikoni s pojedinačnim točkama ili parovima nisu stvarno popularni u medicinskim istraživanjima. Zbog toga su paralelne radnje (koje pružaju više informacija) toliko nepopularne. Medicinski istraživači žele prosjeke i "normalne vrijednosti" (kakve god one bile).


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...