Pitanje:
Zašto ove izjave ne slijede logično iz 95% CI u prosjeku?
user1205901 - Reinstate Monica
2014-04-24 17:08:05 UTC
view on stackexchange narkive permalink

Čitao sam članak Hoekstre i suradnika iz 2014. o "Robusnoj pogrešnoj interpretaciji intervala povjerenja", koji sam preuzeo s web stranice Wagenmakers.

Na pretposljednjoj stranici slijedeća slika pojavljuje se.

Quiz

Prema autorima, False je točan odgovor na sve ove izjave. Nisam baš siguran zašto su izjave lažne i koliko mogu reći ostatak članka to ne pokušava objasniti.

Vjerujem da 1-2 i 4 nisu točni jer tvrde nešto o vjerojatnoj vrijednosti istinske sredine, kada istinska sredina ima određenu vrijednost koja je nepoznata. Je li ovo uvjerljiva razlika?

Što se tiče 3, koliko razumijem, nije namijenjeno iznošenju tvrdnji o vjerojatnosti da je nulska hipoteza netočna, iako nisam toliko siguran u razlog zašto.

Slično tome, 6 ne može biti točno, jer implicira da se istinska sredina mijenja od eksperimenta do eksperimenta.

Ona koju stvarno uopće ne razumijem je 5. Zašto je ta pogrešna? Ako imam postupak koji u 95% slučajeva proizvodi CI koji sadrže istinsku srednju vrijednost, zašto ne bih rekao da imam 95% povjerenja da je vrijednost populacije između 0,1 i 0,4? Je li to zato što bismo možda imali neke posebne informacije o uzorku koji smo upravo uzeli, a zbog kojih bismo pomislili da je vjerojatno jedan od 5% koji ne sadrži istinsku vrijednost? Na primjer, 0,13 je uključeno u interval pouzdanosti i iz nekog se razloga 0,13 ne smatra vjerojatnom vrijednošću u nekom specifičnom kontekstu istraživanja, na pr. jer bi se ta vrijednost sukobila s prethodnom teorijom.

Što uopće znači povjerenje u ovom kontekstu?

Usko povezano: [Zašto 95% CI ne podrazumijeva 95% šanse da sadrži srednju vrijednost?] (Http://stats.stackexchange.com/q/26450/7290)
Pet odgovori:
whuber
2014-04-24 21:25:33 UTC
view on stackexchange narkive permalink

Samo značenje pitanja (5) ovisi o neobjavljenoj interpretaciji "povjerenja". Pažljivo sam pretražio novine i nisam našao pokušaj definiranja "povjerenja" ili što bi to moglo značiti u ovom kontekstu. Objašnjenje rada na pitanje (5) u radu je

"... [spominje se granice CI-a, dok se ... CI može koristiti za procjenu samo postupka i nije određeni interval. "

Ovo je i promišljeno i obmanjujuće. Prvo, ako ne možete procijeniti rezultat postupka, onda kakva je korist od postupka u prvo mjesto? Drugo, izjava u pitanju ne odnosi se na postupak, već na čitateljevo "povjerenje" u njegove rezultate.

Autori se brane:

"Prije nastavka važno je prisjetiti se ispravne definicije CI-a. CI je numerički interval konstruiran oko procjene parametra. Takav interval, međutim, ne ukazuje izravno na svojstvo parametra; umjesto toga , ukazuje na svojstvo postupka, što je tipično za frekventističku tehniku. "

Njihova pristranost pojavljuje se u posljednjem izrazu:" frekventička tehnika "(napisana, možda, s implicitnim podsmijehom ). Iako je ova karakterizacija točna, kritično je nepotpuna. Ne primjećuje da je interval pouzdanosti također svojstvo eksperimentalnih metoda (kako su uzorci dobiveni i izmjereni) i, što je još važnije, same prirode . To je jedini razlog zašto bi ikoga zanimala njegova vrijednost.

Nedavno sam imao zadovoljstvo čitati Kružna statistika u biologiji Edwarda Batscheleta (Akademski Tisak, 1981). Batschelet piše jasno i precizno, u stilu usmjerenom prema znanstveniku koji radi. Evo što kaže o intervalima povjerenja:

" Procjena parametra bez naznaka odstupanja uzrokovanih slučajnim kolebanjima ima malu znanstvenu vrijednost. ...

" Dok je parametar koji se treba procijeniti fiksni broj , granice pouzdanosti određene su uzorkom. Oni su statistika i, prema tome, ovise o kolebanju slučajnosti. Različiti uzorci izvučeni iz iste populacije dovode do različitih intervala pouzdanosti. "

[Naglasak je na originalu, na str. 84-85.]

Primijetite razliku u naglasku: dok se predmetni rad usredotočuje na postupak, Batschelet se usredotočuje na uzorak i posebno na ono što on može otkriti o parametru i koliko te informacije mogu utjecati "slučajnim fluktuacijama". Smatram da je ovaj nesumnjivo praktičan, znanstveni pristup daleko konstruktivniji, osvijetljujući i - u konačnici - koristan.

Punija karakterizacija intervala povjerenja od ponuđenih u radu stoga bi postupite otprilike ovako:

CI je numerički interval konstruiran oko procjene parametra. Svatko tko se slaže s pretpostavkama u osnovi konstrukcije CI-a opravdano je reći da je siguran da je parametar unutar interval: ovo je značenje "samouvjeren". Ovo značenje je široko u skladu s uobičajenim netehničkim značenjima povjerenja, jer se u mnogim replikacijama eksperimenta (bez obzira jesu li se stvarno dogodile) CI, iako će varirati, većinu vremena sadrži parametar.

U ovom cjelovitijem, konvencionalnijem i konstruktivnijem osjećaju "samopouzdanja", odgovor na pitanje (5) je istinit.

Znakovito je da Batscheletov pristup čini se da isključuje određene vrste intervala povjerenja koji promišljenim čitateljima daju pauzu, poput CI-a koji mogu biti prazni. Takav CI jedva bi uhvatio ideju o "naznakama odstupanja uzrokovanih slučajnim fluktuacijama". To nagovještava da možda standardna definicija intervala pouzdanosti ne postiže baš ono što se namjerava. Bez obzira na to, u nedostatku bilo kakve jasne naznake o tome što „povjerenje“ znači u pitanju (5), moramo odbaciti zaključke koje su autori donijeli na temelju odgovora na to pitanje.
Ne bih se složio da je oko 5 ispravno prema vašoj pročišćenoj definiciji intervala povjerenja. CI se mora temeljiti na dovoljnoj statistici - inače možete stvoriti CI-je koji imaju podklasu slučajeva „loša“ i „dobra“, prepoznatljiva iz uzorka koji imate, tako da je pokrivenost u tim razredima preniska ili previsoka. Najosnovniji primjer je uzorak ID-a veličine 2 iz $ y_i \ sim cauchy (\ mu, 1) $. Srednja vrijednost uzorka nije dovoljna za $ \ mu $, tako da vaše pokriće CI varira ovisno o određenom uzorku koji dobijete.
... nastavak ... pa iako se postiže dugoročno prosječno pokrivanje, pokrivenost u određenoj klasi uzoraka neće.
Juho Kokkala
2014-04-24 17:49:38 UTC
view on stackexchange narkive permalink

Pitanja 1-2, 4: u frekventističkoj analizi istinska sredina nije slučajna varijabla, stoga vjerojatnosti nisu definirane, dok bi u Bayesovoj analizi vjerojatnosti ovisile o prethodnom.

Pitanje 3: Na primjer, razmotrimo slučaj u kojem sa sigurnošću znamo da bi i dalje bilo moguće dobiti ove rezultate, ali prilično nerazumno reći da je „mala vjerojatnost“ da je nulska hipoteza istinita. Dobili smo podatke do kojih je malo vjerojatno da će se dogoditi ako je nulska hipoteza istinita, ali to ne znači da je mala vjerojatnost da je točna hipoteza.

Pitanje 5: Ovo je pomalo upitno jer ovo ovisi o definicija "možemo biti p% samopouzdani." Ako izjavu definiramo kao stvar koja se izvodi iz p% intervala pouzdanosti, izjava je po definiciji točna. Tipični pro-Bayesov argument tvrdi da ljudi imaju tendenciju interpretirati ove izjave intuitivno kako bi značili "vjerojatnost je p%", što bi bilo lažno (usporedite odgovore s 1-2,4).

6. pitanje: Vaše objašnjenje "implicira da se prava srednja vrijednost mijenja iz eksperimenta u eksperiment" točno je točno.

O članku se nedavno raspravljalo na blogu Andrewa Gelmana ( http://andrewgelman.com/2014/ 03/15 / problematične interpretacije-intervali povjerenja /). Na primjer, pitanje u vezi s tumačenjem izjave u pitanju 5 raspravlja se u komentarima.

Pa, ako se netko vrati i svaku instancu "istinske sredine" zamijeni s "najboljom procjenom za istinsku sredinu", bi li izjave postale točne?
@Superbest br. Ako uzmemo u obzir "najbolju procjenu s obzirom na ove podatke", to je poznata konstanta (pod uvjetom da je najbolja dobro definirana). Ako uzmemo u obzir "najbolju procjenu budućeg uzorka", ne znamo kako varira jer ne znamo pravu srednju vrijednost.
Ovo nije točno pobijanje gornjeg komentara, ali trebao bih naglasiti da "najbolja procjena" podrazumijeva stvarni broj, a ne raspodjelu. S CI-om bi se moglo govoriti o "raspodjeli mjesta gdje bi mogla biti prava sredina s obzirom na ove podatke".
@Super To je upravo nesporazum CI-a o kojem se govori u radu. Konkretno, * prava srednja vrijednost je broj *; nema raspodjelu. Pogledajte prva dva pogotka u pretraživanju web mjesta za [interval pouzdanosti] (http://stats.stackexchange.com/questions/tagged/confidence-interval?sort=votes&pageSize=50) za daljnju raspravu.
@whuber Žao nam je što se ne slažem sa tim, ali postoji li uopće neka fraza koja u tim izjavama može zamijeniti "interval povjerenja" koja bi ih učinila istinitima?
@super, "vjerodostojni interval" približio bi se.
Scortchi - Reinstate Monica
2014-04-24 19:13:32 UTC
view on stackexchange narkive permalink

Bez formalne definicije što znači biti "95% siguran", koje opravdanje postoji za označavanje # 5 istinitim ili lažnim? Laik bi je nesumnjivo pogrešno protumačio kao sinonim za 95% vjerojatnosti da je srednja vrijednost u tom intervalu: ali neki je ljudi koriste u smislu da su koristili metodu generiranja intervala čiji intervali sadrže istinsku srednju vrijednost 95% vremena, upravo kako bi se izbjeglo govoriti o raspodjeli vjerojatnosti nepoznatog parametra; što se čini dovoljno prirodnim proširenjem terminologije.

Slična struktura prethodne izjave (# 4) mogla bi potaknuti ispitanike da pokušaju napraviti razliku između "tamo možemo biti 95% sigurni" & " je 95% vjerojatnosti "čak i ako prije nisu bili zabavljeni tom idejom. Očekivao sam da će ova lukavost dovesti do toga da broj 5 ima najveći udio u dogovoru - gledajući papir, ustanovio sam da nisam u pravu, ali primijetio sam da je barem 80% pročitalo upitnik u nizozemskoj verziji, što bi možda trebalo pokrenuti pitanja o prikladnost engleskog prijevoda.

Peter Flom
2014-04-24 17:45:53 UTC
view on stackexchange narkive permalink

Evo definicije intervala pouzdanosti iz Statističkog rječnika BS Everitt:

"Raspon vrijednosti izračunat iz uzorka promatranja, koji su vjerovalo se da s određenom vjerojatnošću sadrži istinsku vrijednost parametra. Primjerice, 95% CI podrazumijeva da se postupak procjene ponavljao iznova i iznova, tada bi se očekivalo da 95% izračunanih intervala sadrži istinsku vrijednost parametra. Imajte na umu da se navedena razina vjerojatnosti odnosi na svojstva intervala, a ne na sam parametar, koji se ne smatra slučajnom varijablom "

Vrlo česta zabluda je zbunjivanje značenja interval pouzdanosti s onim vjerodostojnog intervala , AKA "Bayesov interval pouzdanosti", koji daje izjave slične onima u pitanjima.

Čula sam da su intervali povjerenja često slični vjerodostojnim intervalima koji su izvedeni od neinformativnog prethodnika, ali to mi je rečeno anegdotski (iako od momka kojeg jako poštujem), a ja ne imaju detalje ili citat.

Jaynes 1976. Intervali pouzdanosti papira u odnosu na Bayesove intervale. To je barem jedna vjerodostojna kiselina. Tu su i Bergerovi i Bernardovi referentni prioriteti. Ozbiljno, nikad niste čuli za ovo?
Deathkill14
2014-04-24 17:57:10 UTC
view on stackexchange narkive permalink

Što se tiče intuicije za neistinitost petog pitanja, sljedeću raspravu o ovoj temi dobivam od ovdje

Ispravno je reći da postoji 95 % šanse da interval pouzdanosti koji ste izračunali sadrži istinsku prosječnu populaciju. Nije sasvim točno reći da postoji 95% šanse da se stanovništvo podrazumijeva unutar intervala.

U čemu je razlika? Srednja vrijednost populacije ima jednu vrijednost. Ne znate što je to (osim ako ne radite simulacije), ali ima jednu vrijednost. Ako ponovite eksperiment, ta se vrijednost ne bi promijenila (a i dalje ne biste znali što je to). Stoga nije strogo ispravno postavljati pitanje o vjerojatnosti da stanovništvo znači unutar određenog raspona. Suprotno tome, interval pouzdanosti koji izračunate ovisi o podacima koje ste slučajno prikupili. Ako ponovite eksperiment, vaš bi interval pouzdanosti gotovo sigurno bio drugačiji. Stoga je u redu pitati se o vjerojatnosti da interval sadrži srednju vrijednost populacije.

Sada na vaša konkretna pitanja o 5. Zašto nije u redu ...

  1. Je li to zato što bismo možda imali neke posebne informacije o uzorku koji smo upravo uzeli, a zbog kojih bismo pomislili da je vjerojatno jedan od 5% koji ne sadrži istinsku vrijednost? Ne, radije , Mislim da je to zato što istinska sredina nije slučajna varijabla, već je interval pouzdanosti funkcija podataka.
  2. Što uopće znači pouzdanost u ovom kontekstu? Interval pouzdanosti omogućava (pouzdano - ako vjerujete svojim pretpostavkama) možete podnijeti zahtjev da interval pokriva istinski parametar. Tumačenje odražava nesigurnost u postupku uzorkovanja; interval pouzdanosti od $ 100 (1- \ alpha) $ % tvrdi da [u to možete biti sigurni], dugoročno $ 100 (1- \ alpha) $ % ostvarenih intervala pouzdanosti pokriva pravi parametar.

Kao popratna napomena (spomenuta u drugim odgovorima na ovo pitanje), vjerodostojni interval, koncept iz Bayesove statistike, predviđa da prava vrijednost parametra ima određenu vjerojatnost da bude u interval pouzdanosti s obzirom na stvarno dobivene podatke. Možda o tome možete saznati više na Gelmanovom blogu.

"Interval sadrži pravu vrijednost" i "istinska vrijednost leži u intervalu" znače potpuno isto. Korisnije je razmišljati u smislu prvog, ali zapravo nema smisla reći da je jedno ispravno, a drugo netočno.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...