Pitanje:
Kada su korisni intervali povjerenja?
Jyotirmoy Bhattacharya
2010-10-23 12:48:41 UTC
view on stackexchange narkive permalink

Ako dobro razumijem, interval pouzdanosti parametra jest interval konstruiran metodom koji daje intervale koji sadrže istinsku vrijednost za navedeni udio uzoraka. Dakle, "pouzdanost" se odnosi na metodu, a ne na interval koji izračunam iz određenog uzorka.

Kao korisnik statistike uvijek sam se osjećao prevarenim zbog toga što je prostor svih uzoraka hipotetičan. Sve što imam je jedan uzorak i želim znati što mi taj uzorak govori o parametru.

Je li ova prosudba pogrešna? Postoje li načini gledanja na intervale pouzdanosti, barem u nekim okolnostima, koji bi značili korisnicima statistike?

[Ovo pitanje proizlazi iz razmišljanja nakon što su matematički razmješteni intervali povjerenja. Se odgovor https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572#7572]

šest odgovori:
chl
2010-10-23 13:09:49 UTC
view on stackexchange narkive permalink

Volim razmišljati o CI-ima kao o nekom načinu da pobjegnem od okvira za testiranje hipoteza (HT), barem binarnog okvira za odlučivanje koji slijedi Neymanov pristup, i držim se u skladu s teorijom mjerenja u na neki način. Točnije, smatram ih bližim pouzdanosti procjene (na primjer, razlici u sredstvima), a obrnuto HT je bliži hipotetičko-deduktivnom zaključivanju, sa svojim zamkama (ne možemo prihvatiti nulu, alternativa je često stohastički itd.). Ipak, i s intervalnom procjenom i s HT-om većinu vremena moramo se oslanjati na pretpostavke raspodjele (npr. Raspodjela uzorka ispod $ H_0 $), što omogućuje da se iz našeg uzorka zaključi na opću populaciju ili reprezentativnu populaciju (barem u frekvencijski pristup).

U mnogim su kontekstima CI komplementarni uobičajenom HT-u, a ja ih gledam kao na sljedećoj slici (ispod $ H_0 $):

alt text

to jest, u okviru HT-a (lijevo), gledate koliko je vaša statistika udaljena od nule, dok s CI-jevima (desno) gledate nulti efekt "iz vaše statistike", u određenom smislu.

Također, imajte na umu da za određene vrste statističkih podataka, poput omjera vjerojatnosti, HT često nema smisla i bolje je pogledati pridruženi CI koji je asimetričan i pružiti relevantnije informacije o smjeru i preciznosti udruge, ako postoji.

Zašto kažete da su testovi hipoteza često beznačajni za omjere vjerojatnosti, više nego bilo koja druga procjena učinka? Umjesto toga naglasio bih da su intervali pouzdanosti korisniji od standardnih pogrešaka za omjere vjerojatnosti i druge procjene s asimetričnom raspodjelom uzoraka u konačnim uzorcima.
@onestop Pa, dijelom sam razmišljao o onome što kažete o "asimetričnoj raspodjeli uzoraka ..." (i čini mi se da nisam bio toliko jasan), ali i na činjenicu da smo u epidemiološkim studijama općenito najzainteresiraniji za CI (tj. , koliko je naša procjena precizna) od HT-a.
+1. To me podsjeća da sam pomoću vaših skripti učio asimptotu uskačući i mijenjajući stvari, pokušavajući različite stvari. Još jednom hvala na tome, * vrlo * korisno za početak.
@ars Zapravo, čini mi se da se sjećam da je ova slika napravljena pomoću PStricks-a. U svakom slučaju, dobro polazište za Asymptote je http://www.piprime.fr/asymptote/.
@chl, ovo možda nije u vezi s temom, ali možete li mi reći da li ste ove grafikone napravili u R?
@suncoolsu Ne, to su LateX + PSTricks. Evo koda ako se želite igrati s njim, https://gist.github.com/660876 (zasigurno je star i prilično ružan). U R, ipak ne bi trebalo biti jako teško reproducirati.
onestop
2010-10-23 13:45:56 UTC
view on stackexchange narkive permalink

Alternativni pristup relevantan za vaše drugo pitanje, "Postoje li načini promatranja intervala pouzdanosti, barem u nekim okolnostima, koji bi značili korisnicima statistike?":

Trebali biste uzeti pogledajte Bayesov zaključak i rezultirajuće vjerodostojne intervale. 95% vjerodostojni interval može se tumačiti kao interval za koji vjerujete da ima 95% vjerojatnosti da uključi pravu vrijednost parametra. Cijena koju plaćate je da morate staviti prethodnu vjerojatnost raspodjelu na vrijednosti za koje vjerujete da će istinski parametar vjerojatno zauzeti prije prikupljanja podataka. I vaš prethodnik može se razlikovati od tuđeg prethodnika, pa se i rezultirajući vjerodostojni intervali mogu razlikovati čak i kada koristite iste podatke.

Ovo je samo moj brzi i grubi pokušaj sažimanja ! Dobar noviji udžbenik s praktičnim fokusom je:

Andrew Gelman, John B. Carlin, Hal S. Stern i Donald B. Rubin. "Bayesova analiza podataka" (2. izdanje). Chapman & Hall / CRC, 2003. ISBN 978-1584883883

Hvala. Ali što je s frekvencijskim intervalima povjerenja? Postoje li uopće okolnosti u kojima bi bile relevantne?
Vjerujem da nije važno imati različite prioritete (barem s objektivne Bayesove točke gledišta), ako se dogodi da imate različita znanja o situaciji koja je u pitanju. Utvrdili smo da priore vidimo kao način emitiranja naših apriornih informacija. Znam da to nije jednostavno ...
@Jyotirmoy O bayesovskom i frekventističkom pristupu ovdje su istaknute zanimljive točke: http://stats.stackexchange.com/questions/1611/do-working-statisticians-care-about-the-difference-between-frequentist-and-bayesi/ 3370 # 3370
Michael Lew
2010-10-24 09:23:56 UTC
view on stackexchange narkive permalink

U pravu ste kada kažete da su intervali pouzdanosti od 95% stvari koje proizlaze iz upotrebe metode koja djeluje u 95% slučajeva, a ne bilo koji pojedinačni interval koji ima 95% vjerojatnosti da sadrži očekivana vrijednost.

"Logična osnova i tumačenje granica povjerenja su i danas pitanje kontroverze." {David Colquhoun, 1971., Predavanja o biostatistici}

Taj je citat preuzet iz udžbenika statistike objavljenog 1971. godine, ali smatram da je to još uvijek istina u 2010. godini. Kontroverza je vjerojatno najekstremnija u tom slučaju intervala pouzdanosti za binomske proporcije. Postoje mnoge konkurentske metode za izračunavanje tih intervala povjerenja, ali sve su netočne u jednom ili više smisla, pa čak i metoda s najlošijim učinkom ima zagovornike među autorima udžbenika. Čak i takozvani 'točni' intervali ne daju svojstva koja se očekuju od intervala povjerenja.

U radu napisanom za kirurge (nadaleko poznat po svom zanimanju za statistiku!), John Ludbrook i ja zalagali smo se za rutinsku upotrebu intervala pouzdanosti izračunatih pomoću jednoobraznog Bayesova prethodnika jer takvi intervali imaju frekventička svojstva dobra kao i bilo koja druga metoda (u prosjeku točno 95% pokrivenosti u svim pravim omjerima), ali, što je važno, puno bolju pokrivenost u svim promatranim omjerima (točno 95% pokrivenosti) . Rad zbog svoje ciljne publike nije užasno detaljan, pa možda neće uvjeriti sve statističare, ali radim na sljedećem radu s kompletnim nizom rezultata i opravdanja.

Ovo je slučaj kada Bayesov pristup ima frekventička svojstva jednako dobra kao i frekvencijski pristup, nešto što se događa prilično često. Pretpostavka o jedinstvenom prethodniku nije problematična jer je ujednačena raspodjela proporcija stanovništva ugrađena u svaki izračun frekvencijskog pokrića na koji sam naišao.

Pitate: "Postoje li načini na koje se barem u nekim okolnostima mogu gledati intervali pouzdanosti, što bi bilo korisno za korisnike statistike?" Moj je odgovor onda da se za binomne intervale pouzdanosti mogu dobiti intervali koji sadrže udio populacije točno 95% vremena za sve promatrane proporcije. To je da. Međutim, uobičajena upotreba intervala pouzdanosti očekuje pokrivenost za sve proporcije stanovništva i zato je odgovor "Ne!"

Duljina odgovora na vaše pitanje i različiti odgovori na njih sugeriraju da intervali povjerenja su široko neshvaćeni. Ako promijenimo svoj cilj iz pokrivenosti za sve istinske vrijednosti parametara u pokrivanje prave vrijednosti parametra za sve vrijednosti uzorka, moglo bi biti lakše jer će se intervali tada oblikovati tako da budu izravno relevantni za promatrane vrijednosti, a ne za izvedbu metoda sama po sebi.

whuber
2010-11-03 05:38:17 UTC
view on stackexchange narkive permalink

Mislim da je premisa ovog pitanja pogrešna jer negira razliku između nesigurnog i poznatog.

Opisivanje okretanja novčića pruža dobra analogija. Prije nego što se novčić baci, ishod je neizvjestan; nakon toga više nije "hipotetičan". Zbunjivanje ove činjenice koja se uskladila sa stvarnom situacijom koju želimo razumjeti (ponašanje novčića ili odluke koje će se donijeti kao rezultat njegovog ishoda) u osnovi negira ulogu vjerojatnosti u razumijevanju svijeta .

Ovaj je kontrast naglo olakotan u eksperimentalnoj ili regulatornoj areni. U takvim slučajevima znanstvenik ili regulator znaju da će se suočiti sa situacijama čiji su ishodi, u bilo kojem trenutku prije toga, nepoznati, ali ipak moraju donijeti važna određenja poput načina dizajniranja eksperimenta ili uspostavljanja kriterija za određivanje poštivanja propisa (za ispitivanje droga, sigurnost na radnom mjestu, ekološke standarde i tako dalje). Ovi ljudi i institucije za koje rade trebaju metode i znanje o vjerojatnosnim obilježjima tih metoda kako bi razvili optimalne i obrambene strategije, poput dobrog eksperimentalnog dizajna i poštenog postupci donošenja odluka kojima se što manje griješi.

Intervali povjerenja, unatoč klasično lošoj opravdanosti, uklapaju se u ovaj teoretski okvir odluke. Kada metoda konstrukcije slučajnog intervala ima kombinaciju dobrih svojstava, kao što je osiguravanje minimalne očekivane pokrivenosti intervala i minimiziranje očekivane duljine intervala - oboje a priori svojstva, ne a posteriori one - tada tijekom duge karijere korištenja te metode možemo smanjiti troškove povezane s radnjama koje je ta metoda naznačila.

Navedite primjer korištenja intervala povjerenja za donošenje odluke.Ili, još bolje, usporedite dva intervala povjerenja i način na koji biste donijeli različite odluke sa svakim, dok se u potpunosti pridržavate frekvencijskog okvira.
@Brain Bilo koji uvodni udžbenik statistike pružit će takve primjere.Nesumnjivo frekventni su Freedman, Pisani i Purves, * Statistics * (bilo koje izdanje).
Frank Harrell
2011-06-07 17:24:48 UTC
view on stackexchange narkive permalink

Ovo je sjajna rasprava. Smatram da su pravi put Bayesovi vjerodostojni intervali i intervali podrške vjerojatnosti, kao i Bayesova stražnja vjerojatnost događaja od interesa (npr. Lijek je učinkovit). No, istiskivanje P-vrijednosti intervalima pouzdanosti glavni je dobitak. Gotovo svako izdanje najboljih medicinskih časopisa, poput NEJM-a i JAMA-e, u svojim sažetcima sadrži rad s problemom "odsutnost dokaza nije dokaz odsutnosti". Korištenje intervala povjerenja u velikoj će mjeri spriječiti takve greške. Sjajan mali tekst je http://www.amazon.com/Statistics-Confidence-Intervals-Statistic-Guidelines/dp/0727913751

user28
2010-10-23 18:06:46 UTC
view on stackexchange narkive permalink

Da biste se izravno pozabavili svojim pitanjem: Pretpostavimo da razmišljate o upotrebi stroja za punjenje kutije sa žitaricama određenom količinom žitarica. Očito je da ne želite previše ispuniti / nedovoljno ispuniti okvir. Želite procijeniti pouzdanost stroja. Izvodite niz testova na sljedeći način: (a) Strojem napunite kutiju i (b) Izmjerite količinu žitarica koja je napunjena u kutiju.

Korištenjem prikupljenih podataka konstruirate interval pouzdanosti za količinu žitarica koju će stroj vjerojatno ispuniti u okvir. Ovaj interval pouzdanosti govori nam da interval koji smo dobili ima 95% vjerojatnosti da će sadržavati pravu količinu žitarica koju će stroj staviti u kutiju. Kao što kažete, interpretacija intervala pouzdanosti oslanja se na hipotetičke, neviđene uzorke generirane razmatranom metodom. Ali, to je upravo ono što želimo u našem kontekstu. U gore navedenom kontekstu, koristit ćemo stroj više puta za punjenje kutije i stoga nam je stalo do hipotetičkih, neviđenih spoznaja količine žitarica koje stroj puni u kutiju.

Da se apstrahiramo od gornjeg konteksta: interval pouzdanosti daje nam jamstvo da ako bismo koristili metodu pod istragom (u gornjem primjeru metoda = stroj) više puta tamo je 95% vjerojatnosti da će interval pouzdanosti imati istinski parametar.

@Srikant. Ne! Tako grizu klasični CI. Pretpostavimo radi jednostavnosti da je količina žitarica napunjena u kutiji normalna sa srednjim $ \ mu $ i varijancom $ \ sigma ^ 2 $. Interval pouzdanosti $ \ mu $ temelji se na njegovoj * uzorkovanju * distribuciji koja je različita. Određeni CI može biti udaljen zbog pogrešaka u uzorkovanju i tada neće imati nikakve veze s učinkom stroja. Ako biste više puta uzorkovali i više puta oblikovali KI, tada bi 95% njih bilo u pravu, ali to nije utjeha.
@Jyotirmoy Naravno, određeni CI može biti odmak. Drugim riječima, postoji 5% šanse da CI ne sadrži pravu vrijednost. Ipak, interpretacija koju sam dao u skladu je s načinom na koji se CI zapravo grade. Zamišljamo upotrebu metode u više navrata i konstruiramo CI tako da vjerojatnost da promatrani CI sadrži pravu vrijednost iznosi 0,95. Primijetite da moj odgovor ne govori ništa o vjerojatnosti gdje se zapravo nalazi prava vrijednost jer je to izjava koja se može dati samo s vjerodostojnim intervalima, a ne s intervalima povjerenja.
Donja / Gornja granica @Jyotirmoy za $ (100- \ alpha) $% CI promatrane sredine izrađuju se pod $ H_0 $, pri čemu je raspodjela uzorka srednje vrijednosti (ili razlika u sredinama) ona koju ste pretpostavili ovisno o vašem uzorak ($ ​​t $ ili $ z $ distribucija). Smatrao sam da je Srikantov odgovor točan i čini se da njegova interpretacija ne nadilazi eksperiment koji je uokviren. CI su slučajne varijable.
@Srikant. Možda sam krivo razumio "metoda = stroj" u odgovoru. Mislio sam da želite reći da će 95% svih kutija koje izlaze iz proizvodne trake imati utege unutar intervala pouzdanosti od 95% izvedenih iz određenog uzorka kutija.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...