Pitanje:
Koja je razlika između intervala pouzdanosti i vjerodostojnog intervala?
Matt Parker
2010-09-01 18:53:07 UTC
view on stackexchange narkive permalink

Razmjena Jorisa i Srikanta ovdje natjerala me da se zapitam (ponovno) jesu li moja interna objašnjenja razlike između intervala povjerenja i vjerodostojnih intervala ispravna. Kako biste objasnili razliku?

Devet odgovori:
#1
+355
Keith Winstein
2010-09-01 23:46:23 UTC
view on stackexchange narkive permalink

Potpuno se slažem sa Srikantovim objašnjenjem. Da bi se heuristički okrenuo prema njemu:

Klasični pristupi uglavnom postavljaju da je svijet jedan smjer (npr. Parametar ima jednu određenu istinsku vrijednost) i pokušavaju provesti eksperimente čiji zaključak rezultira - bez obzira prava vrijednost parametra - bit će točna s barem određenom minimalnom vjerojatnosti.

Kao rezultat toga, da bi se izrazio nesigurnost u našem znanju nakon eksperimenta, frekventistički pristup koristi "interval pouzdanosti" - raspon vrijednosti dizajniran da uključuje stvarnu vrijednost parametra s određenom minimalnom vjerojatnošću, recimo 95%. Frekventist će osmisliti eksperiment i postupak intervala pouzdanosti od 95% tako da će se od svakih 100 pokrenutih eksperimenata početi završavati, očekuje se da najmanje 95 dobivenih intervala pouzdanosti uključuje stvarnu vrijednost parametra. Ostalih 5 možda su malo u krivu ili su potpune gluposti - formalno gledano to je u redu što se tiče pristupa, sve dok je 95 od 100 zaključaka točno. (Naravno, više bismo voljeli da oni malo griješe, a ne totalne gluposti.)

Bayesovi pristupi drugačije formuliraju problem. Umjesto da kaže da parametar jednostavno ima jednu (nepoznatu) istinsku vrijednost, Bayesova metoda kaže da je vrijednost parametra fiksna, ali je odabrana iz neke raspodjele vjerojatnosti - poznate kao prethodna raspodjela vjerojatnosti. (Drugi način da se to kaže jest da prije bilo kakvih mjerenja Bayesov dodjeljuje raspodjelu vjerojatnosti, koju oni nazivaju stanjem uvjerenja, o tome kakva je stvarna vrijednost parametra.) Ovaj "prethodnik" mogao bi biti poznat (zamislite pokušaj za procjenu veličine kamiona, ako znamo ukupnu raspodjelu veličina kamiona iz DMV-a) ili bi to mogla biti pretpostavka izvučena iz zraka. Bayesov zaključak je jednostavniji - prikupljamo neke podatke, a zatim izračunavamo vjerojatnost različitih vrijednosti parametra DANI su podaci. Ova nova raspodjela vjerojatnosti naziva se "a posteriori vjerojatnost" ili jednostavno "stražnja". Bayesovi pristupi mogu sažeti svoju nesigurnost davanjem raspona vrijednosti na stražnjoj raspodjeli vjerojatnosti koji uključuje 95% vjerojatnosti - to se naziva "interval vjerodostojnosti 95%."

Bayesovski partizan mogao bi kritizirati frekventistički interval pouzdanosti poput ovog: "Pa što ako 95 od 100 eksperimenata dobije interval pouzdanosti koji uključuje pravu vrijednost? Nije me briga za 99 eksperimenata koje nisam učinio; stalo mi je do ovog eksperimenta koji jesam. vaše pravilo dopušta 5 od 100 da budu potpune gluposti [negativne vrijednosti, nemoguće vrijednosti] sve dok su ostalih 95 točne; to je smiješno. "

Čest čovjek koji bi tvrdoglavo mogao kritizirati Bayesov interval vjerodostojnosti ovako: "Pa što ako je 95% stražnje vjerojatnosti uključeno u ovaj raspon? Što ako je istinska vrijednost, recimo, 0,37? Ako jest, onda je vaš metoda, pokrenite start to finish, bit će POGREŠNO 75% vremena. Vaš odgovor je: "Pa, to je u redu, jer prema prethodniku je vrlo rijetko da je vrijednost 0,37," i to može biti tako, ali želim metoda koja djeluje za BILO KOJU moguću vrijednost parametra. Nije me briga za 99 vrijednosti parametra KOJI NEMA; Meni je stalo do jedne istinske vrijednosti KOJA IMA. Oh, usput, i vaši odgovori su točni samo ako je prethodnik točan. Ako ga samo izvučete iz zraka jer se čini ispravnim, možete biti daleko. "

U određenom su smislu oba ova partizana točna u svojim kritikama međusobnih metoda, ali molio bih vas da matematički razmislite o razlici - kako objašnjava Srikant.


Evo proširenog primjera iz tog razgovora koji pokazuje razlika upravo u diskretnom primjeru.

Kad sam bila dijete, majka me povremeno iznenađivala naređujući da se staklenka čokoladnih kolačića dostavi poštom. Dostavna tvrtka nabavila je četiri različite vrste posuda za kolačiće - tip A, tip B, tip C i tip D, a svi su bili u istom kamionu i nikad niste bili sigurni koju ćete vrstu dobiti. Svaka je staklenka imala točno 100 kolačića, ali značajka koja je razlikovala različite posude s kolačićima bila je njihova distribucija čokoladnih čipsa po kolačiću. Ako ste posegnuli za staklenkom i slučajno jednoliko izvadili jedan kolačić, ovo su raspodjele vjerojatnosti koje biste dobili na broju čipova:

alt text

Staklenka kolačića tipa A, na primjer, sadrži 70 kolačića s po dva čipa, a nema kolačića s četiri ili više čipova! Staklenka za kolačiće tipa D sadrži 70 kolačića s po jednim čipom. Primijetite kako je svaki vertikalni stupac funkcija mase mase vjerojatnosti - uvjetna vjerojatnost broja čipova koje biste dobili s obzirom da je jar = A, ili B, ili C, ili D, a svaki stupac iznosi 100.

Volio sam igrati igru ​​čim je dostavljač ostavio moju novu posudu s kolačićima. Izvukao bih nasumce jedan jedini kolačić iz staklenke, prebrojao čipove na kolačiću i pokušao izraziti svoju nesigurnost - na razini od 70% - koje bi to staklenke moglo biti. Dakle, identitet staklenke (A, B, C ili D) je vrijednost parametra koja se procjenjuje. Broj čipova (0, 1, 2, 3 ili 4) je ishod ili opažanje ili uzorak.

Prvotno sam ovu igru ​​igrao koristeći frekventist, 70% interval pouzdanosti. Takav interval mora osigurati da bez obzira na pravu vrijednost parametra, što znači bez obzira koju posudicu za kolačiće nabavio, interval će pokrivati ​​tu pravu vrijednost s najmanje 70% vjerojatnosti.

Interval je, naravno, funkcija koja povezuje ishod (red) sa skupom vrijednosti parametra (skupom stupaca). No da bismo konstruirali interval pouzdanosti i zajamčili 70% pokrivenosti, moramo raditi "okomito" - gledajući svaki stupac redom i pazeći da je pokriveno 70% funkcije mase vjerojatnosti tako da 70% vremena identitet tog stupca bit će dio intervala koji rezultira. Imajte na umu da su vertikalni stupci ti koji tvore pmf.

Dakle, nakon što sam izveo taj postupak, završio sam s ovim intervalima:

enter image description here

Na primjer, ako je broj čipova na kolačiću koji izvučem 1, moj interval pouzdanosti bit će {B, C, D}. Ako je broj 4, moj interval pouzdanosti bit će {B, C}. Primijetite da budući da svaki stupac iznosi 70% ili više, bez obzira u kojem smo stupcu uistinu (bez obzira u koju je teglu dostavljač otpao), interval koji proizlazi iz ovog postupka uključivat će ispravnu posudu s najmanje 70% vjerojatnosti.

Primijetite također da je postupak koji sam slijedio pri konstruiranju intervala imao određenu diskreciju. U stupcu za tip B mogao sam se jednako lako pobrinuti da intervali koji uključuju B budu 0,1,2,3 umjesto 1,2,3,4. To bi rezultiralo pokrićem od 75% za staklenke tipa B (12 + 19 + 24 + 20), i dalje zadovoljavajući donju granicu od 70%.

Moja je sestra Bayesia ipak smatrala da je ovaj pristup lud. "Dostavljača morate smatrati dijelom sustava", rekla je. "Idemo prema identitetu tegle tretirati kao slučajnu varijablu i pretpostavimo da dostavljač jednoobrazno bira među njima - što znači da su sva četvorica na njegovom kamionu, a kad dođe u našu kuću, slučajno odabere jednu, svaka s jednakom vjerojatnošću. "

" Uz tu pretpostavku, pogledajmo sada zajedničke vjerojatnosti cijelog događaja - tip staklenke i broj čipove koje izvučete iz svog prvog kolačića ", rekla je crtajući sljedeću tablicu:

enter image description here

Primijetite da je cijela tablica sada funkcija mase mase vjerojatnosti - što znači cjelina tablica iznosi 100%.

"Ok", rekao sam, "kamo ste krenuli s ovim?"

"Gledali ste uvjetnu vjerojatnost broja čips, s obzirom na staklenku ", rekao je Bayesia. "To je sve pogrešno! Ono do čega vam je zapravo stalo jest uvjetna vjerojatnost o kojoj je posudici riječ, s obzirom na broj čipova na kolačiću! Vaš interval od 70% trebao bi jednostavno sadržavati staklenke s popisom koje ukupno imaju 70% vjerojatnosti da budu istinska tegla. Nije li to puno jednostavnije i intuitivnije? "

"Naravno, ali kako to izračunati?" Pitao sam.

"Recimo da znamo da ste dobili 3 žetona. Tada možemo zanemariti sve ostale retke u tablici i jednostavno tretirati taj redak kao funkciju mase mase vjerojatnosti . Morat ćemo proporcionalno povećati vjerojatnosti pa će svaki redak zbrojiti na 100. " Učinila je:

enter image description here

"Primijetite kako je svaki redak sada pmf i zbraja na 100%. Prebacili smo uvjetnu vjerojatnost s onoga s čime ste započeli - sada je vjerojatnost da je čovjek ispustio određenu teglu, s obzirom na broj čipsa na prvom kolačiću. "

" Zanimljivo ", rekao sam. "Dakle, sada samo zaokružimo dovoljno staklenki u svakom redu da bi se postigla vjerojatnost do 70%?" Upravo smo to učinili, praveći ove intervale vjerodostojnosti:

enter image description here

Svaki interval uključuje skup staklenki koje, a posteriori , iznose 70% vjerojatnost da budete istinska tegla.

"Pa, pričekaj", rekao sam. "Nisam uvjeren. Stavimo dvije vrste intervala jednu pored druge i usporedimo ih po pokrivenosti i, pod pretpostavkom da dostavljač odabere svaku vrstu staklenke s jednakom vjerojatnošću, vjerodostojno." to su:

Intervali povjerenja:

enter image description here

Intervali vjerodostojnosti:

enter image description here

"Vidite li koliko su ludi vaši intervali povjerenja?" rekao je Bayesia. "Nemate ni razuman odgovor kad crtate kolačić s nula čipova! Samo kažete da je to prazan interval. Ali to je očito pogrešno - to mora biti jedna od četiri vrste staklenki. Kako možete živjeti s sami, navodeći interval na kraju dana kada znate da je interval pogrešan? I isto tako kada povučete kolačić s 3 žetona - vaš je interval točan samo 41% vremena. ovaj interval pouzdanosti '70% 'je sranje. "

"Pa, hej", odgovorio sam. "Točno je u 70% slučajeva, bez obzira koju je teglu dostavljač ostavio. To je puno više nego što možete reći o vašim intervalima vjerodostojnosti. Što ako je tegla tipa B? Tada će vaš interval biti pogrešan u 80% slučajeva , i ispravite samo 20% vremena! "

" To se čini velikim problemom, "nastavio sam," jer će vaše pogreške biti povezane s vrstom staklenke. Ako pošaljete 100 'Bayesovih 'roboti da procijene koju vrstu staklenke imate, svaki robot uzorkuje jedan kolačić, kažete mi da ćete u danima tipa B očekivati ​​da će 80 robota dobiti pogrešan odgovor, od kojih svaki ima> 73% vjere u svoj netočan zaključak! To je problematično, pogotovo ako želite da se većina robota složi oko pravog odgovora. "

" PLUS morali smo pretpostaviti da se dostavljač ponaša jednoliko i nasumično odabire svaku vrstu staklenki ", Rekao sam. "Odakle to? Što ako to nije u redu? Niste razgovarali s njim; niste ga intervjuirali. Ipak, sve vaše izjave o a posteriori vjerojatnosti počivaju na ovoj izjavi o njegovom ponašanju. Nisam morao iznositi takve pretpostavke, a moj interval zadovoljava kriterij čak i u najgorem slučaju. "

" Istina je da moj interval vjerodostojnosti nema lošu izvedbu na posudama tipa B ", rekao je Bayesia . "Ali što onda? Staklenke tipa B događaju se samo 25% vremena. To je uravnoteženo mojim dobrim pokrivanjem staklenki tipa A, C i D. I nikad ne objavljujem gluposti."

"Istina je da moj interval pouzdanosti radi loše kad sam nacrtao kolačić s nula čipova ", rekao sam. "Ali što onda? Kolačići bez čipčića događaju se, u najgorem slučaju, najviše 27% slučajeva (staklenka tipa D). Mogu si priuštiti gluposti zbog ovog ishoda, jer NITA tegla neće rezultirati pogrešnim odgovorom više od 30 % vremena. "

" Stupac je suma važan ", rekao sam.

" Redak je suma važan ", rekao je Bayesia.

"Vidim da smo u ćorsokaku", rekao sam. "Oboje smo točni u matematičkim tvrdnjama koje dajemo, ali ne slažemo se oko odgovarajućeg načina kvantificiranja nesigurnosti."

"To je istina", rekla je moja sestra. "Želite kolačić?"

Dobar odgovor - samo jedna manja točka, kažete ".... Umjesto da kaže da parametar ima jednu istinsku vrijednost, Bayesova metoda kaže da je vrijednost odabrana iz neke raspodjele vjerojatnosti ....." To nije istina. Bayesovski odgovara distribuciji vjerojatnosti kako bi izrazio nesigurnost oko prave, nepoznate, fiksne vrijednosti. To govori koje su vrijednosti vjerojatne, s obzirom na ono što je bilo poznato prije promatranja podataka. Stvarna izjava vjerojatnosti je $ Pr [\ theta_0 \ in (\ theta, \ theta + d \ theta) | I] $, gdje je $ \ theta_0 $ prava vrijednost, a $ \ theta $ pretpostavljena, na temelju podataka $ I $.
... nastavak ... ali mnogo je prikladnije samo napisati $ p (\ theta) $, s razumijevanjem što to znači "u pozadini". Jasno je da to može izazvati mnogo zabune.
žao mi je što sam oživio ovaj super stari post, ali brzo pitanje, u svom postu u odjeljku u kojem frekventist kritizira Bayesov pristup kažete: "Što ako je prava vrijednost, recimo, 0,37? Ako jest, onda je vaša metoda, pokrenite start do kraja, bit će POGREŠNO 75% vremena. " Kako ste došli do tih brojeva? kako 0,37 odgovara 75% pogrešno? Je li to isključeno s neke vrste krivulje vjerojatnosti? Hvala
Super ilustracija! Kako bi se prilagodili intervali pouzdanosti i vjerodostojnosti modela čipsa, ako nam je dozvoljeno uzimanje n kolačića iz staklenke? A možemo li ocijeniti točnost dva pristupa dok akumuliramo podatke o relativnoj frekvenciji. staklenki koje se isporučuju? Pretpostavljam da će Bayesov pristup napraviti bolja predviđanja nakon što budemo prilično sigurni u prethodnu distribuciju (recimo nakon ~ 30 isporuka?). Ali ako bi se prethodni DBN naglo promijenio (recimo da novi dostavljač prihvati posao), prednost bi imao pristup frekventista.
@BYS2, kada autor kaže da "" Što ako je istinska vrijednost, recimo, 0,37? Ako jest, tada će vaša metoda, pokrenite start to finish, biti POGREŠNA 75% vremena ", oni samo daju primjere brojeva kojeizmišljeni.U ovom konkretnom slučaju mislili bi na neku prethodnu raspodjelu koja je imala vrlo nisku vrijednost od 0,37, s većinom gustoće vjerojatnosti negdje drugdje.I pretpostavljamo da bi se naša distribucija primjera izvodila vrlo loše kada bi stvarna vrijednost parametra bila 0,37, slično kao što su Bayesijini intervali vjerodostojnosti propali kad je slučajno staklenka bila tipa B.
Autor kaže `" očekivat ćete da će 80 robota dobiti pogrešan odgovor, od kojih svaki ima> 73% uvjerenja u njegov netočan zaključak! ", Ali to je trebalo biti`> 72% `uvjerenje, budući da je 72% minimalnovjerodostojnost u tablici intervala vjerodostojnosti.
#2
+39
user28
2010-09-01 21:01:43 UTC
view on stackexchange narkive permalink

Koliko razumijem, slijedi:

Pozadina

Pretpostavimo da imate neke podatke $ x $ i pokušavate procijeniti $ \ theta $ . Imate postupak generiranja podataka koji opisuje kako se $ x $ generira uvjetujući $ \ theta $. Drugim riječima, znate distribuciju $ x $ (recimo, $ f (x | \ theta) $.

Problem sa zaključivanjem

Vaš problem sa zaključivanjem je: Koje su vrijednosti $ \ theta $ razumne s obzirom na promatrane podatke $ x $?

Intervali povjerenja

Intervali povjerenja su klasičan odgovor na gore navedeni problem. U ovom pristupu pretpostavljate da postoji istinita, fiksna vrijednost $ \ theta $. S obzirom na ovu pretpostavku, koristite podatke $ x $ da biste došli do procjene $ \ theta $ (recimo, $ \ hat {\ theta} $). Jednom kad napravite procjenu, želite procijeniti gdje je prava vrijednost u odnosu na vašu procjenu.

Primijetite da je prema ovom pristupu prava vrijednost nije slučajna varijabla. To je fiksna, ali nepoznata veličina. Nasuprot tome, vaša procjena je slučajna varijabla jer ovisi o vašim podacima $ x $ koji su generirani iz vaših podataka Tako generirate postupak generiranja. Dakle, shvatite da svaki put kad ponovite studiju dobijete različite procjene.

Gornje razumijevanje vodi prema sljedećoj metodologiji za procjenu gdje je pravi parametar u odnosu na vašu procjenu. Definirajte interval, $ I \ equiv [lb (x), ub (x)] $ sa sljedećim svojstvom:

$ P (\ theta \ in I) = 0,95 $

Interval konstruiran kao gore je ono što se naziva interval pouzdanosti. Budući da je istinska vrijednost nepoznata, ali fiksna, istinska vrijednost je ili u intervalu ili izvan intervala. Interval pouzdanosti tada je izjava o vjerojatnosti da interval koji dobijemo zapravo ima istinsku vrijednost parametra. Dakle, izjava vjerojatnosti odnosi se na interval (tj. Na šanse na taj interval koji ima pravu vrijednost ili ne), a ne na mjestu prave vrijednosti parametra.

U ovoj je paradigmi besmisleno govoriti o vjerojatnosti da je istinska vrijednost manja ili veća od neke vrijednosti jer istinska vrijednost nije slučajna varijabla.

Vjerodostojni intervali

Za razliku od klasičnog pristupa, u bayesovskom pristupu pretpostavljamo da je istinska vrijednost slučajna varijabla. Dakle, bilježimo našu nesigurnost oko vrijednosti istinskog parametra nametanjem prethodne raspodjele na pravi vektor parametra (recimo $ f (\ theta) $).

Koristeći Bayesov teorem, konstruiramo stražnju raspodjelu za parametar vektor miješanjem prior i podataka koje imamo (nakratko stražnja strana je $ f (\ theta | -) \ propto f (\ theta) f (x | \ theta) $).

Zatim dolazimo do točke procjene pomoću stražnje raspodjele (npr. Koristimo srednju vrijednost stražnje raspodjele). Međutim, budući da je u skladu s ovom paradigmom pravi parametar parametar slučajna varijabla, također želimo znati opseg nesigurnosti koju imamo u svojoj točkovnoj procjeni. Dakle, konstruiramo interval takav da vrijedi sljedeće:

$ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0,95 $

Gore je vjerodostojan interval.

Vjerodostojni intervali bilježe našu trenutnu nesigurnost u mjestu vrijednosti parametara i stoga se mogu protumačiti kao vjerojatnost izjave o parametru.

Nasuprot tome, intervali pouzdanosti bilježe nesigurnost oko dobivenog intervala (tj. sadrži li on pravu vrijednost ili ne). Stoga ih se ne može tumačiti kao vjerojatnosnu izjavu o pravim vrijednostima parametara.

Interval pouzdanosti od 95% prema definiciji pokriva pravu vrijednost parametra u 95% slučajeva, kao što ste ispravno naznačili. Dakle, šansa da vaš interval pokriva pravu vrijednost parametra je 95%. Ponekad možete reći nešto o šansi da je parametar veći ili manji od bilo koje granice, na temelju pretpostavki koje napravite pri konstruiranju intervala (prilično često normalna raspodjela vaše procjene). Možete izračunati P (theta> ub) ili P (ub
Joris, ne mogu se složiti. Da, za bilo koju vrijednost parametra bit će> 95% vjerojatnosti da će rezultirajući interval pokriti pravu vrijednost. To ne znači da nakon poduzimanja određenog promatranja i izračunavanja intervala još uvijek postoji 95% uvjetne vjerojatnosti s obzirom na podatak da TAJ interval pokriva pravu vrijednost. Kao što sam rekao u nastavku, formalno bi bilo sasvim prihvatljivo da interval pouzdanosti ispljunite [0, 1] 95% vremena, a prazan set ostalih 5%. U slučajevima kada dobijete prazan set kao interval, nema 95% vjerojatnosti da je istinska vrijednost unutar!
@ Keith: Shvaćam vašu poantu, iako prazan skup po definiciji nije interval. Vjerojatnost intervala pouzdanosti također nije uvjetovana podacima, već naprotiv. Svaki interval pouzdanosti dolazi iz različitog slučajnog uzorka, pa šansa da je vaš uzorak izvučen tako da 95% CI na kojem se temelji ne pokriva pravu vrijednost parametra iznosi samo 5%, bez obzira na podatke.
Joris, koristio sam "data" kao sinonim za "sample", pa mislim da se slažemo. Moja poanta je da je nakon uzimanja uzorka moguće biti u situacijama kada sa apsolutnom sigurnošću možete dokazati da je vaš interval pogrešan - da ne pokriva pravu vrijednost. To ne znači da to nije valjani interval pouzdanosti od 95%. Dakle, ne možete reći da vam parametar pouzdanosti (95%) govori bilo što o vjerojatnosti pokrivanja određenog intervala nakon što obavite eksperiment i dobio interval. Samo naknadna vjerojatnost, o kojoj je obavijestio prior, može govoriti o tome.
@ Keith: Vidim tvoju poantu. Dakle, u Bayesovom pristupu uzimam difuzno prije konstruiranja istog intervala i nazivam ga vjerodostojnim intervalom. U frekventističkom pristupu, ako mogu s apsolutnom sigurnošću dokazati da je interval pogrešan, ili sam prekršio pretpostavke ili znam pravu vrijednost. U oba slučaja, interval pouzdanosti od 95% više nije valjan. Uključene pretpostavke podrazumijevaju difuzni prethodnik, tj. Potpuni nedostatak znanja o istinskom parametru. Ako imam predznanje, ne bih uopće trebao izračunati interval pouzdanosti.
Ne, bojim se da to još uvijek niste shvatili. Ni u jednom slučaju ne postoji zahtjev za "difuznim prethodnikom". U redu je izračunati interval pouzdanosti bez obzira imate li predznanje ili ne - poanta je u tome da interval pouzdanosti jednostavno ne zanima. Interval pouzdanosti jamči apsolutno vjerojatnost pokrića, čak i u najgorem slučaju. To neće biti "isti interval" kao interval vjerodostojnosti o kojem je obavijestio prethodnik, barem ne općenito.
I kao što sam rekao, formalno je posve prihvatljivo da na kraju eksperimenta dođete do određenog intervala pouzdanosti za koji možete dokazati da ne pokriva pravu vrijednost. To NE znači da interval nije bio važeći ili da to nije interval pouzdanosti od 95%. Naravno, ako ponovite isti eksperiment 100 puta, morate očekivati ​​da ćete dobiti takav besmislen rezultat manje od 5 puta, ali činjenica da dobijete dokazivu glupost 5% izvođenja formalno je u redu sve dok interval pouzdanosti pokriva vrijednosti ostalih 95% ishoda.
A transpozicija vrijedi za interval vjerodostojnosti - sasvim je prihvatljivo imati vrijednosti parametra koje daju interval vjerodostojnosti koji je uvijek pogrešan! Sve dok vaš prethodnik kaže da su te vrijednosti rijetke. Zamislite vrećicu koja sadrži bilijune ponderirane kovanice - od kojih jedna ima vjerojatnost glava 10%, a ostalo su pošteni novčići. Vaš eksperiment je: iz ove raspodjele izvucite novčić, prevrnite ga deset puta, prebrojite diskretni broj grla, a zatim navedite 95% vjerodostojni interval na glavi glava. Ako dobijete kovanicu "10%", interval će se UVIJEK NEPOKRITI. Opet, ne čini ga nevaljanim.
U jednom od Jaynesovih radovahttp: //bayes.wustl.edu/etj/articles/confidence.pdfOn izrađuje interval pouzdanosti, a zatim pokazuje da za određeni uzorak možete biti 100% sigurni da prava vrijednost ne leži u "povjerenju" interval". To ne znači da je CI "pogrešan", već samo to što frekventni interval povjerenja nije odgovor na pitanje "koji je to interval koji sadrži stvarnu vrijednost statistike s vjerojatnosti 95%". Nažalost, to je pitanje koje bismo željeli postaviti, zbog čega se CI često tumači kao da je odgovor na to pitanje. :-(
@Keith: Ne razumijem. Ako mislite da novčić od 10% daje glavu samo 1 u 10 puta, a na kraju imate 0 glava, ne možete izračunati interval pouzdanosti. Ako imate 1 glavu deset puta, vaš interval zaista neće pokrivati ​​50%. Ali nikad nisam tvrdio da je pokriveno. Samo sam tvrdio da je malo vjerojatno da ne pokriva. NE znam pravu vrijednost. Osim toga, svi CI (Wald, score, Pearson, ...) imaju lošu pokrivenost na rubovima prostora vjerojatnosti, definitivno sa samo 10 slučajeva. Dakle, ne bih izjavio ništa na temelju tog CI. Koristio bih izračun vjerojatnosti da bih došao do zaključka. Kao što je to učinio Bayes.
@Keith: ali shvatio sam vaše mišljenje - istinska vrijednost nije slučajna varijabla - slažem se. Moja greška.
Joris, moj zadnji komentar bio je o "95% vjerodostojnom intervalu" - a ne o intervalu povjerenja! Ako imate vrećicu s jedan bilijun poštenih kovanica i jedan novčić od 10% glava, a vaš eksperiment izvlači novčić slučajno iz vreće, prevrnite ga deset puta i zatim navedite interval vjerodostojnosti na vjerojatnosti glava, vaš interval vjerodostojnosti uvijek će biti [0,5, 0,5] bez obzira na sve. Stoga, ako ste slučajno izvukli nepravedan novčić, interval vjerodostojnosti uvijek će biti pogrešan.
Također se ne mogu složiti da "svi CI" imaju lošu pokrivenost na rubovima. Bilo koji točan CI i neki približni CI jamčit će da je pokrivenost uvijek veća od parametra pouzdanosti (npr. 95%), čak i u najgorem slučaju. To vrijedi za intervale Blyth-Still-Casella i Clopper-Pearson za određeni dio.
@Keith. Trebao bih navesti "loše" pokriće. Prevelika pokrivenost također je loša pokrivenost. Navest ću drugačije: na rubovima se točno prekrivanje ne podudara s odabranim pokrivanjem.
@svadalli - Bayesov pristup ne zauzima stajalište da je $ \ theta $ * nasumičan *. $ \ Theta $ nije ono što se distribuira ($ \ theta $ je fiksno, ali nepoznato), to je * neizvjesnost oko * $ \ theta $ * koja se distribuira, uvjetovana stanjem znanja o * $ \ theta $. Stvarna izjava vjerojatnosti koju $ f (\ theta) $ bilježi je $ Pr (\ theta \ text {je u intervalu} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. Zapravo se potpuno isti argument odnosi na $ X $, i njega se može smatrati fiksnim, ali nepoznatim.
#3
+13
Thylacoleo
2010-09-04 15:22:20 UTC
view on stackexchange narkive permalink

Ne slažem se sa Srikantovim odgovorom u jednoj temeljnoj točki. Srikant je ovo izjavio:

"Problem zaključivanja: Vaš problem zaključivanja je: Koje su vrijednosti θ razumne s obzirom na promatrane podatke x?"

Zapravo je ovo BAYESIAN INFERENCE PROBLEM. U Bayesovim statistikama nastojimo izračunati P (θ | x), tj. Vjerojatnost vrijednosti parametra s obzirom na promatrane podatke (uzorak). VJEROJATNI INTERVAL interval je intervala θ koji ima 95% šanse (ili bilo koji drugi) da sadrži istinsku vrijednost θ s obzirom na nekoliko pretpostavki u osnovi problema.

PROBLEM FREKVENTISTIČKOG UVIĐANJA je sljedeći:

Jesu li promatrani podaci x razumni s obzirom na pretpostavljene vrijednosti θ?

U frekvencijskim statistikama nastojimo izračunati P (x | θ), tj. vjerojatnost promatranja podataka (uzorka) s obzirom na pretpostavljene vrijednosti parametara. INTERVAL POVJERENJA (možda pogrešan naziv) tumači se kao: ako bi se eksperiment koji je generirao slučajni uzorak x ponovio mnogo puta, 95% (ili neki drugi) takvih intervala konstruiranih od tih slučajnih uzoraka sadržavalo bi pravu vrijednost parametra.

Nered s glavom? To je problem s frekventističkom statistikom i glavna stvar koju Bayesova statistika zahtijeva.

Kao što Sikrant ističe, P (θ | x) i P (x | θ) povezani su kako slijedi:

P (θ | x) = P (θ) P (x | θ)

Gdje je P (θ) naša prethodna vjerojatnost; P (x | θ) je vjerojatnost podataka uvjetovana tim prethodnim, a P (θ | x) je stražnja vjerojatnost. Prethodni P (θ) u osnovi je subjektivan, ali to je cijena znanja o Svemiru - u vrlo dubokom smislu.

Ostali dijelovi i Sikrantovih i Keithovih odgovora izvrsni su.

Tehnički ste u pravu, ali napominjete da interval pouzdanosti daje skup vrijednosti parametara za koje je nulta hipoteza istinita. Dakle, "jesu li promatrani podaci x razumni s obzirom na našu hipotezu o theti?" može se preoblikovati kao "Koje bi istinske vrijednosti theta bile kompatibilna hipoteza s obzirom na promatrane podatke x?" Imajte na umu da preformulisano pitanje ne znači nužno da se pretpostavlja da je theta slučajna varijabla. Preformulirano pitanje iskorištava činjenicu da provodimo testove nulte hipoteze pregledavajući pada li pretpostavljena vrijednost u interval pouzdanosti.
@svadali - intervali pouzdanosti procjenjuju * podatke * za fiksnu hipotezu. Stoga, kad mijenjate "fiksni" dio jednadžbe, ako propustite uzeti u obzir vjerojatnost hipoteze prije promatranja svojih podataka, tada ćete morati doći do nedosljednosti i nekoherentnih rezultata. Uvjetna vjerojatnost nije "ograničena" pri promjeni uvjeta (npr. Promjenom uvjeta možete promijeniti uvjetnu vjerojatnost od 0 do 1). Prethodna vjerojatnost uzima u obzir ovu samovolju. Kondicioniranje na X je izvedeno jer smo sigurni da je X došlo - promatrali smo X!
#4
+13
suncoolsu
2010-09-16 14:35:44 UTC
view on stackexchange narkive permalink

Prije navedeni odgovori vrlo su korisni i detaljni. Evo mojih 0,25 dolara.

Interval povjerenja (CI) koncept je zasnovan na klasičnoj definiciji vjerojatnosti (koja se naziva i "Frekvencijska definicija") da je vjerojatnost poput proporcije i da se temelji na aksiomatskom sustavu Kolmogrova (i drugi).

Vjerodostojni intervali (najviša stražnja gustoća, HPD) mogu se smatrati korijenima u teoriji odlučivanja, temeljenom na radovima Walda i de Finettija (i drugi su ih puno proširili).

Budući da su ljudi u ovoj temi učinili sjajan posao dajući primjere i razliku u hipotezama u Bayesovom i frekventističkom slučaju, naglasit ću samo nekoliko važnih točaka.

  1. CI se temelje na činjenici da se MORA napraviti zaključak o svim mogućim ponavljanjima aneksperimenta koji se mogu vidjeti, a NE samo na promatranim podacima gdje se asHPD-ovi POTPUNO temelje na promatranim podacima (i na našim pretpostavkama).

  2. Općenito CI-ovi NISU koherentni (bit će objašnjeni kasnije) gdje su HPD-ovi koherentni (zbog svojih korijena u teoriji odlučivanja). Koherentnost (kao što bih objasnio svojoj baki) znači: s obzirom na problem s klađenjem na vrijednost parametra, ako se klasični statističar (frekventist) kladi na CI, a bayesovski na HPD, frekvent je OBVEZAN za gubitak (isključujući trivijalni slučaj) kada je HPD = CI). Ukratko, ako želite sažeti nalaze svog eksperimenta kao vjerojatnost na temelju podataka, vjerojatnost MORA biti stražnja vjerojatnost (na temelju prethodne). Postoji teorem (usp. Heath i Sudderth, Annals of Statistics, 1978) koji (otprilike) kaže: Dodjela vjerojatnosti $ \ theta $ na temelju podataka neće donijeti siguran gubitnik ako i samo ako je dobiven na Bayesov način.

  3. Kako KI ne uvjetuju promatrane podatke (također se nazivaju CP "Načelo uvjetovanosti"), mogu postojati paradoksalni primjeri. Fisher je bio veliki pristaša CP-a i također je pronašao puno paradoksalnih primjera kada se to NIJE slijedilo (kao u slučaju CI). To je razlog zašto je za zaključivanje koristio p-vrijednosti, za razliku od CI. Prema njegovom mišljenju p-vrijednosti temeljile su se na promatranim podacima (o p-vrijednostima se može puno reći, ali ovdje nije fokus). Dva vrlo poznata paradoksalna primjera su: (4 i 5)

  4. Coxov primjer (Annals of Math. Stat., 1958): $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) za $ i \ u \ {1, \ dots, n \} $ i želimo procijeniti $ \ mu $ . $ n $ NIJE fiksan i odabire se bacanjem novčića. Ako rezultat bacanja novčića bude H, odabire se 2, inače 1000. Procjena "zdravog razuma" - srednja vrijednost uzorka je nepristrana procjena s varijancom 0,5 $ \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ . Što koristimo kao varijancu uzorka kada $ n = 1000 $ ? Nije li bolje (ili razumnije) koristiti procjenu varijance uzorka srednje vrijednosti kao 0,001 $ \ sigma ^ 2 $ (uvjetnu varijancu) umjesto stvarne varijance procjenitelja , što je OGROMNO !! ( 0,5 $ \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ ). Ovo je jednostavna ilustracija CP-a kada varijansu koristimo kao $ 0,001 \ sigma ^ 2 $ kada $ n = 1000 $ . $ n $ samostalno nema važnosti ili nema podataka za $ \ mu $ i $ \ sigma $ (tj. $ n $ im je pomoćno), ali DATI njegovu vrijednost, znate puno o" kvaliteti podataka ". To se izravno odnosi na CI jer oni uključuju varijansu koja ne bi trebala biti uvjetovana s $ n $ , tj. Na kraju ćemo koristiti veću varijansu, dakle nad konzervativnom. p>

  5. Welchov primjer: Ovaj primjer radi za bilo koji $ n $ , ali uzet ćemo $ n = 2 $ radi jednostavnosti. $ X_1, X_2 \ sim \ mathcal {U} (\ theta - 1/2, \ theta +1/2) $ (iid), $ \ theta $ pripada liniji Real. To podrazumijeva $ X_1 - \ theta \ sim \ mathcal {U} (- 1/2, 1/2) $ (iid). $ \ frac {1} {2} (X_1 + X_2) {\ bar x} - \ theta $ (imajte na umu da ovo NIJE statistika) ima neovisnu distribuciju od $ \ theta $ . Možemo odabrati $ c > 0 $ s.t. $ \ text {Prob} _ \ theta (-c < = {\ bar x} - \ theta < = c) = 1- \ alfa (\ približno 99 \%) $ , podrazumijevajući $ ({\ bar x} - c, {\ bar x} + c) $ je 99% CI od $ \ theta $ . Tumačenje ovog CI glasi: ako više puta uzmemo uzorke, dobit ćemo različit $ {\ bar x} $ i 99% (barem) puta sadržavat će true $ \ theta $ , ALI (slon u sobi) za DATI podatak, NE ZNAMO vjerojatnost da će CI sadržavati true $ \ theta $ . Sada uzmite u obzir sljedeće podatke: $ X_1 = 0 $ i $ X_2 = 1 $ , kao $ | X_1 - X_2 | = 1 $ , SIGURNO znamo da je interval $ (X_1, X_2) $ sadrži $ \ theta $ (jedna moguća zamjerka, $ \ text {Prob} (| X_1 - X_2 | = 1) = 0 $ , ali matematički se možemo nositi i neću o tome raspravljati). Ovaj primjer također lijepo ilustrira koncept koherentnosti. Ako ste klasični statističar, sigurno ćete se kladiti na 99% CI ne gledajući vrijednost $ | X_1 - X_2 | $ (pod pretpostavkom da ste vjerni svom profesija). Međutim, Bayesian će se kladiti na CI samo ako je vrijednost $ | X_1 - X_2 | $ blizu 1. Ako uvjetujemo $ | X_1 - X_2 | $ , interval je koherentan i igrač više neće biti siguran gubitnik (slično teoremu Heath-a i Sudderth-a).

  6. Fisher je imao preporuku za takve probleme - upotrijebite CP. Za Welchov primjer, Fisher je predložio uvjet $ X_2-X_1 $ . Kao što vidimo, $ X_2-X_1 $ pomoćno je za $ \ theta $ , ali pruža informacije o theta. Ako je $ X_2-X_1 $ MALO, nema puno podataka o $ \ theta $ u podatak. Ako je $ X_2-X_1 $ VELIKO, ima puno podataka o $ \ theta $ u podaci. Fisher je proširio strategiju uvjetovanja na pomoćnu statistiku na opću teoriju nazvanu Fiducijalno zaključivanje (koja se naziva i njegovim najvećim neuspjehom, usp. Zabell, Stat. Sci. 1992), ali nije postala popularna zbog nedostatak općenitosti i fleksibilnosti. Fisher je pokušavao pronaći način različit i od klasične statistike (Neymanove škole) i od bayesian škole (otuda i poznata izreka iz Savagea: "Fisher je želio napraviti Bayesov omlet (tj. Koristeći CP), a da nije razbio Bayesova jaja") . Folklor (nema dokaza) kaže: Fisher je u svojim raspravama napao Neymana (zbog pogreške tipa I i tipa II i CI) nazivajući ga tipom za kontrolu kvalitete , a ne znanstvenikom , jer Neymanove metode nisu uvjetovale promatrane podatke, već su promatrale sva moguća ponavljanja.

  7. Statističari također žele koristiti načelo dostatnosti (SP) uz CP. Ali SP i CP zajedno podrazumijevaju Princip vjerojatnosti (LP) (usp. Birnbaum, JASA, 1962), tj. S obzirom na CP i SP, mora se zanemariti prostor uzorka i gledati samo funkciju vjerojatnosti. Stoga trebamo samo gledati dane podatke, a NE čitav prostor uzorka (gledanje cijelog prostora uzorka na neki je način slično ponovljenom uzorkovanju). To je dovelo do koncepta poput Promatranih ribarskih informacija (usp. Efron i Hinkley, AS, 1978) koji mjere podatke o podacima iz frekventističke perspektive. Količina informacija u podacima je bayesovski koncept (i samim tim povezan s HPD-om), umjesto CI-a.

  8. Kiefer je napravio temeljni rad na CI-u kasnih 1970-ih, ali njegova proširenja nisu postala popularna. Dobar izvor reference je Berger ("Mogu li se Fisher, Neyman i Jeffreys složiti oko ispitivanja hipoteza", Stat Sci, 2003.).


Sažetak:

(Kao što su istaknuli Srikant i drugi)
CI se ne mogu protumačiti kao vjerojatnost i ne govore ništa o nepoznatom parametru DATI su promatrane podatke. CI su izjave o ponovljenim eksperimentima.

HPD su vjerojatnosni intervali na temelju stražnje raspodjele nepoznatog parametra i imaju tumačenje temeljeno na vjerojatnosti na temelju danih podataka.

Svojstvo frekventnog liječnika (ponovljeno uzorkovanje) je poželjno svojstvo i HPD-ovi (s odgovarajućim prioritetima) i CI ih imaju. HPD-ovi uvjetuju dane podatke i u odgovoru na pitanja o nepoznatom parametru

(Cilj NIJE Subjektivan) Bayesians se slažu s klasičnim statističarima da postoji jedna TRUE vrijednost parametra. Međutim, oboje se razlikuju u načinu na koji zaključuju o ovom istinskom parametru.

Bayesovi HPD-i pružaju nam dobar način uvjetovanja podataka, ali ako se ne slože s frekventičkim svojstvima CI-ja, nisu previše korisni (analogija: osoba koja koristi HPD-ove (s nekim prethodnim) bez dobrog frekventističkog svojstva , zasigurno će biti osuđen poput tesara koji brine samo o čekić i zaboravlja odvijač)

Napokon sam vidio ljude u ovoj temi (komentari dr. Jorisa: ". ..uključene pretpostavke podrazumijevaju difuzni prethodnik, tj. potpuni nedostatak znanja o istinskom parametru. ") govoreći o nedostatku znanja o istinskom parametru koji je ekvivalentan korištenju difuznog prioriteta. NE znam mogu li se složiti s izjavom (dr. Keith se slaže sa mnom). Na primjer, u slučaju osnovnih linearnih modela, neke se raspodjele mogu dobiti korištenjem ujednačenog prioriteta (koji su neki ljudi nazvali difuznim), ALI TO NE znači da se ujednačena raspodjela može smatrati NISKIM INFORMACIJSKIM PRETHODNIM. Općenito, NEINFORMATIVNI (Objektivni) prethodnik ne znači da ima malo podataka o parametru.



Napomena: Mnogo se ovih točaka temelji na predavanjima jednog od istaknutih bayesiana. Ja sam još uvijek student i mogao sam ga na neki način pogrešno shvatiti. Molimo vas da unaprijed prihvatite moje isprike.

"frekvent je OBVEZAN izgubiti" Gledajući odgovor s najviše glasova, pretpostavio bih da to ovisi o funkciji korisnosti (npr. ne ako se vrši optimizacija žaljenja).Intuitivno, to također može ovisiti o sposobnosti određivanja prethodne funkcije ...
"frekvent je OBVEZAN izgubiti" ... * uvjetujući odgovarajućim prethodnikom * (što, općenito, nije tako lako).Savršen primjer: ovisnici o kockanju 99% su sigurni da će se njihova sreća ovog puta promijeniti.Oni koji to prethodno uvrste u svoju analizu odluka, dugoročno obično ne idu tako dobro.
Mislim da intervale povjerenja ne biste trebali skraćivati kao * CI * u odgovoru na razliku između vjerodostojnih intervala i intervala povjerenja.
#5
+10
probabilityislogic
2011-06-14 21:37:11 UTC
view on stackexchange narkive permalink

Uvijek je zabavno baviti se malo filozofije. Sviđa mi se Keithov odgovor, no rekao bih da zauzima stav "gospodina zaboravnog Bayesia". Loša pokrivenost kada tip B i tip C može nastati samo ako primijeni istu raspodjelu vjerojatnosti na svakom ispitivanju i odbije ažurirati svoje prethodno.

To možete sasvim jasno vidjeti , za staklenke tipa A i tipa D takoreći daju "određena predviđanja" (za 0-1 odnosno 2-3 čipa), dok staklenke tipa B i C u osnovi daju jednoliku raspodjelu čipova. Dakle, na ponavljanjima eksperimenta s nekom fiksnom "pravom teglicom" (ili ako smo uzeli neki drugi biskvit), jednolična raspodjela čipsa pružit će dokaze za staklenke tipa B ili C.

"gledište, tip B i C zahtijevao bi ogroman uzorak da bi se mogli razlikovati. KL divergencije između dvije raspodjele su $ KL (B || C) \ približno 0,006 \ približno KL (C || B) $. Ovo je divergencija ekvivalentna dvije normalne raspodjele, obje s varijancom $ 1 $ i razlikom u sredstvima $ \ sqrt {2 \ puta 0,006} = 0,11 $. Stoga se ne može očekivati ​​da možemo diskriminirati na temelju jednog uzorka (u normalnom slučaju bilo bi nam potrebno oko 320 veličina uzorka da bismo otkrili tu razliku na 5% stupnju značajnosti). Dakle, opravdano možemo kolabirati tip B i tip C dok ne dobijemo dovoljno velik uzorak.

Što se sada događa s tim vjerodostojnim intervalima? Sad zapravo imamo 100% pokrivenost "B ili C"! Što je s frekvencijskim intervalima? Pokrivenost je nepromijenjena jer su svi intervali sadržavali i B i C ili niti jedan, tako da je i dalje podložan kritikama u Keithovu odgovoru - 59% i 0% za promatrane čipove od 3 i 0.

Ali, budimo pragmatični ovdje. Ako nešto optimizirate s obzirom na jednu funkciju, ne može se očekivati ​​da će dobro funkcionirati za drugu funkciju. Međutim, i frekvencijski i bayesovski intervali u prosjeku postižu željenu razinu vjerodostojnosti / pouzdanosti. Imamo $ (0 + 99 + 99 + 59 + 99) /5=71.2$ - tako da frekvent ima odgovarajuću prosječnu vjerodostojnost. Također imamo $ (98 + 60 + 66 + 97) /4=80.3$ - bayesian ima odgovarajuću prosječnu pokrivenost.

Još jedna stvar koju bih želio naglasiti je da Bayesian ne kaže da " parametar je slučajan "dodjeljivanjem raspodjele vjerojatnosti. Za Bayesov (dobro, barem za mene ionako) raspodjela vjerojatnosti je opis onoga što se zna o tom parametru. Pojam "slučajnosti" zapravo ne postoji u Bayesovoj teoriji, već samo pojmovi "znati" i "ne znati". "Znanci" ulaze u uvjete, a "nepoznanice" su ono za što izračunavamo vjerojatnosti, ako su od interesa, i marginaliziramo ako smetaju. Dakle, vjerodostojni interval opisuje ono što se zna o fiksnom parametru, prosjekujući ono što se o njemu ne zna. Dakle, ako bismo zauzeli položaj osobe koja je spakirala posudu s kolačićima i znala da je to tip A, njihov interval vjerodostojnosti bio bi samo [A], bez obzira na uzorak i bez obzira na to koliko je uzoraka uzeto. I bili bi 100% točni!

Interval pouzdanosti temelji se na "slučajnosti" ili varijaciji koja postoji u različitim mogućim uzorcima. Kao takve jedina varijacija koju uzimaju u obzir je ona u uzorku. Dakle, interval pouzdanosti je nepromijenjen za osobu koja je spakirala posudu s kolačićima i nova da je to bila vrsta A. Dakle, ako izvučete biskvit s 1 čipom iz posude tipa A, frekvent bi sa 70% pouzdanosti tvrdio da je tip bio nije A, iako znaju da je staklenka tip A! (ako su zadržali svoju ideologiju i zanemarili zdrav razum). Da biste vidjeli da je to slučaj, imajte na umu da ništa u ovoj situaciji nije promijenilo raspodjelu uzorka - mi smo jednostavno zauzeli perspektivu druge osobe s informacijama o parametru temeljenim na "podacima".

Povjerenje intervali će se mijenjati samo kad se promijene podaci ili promijeni distribucija modela / uzorkovanja. intervali vjerodostojnosti mogu se promijeniti ako se uzmu u obzir druge relevantne informacije.

Imajte na umu da ovo ludo ponašanje sigurno nije ono što bi zagovornik intervala povjerenja zapravo učinio; ali pokazuje slabost u filozofiji koja temelji metodu u određenom slučaju. Intervali povjerenja rade najbolje kada o parametru ne znate mnogo osim podataka sadržanih u skupu podataka. Dalje, intervali vjerodostojnosti neće se moći puno poboljšati na intervalima povjerenja, osim ako postoje prethodne informacije koje interval pouzdanosti ne može uzeti u obzir ili ako je pronalaženje dovoljne i pomoćne statistike teško.

Ne mogu reći da sam razumio Keithovo objašnjenje primjera staklenke, brzo pitanje: Ponovim pokus $ m $ puta, prikupio sam $ m $ različitih uzoraka, pa sam sada izračunao $ m $ različitih CI-a (svaki s 95% razina povjerenja), što je CI? Znači li to da bi 95% $ m $ CI-ja trebalo pokriti pravu vrijednost?
@loganecolss - to je doista istina, ali samo u granicama od $ m \ to \ infty $. To se podudara sa standardnom interpretacijom "vjerojatnost" = "dugotrajna frekvencija" koja je u osnovi CI-a.
Da, u ograničenju. Tada za jedan ili samo nekoliko uzoraka CI ne znače ništa, zar ne? Koja je onda svrha izračunavanja CI, ako nemam tone uzoraka?
@loganecolss - zato sam Bayesian.
@probabilityislogic Znači li to da je najbolje koristiti Bayesov pristup kad je nepoznato (s malim podacima), a frekventistički pristup kada nema nepoznanica (velikih podataka) za najbolje (/ najbrže?) Rezultate?
@nazka - nekako.Rekao bih da je uvijek najbolje koristiti Bayesov pristup bez obzira na to koliko podataka imate.Ako se to može dobro približiti frekvencijskim postupkom, onda to iskoristite.Bayesian nije sinonim za sporo.
@probabilityislogic Ok hvala!(Da, mislio sam biti brži i dovesti do optimalnog rješenja).Na Quori sam pročitao da će, ako usporedimo Bayesov i Frekvencijski pristup s Quicksortom, na primjer, Bayesov pristup dovesti do najoptimalnijeg intervala, a frekventistički pristup do intervala s najgorim slučajevima.Ako je to istina, mislim da je to stvarno najbolji i najbrži način da ih opišem.
#6
+7
Dikran Marsupial
2010-09-04 16:07:45 UTC
view on stackexchange narkive permalink

Koliko sam shvatio: Vjerodostojni interval je izjava o rasponu vrijednosti za statistiku od interesa koje ostaju vjerojatne s obzirom na određeni uzorak podataka koje smo stvarno promatrali. Interval pouzdanosti je iskaz učestalosti s kojom se prava vrijednost nalazi u intervalu pouzdanosti kada se eksperiment ponovi veći broj puta, svaki put s različitim uzorkom podataka iz iste temeljne populacije.

Obično je pitanje na koje želimo odgovoriti "koje su vrijednosti statistike u skladu s promatranim podacima", a vjerodostojni interval daje izravan odgovor na to pitanje - prava vrijednost statistike leži u 95% vjerodostojnom intervalu s vjerojatnošću 95%. Interval pouzdanosti ne daje izravan odgovor na ovo pitanje; nije točno tvrditi da je vjerojatnost da se istinska vrijednost statistike nalazi unutar intervala pouzdanosti od 95% 95% (osim ako se slučajno ne podudara s vjerodostojnim intervalom). Međutim, ovo je vrlo česta pogrešna interpretacija frekvencijskog intervala povjerenja, jer bi to tumačenje bilo izravan odgovor na pitanje.

Rad Jayne-a o kojem ću raspravljati u drugom pitanju daje dobar primjer za to ( primjer br. 5), jesu li konstruirani sasvim ispravni intervali pouzdanosti, gdje određeni uzorak podataka na kojima se temelji isključuje bilo kakvu mogućnost stvarne vrijednosti statistike u 95% intervalu pouzdanosti! To je problem samo ako se interval pouzdanosti pogrešno tumači kao status vjerojatnih vrijednosti statistike na temelju određenog uzorka koji smo promatrali.

Na kraju dana, to je stvar "konja za tečajeve", a koji je interval najbolji ovisi o pitanju na koje želite odgovoriti - samo odaberite metodu koja izravno odgovara na to pitanje.

Pretpostavljam da su intervali pouzdanosti korisniji pri analiziranju [namjeravanih] ponovljivih eksperimenata (jer je to samo pretpostavka koja stoji u osnovi intervala pouzdanosti), a vjerodostojni intervali bolji pri analizi podataka promatranja, ali to je samo mišljenje (koristim obje vrste intervala u vlastitom radu, ali ne bih se opisao kao stručnjaka ni u jednom.)

Problem s intervalima pouzdanosti u ponovljenim eksperimentima jest da bi, da bi mogli raditi, uvjeti ponovljivog eksperimenta trebali ostati isti (i tko bi to vjerovao?), Dok je Bayesov interval (ako se pravilno koristi) uvjeti na podaci koji se promatraju i na taj način pruža dopuštenja za promjene koje se događaju u stvarnom svijetu (putem podataka). Mislim da je zbog * pravila uvjetovanja * Bayesove statistike toliko teško nadmašiti (mislim da je to nemoguće: može se postići samo ekvivalencija) i zbog automatskih strojeva kojima to postiže čini se tako glatkim.
#7
+4
Chester Lin
2013-07-03 11:14:54 UTC
view on stackexchange narkive permalink

Otkrio sam da su mnoga tumačenja intervala pouzdanosti i vjerodostojnog skupa pogrešna. Na primjer, interval pouzdanosti ne može se izraziti u ovom formatu $ P (\ theta \ u CI) $. Ako pažljivo pogledate 'raspodjele' u zaključivanju frekventista i bajesovca, vidjet ćete kako Frekventist radi na uzorkovanju raspodjele podataka, dok Bayesian radi na (stražnjoj) raspodjeli parametra. Oni su definirani na potpuno različitim uzorcima i Sigma algebri.

Dakle, da, možete reći "Ako pokus ponovite puno puta, približno 95% od 95% CI pokriva pravi parametar". Iako u bajesovskom jeziku možete reći da se "istinska vrijednost statistike nalazi u 95% vjerodostojnom intervalu s vjerojatnosti 95%", međutim, sama ta vjerojatnost od 95% (u bajesovskom) samo je procjena. (Zapamtite da se temelji na raspodjeli uvjeta s obzirom na ove specifične podatke, a ne na raspodjeli uzorka). Ovaj procjenitelj trebao bi imati slučajnu pogrešku zbog slučajnog uzorka.

Bayesian pokušava izbjeći problem s pogreškom tipa I. Bayesian uvijek kaže da nema smisla govoriti o pogrešci tipa I u Bayesianu. To nije potpuno točno. Statističari uvijek žele izmjeriti mogućnost ili pogrešku koja kaže: "Vaši podaci sugeriraju vam da donesete odluku, ali populacija sugerira drugačije". To je nešto na što Bayesian ne može odgovoriti (ovdje su izostavljeni detalji). Nažalost, ovo je možda najvažnija stvar na koju bi statističar trebao odgovoriti. Statističari ne predlažu samo odluku. Statističari bi također trebali znati koliko odluka može poći po zlu.

Moram izmisliti sljedeću tablicu i pojmove kako bih objasnio koncept. Nadam se da ovo može pomoći u objašnjavanju razlike u intervalu povjerenja i vjerodostojnom skupu.

Imajte na umu da je stražnja distribucija $ P (\ theta_0 | Podaci_n) $, gdje je $ \ theta_0 $ definiran iz prethodnog $ P (\ theta_0) $. U frekventistu je raspodjela uzorka $ P (Data_n; \ theta) $. Distribucija uzorkovanja $ \ hat {\ theta} $ je $ P (\ hat {\ theta} _n; \ theta) $. Indeks $ n $ je veličina uzorka. Molimo nemojte koristiti oznaku $ P (Data_n | \ theta) $ za predstavljanje distribucije uzorka u frekvenciji. Možete razgovarati o slučajnim podacima u $ P (Data_n; \ theta) $ i $ P (\ hat {\ theta} _n; \ theta) $, ali ne možete govoriti o slučajnim podacima u $ P (\ theta_0 | Data_n) $.

Confidence Interval vs Credible Set

"???????" objašnjava zašto nismo u mogućnosti procijeniti pogrešku tipa I (ili bilo što slično) na Bayesovom jeziku.

Također imajte na umu da se vjerodostojni skupovi u nekim okolnostima mogu koristiti za približne intervale pouzdanosti. Međutim, ovo je samo matematička aproksimacija. Tumačenje bi trebalo ići s frekventizmom. Bayesova interpretacija u ovom slučaju više ne funkcionira.


Oznaka Thylacoleo u $ P (x | \ theta) $ nije česta. Ovo je još uvijek Bayesov. Ova oznaka uzrokuje temeljni problem u teoriji mjera kada se govori o frekventistu.

Slažem se sa zaključkom Dikrana Marsupijala. Ako ste recenzent FDA, uvijek želite znati mogućnost odobravanja prijave za lijek, ali lijek zapravo nije učinkovit. To je odgovor koji Bayesian ne može pružiti, barem u klasičnom / tipičnom Bayesianu.

#8
+3
user36160
2015-09-03 21:20:52 UTC
view on stackexchange narkive permalink

Generičko i dosljedno povjerenje i vjerodostojne regije. http://dx.doi.org/10.6084/m9.figshare.1528163 s kodom na http://dx.doi.org/10.6084/m9.figshare.1528187

Pruža opis vjerodostojnih intervala i intervala pouzdanosti za odabir skupa, zajedno s generičkim R kodom za izračunavanje s obzirom na funkciju vjerojatnosti i neke promatrane podatke. Dalje predlaže testnu statistiku koja daje vjerodostojne intervale pouzdanosti optimalne veličine koji su međusobno konzistentni.

Ukratko i izbjegavanje formula. Bayesov i vjerodostojni interval temelji se na vjerojatnosti parametara danih podacima . Prikuplja parametre koji imaju veliku vjerojatnost u vjerodostojni skup / interval. Vjerodostojni interval od 95% sadrži parametre koji zajedno imaju vjerojatnost 0,95 s obzirom na podatke.

Frekvencijski interval pouzdanosti temelji se na vjerojatnosti podataka koji imaju neke parametre . Za svaki (moguće beskonačno mnogo) parametar prvo generira skup podataka koji će se vjerojatno promatrati s obzirom na parametar. Zatim provjerava za svaki parametar sadrže li odabrani podaci velike vjerojatnosti promatrane podatke. Ako podaci velike vjerojatnosti sadrže promatrane podatke, odgovarajući parametar dodaje se intervalu pouzdanosti. Dakle, interval pouzdanosti je prikupljanje parametara za koje ne možemo isključiti mogućnost da je parametar generirao podatke. To daje pravilo da, ako se opetovano primjenjuje na slične probleme, interval pouzdanosti od 95% sadržavat će istinsku vrijednost parametra u 95% slučajeva.

95% vjerodostojnog skupa i 95% pouzdanosti postavljenog za primjer iz negativne binomne raspodjele 95% Credible set and 95% Confidence set for negative binomial distribution

Opis intervala pouzdanosti nije točan."95%" dolazi iz vjerojatnosti da će uzorak iz populacije proizvesti interval koji sadrži pravu vrijednost parametra.
@jlimahaverford - Opis je točan kao i vaš.Da bih napravio vezu na ono što opisujete, dodao sam "Ovo daje pravilo da će, ako se opetovano primjenjuje na slične probleme, 95% vjerodostojni interval sadržavati istinsku vrijednost parametra u 95% slučajeva."
Nisam govorio o vašem opisu vjerodostojnih intervala, govorio sam o intervalima povjerenja.Sad primjećujem da usred vašeg odlomka o intervalima povjerenja ponovno počinjete govoriti o vjerodostojnom i mislim da je ovo pogreška.Važna ideja je sljedeća: "Da je ovo istinska vrijednost parametra, kolika je vjerojatnost da bih izvukao uzorak ove krajnosti ili više. Ako je odgovor veći od 5%, to je u intervalu pouzdanosti."
-1
hmm, ne vidim da je ispravljeno.
@jlimahaverford - Sad glasi: "To daje pravilo da će, ako se opetovano primjenjuje na slične probleme, interval pouzdanosti od 95% sadržavati istinsku vrijednost parametra u 95% slučajeva."
#9
+2
kjetil b halvorsen
2016-12-24 07:13:30 UTC
view on stackexchange narkive permalink

Ovo je više komentar, ali predugo.U sljedećem radu: Zora doba stohastičnosti (David Mumford) Mumford ima sljedeći zanimljiv komentar:

Iako su korištene sve ove zaista uzbudljive upotrebestatistike, većina samih statističara, na čelu sa Sir RA-omFisher, plešući ruke iza leđa, inzistirajući na tome da se statistika ne može koristiti u bilo kojim, ali potpuno ponovljivim situacijama, i samo koristeći empirijske podatke.Ovo je takozvana "frekventistička škola" koja se borila s Bayesovom školom koja je vjerovala da se mogu koristiti pretporijeci i da se uporaba statističkih zaključaka uvelike proširila.Ovaj pristup poriče da statističko zaključivanje može imati bilo kakve veze sa stvarnim razmišljanjima, jer su situacije iz stvarnog života uvijek zakopane u kontekstualne varijable i ne mogu se ponoviti. Srećom, Bayesova škola nije potpuno umrla, što je nastavio DeFinetti, E.T.Jaynes, sušni i drugi.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...