Pitanje:
Značenje cjelovitosti statistike?
Tim
2013-03-24 04:25:13 UTC
view on stackexchange narkive permalink

Iz Wikipedije:

Za statistiku $ s $ kaže se da je potpuna za raspodjelu $ X $ ako je za svaku mjerljivu funkciju $ g $ (koja mora biti neovisan o parametru $ θ $) vrijedi sljedeća implikacija: $$ \ mathbb {E} _ \ theta [g (s (X))] = 0, \ forallθ \ text {podrazumijeva da} P_θ (g (s ( X)) = 0) = 1, \ forall θ. $$ Za statistiku $ s $ kaže se da je ograničeno potpuna ako implikacija vrijedi za sve ograničene funkcije $ g $.

I pročitajte i složite se s Xi'anom i phaneronom da potpuna statistika znači da "na temelju nje može postojati samo jedan nepristrani procjenitelj.

  1. Ali ja ne razumijem što Wikipedia kaže na početku istog članka:

    U osnovi je to (cjelovitost je svojstvo statistike) uvjet koji osigurava da parametri raspodjele vjerojatnosti koji predstavljaju model, svi se mogu procijeniti na temelju statistike: osigurava da raspodjele koje odgovaraju t o različite vrijednosti parametara su različite.

    • U kojem smislu (i zašto) cjelovitost "osigurava da su raspodjele koje odgovaraju različitim vrijednostima parametara različite" ? je li "raspodjela" raspodjela kompletne statistike?

    • U kojem smislu (i zašto) cjelovitost "osigurava da svi parametri raspodjele vjerojatnosti koji predstavljaju model mogu biti svi procjenjuje se na temelju statistike "?

  2. [Izborno: Što znači" ograničena cjelovitost "u odnosu na cjelovitost?]

Provjerite ovo drugo pitanje: http://stats.stackexchange.com/questions/41881/what-is-complete-sufficient-statistics
@Zen:Hvala! Zašto nam onda treba "ograničena cjelovitost"?
Oboje su tehnički (regularni) uvjeti koji imaju više smisla u kontekstu dokaza teorema u kojima su uključeni. Stoga bi moj savjet bio proučiti dokaze Lehmann-Schefféova teorema, Bahadurovog teorema i Basuova teorema.
Prilično sam sumnjičav da cjelovitost sama po sebi podrazumijeva prepoznatljivost parametara: započnite s kompletnom statistikom za obitelj distribucija indeksiranih $ \ theta $ i dodajte dodatni i beskorisni parametar $ \ eta $.Tada statistika ostaje cjelovita.
Pogledajte i moj relevantan odgovor [ovdje] (https://stats.stackexchange.com/questions/196601/what-is-the-intuition-behind-defining-completeness-in-a-statistic-as-being-impos)
Tri odgovori:
Lhunt
2015-01-02 01:41:42 UTC
view on stackexchange narkive permalink

Ovo je vrlo dobro pitanje s kojim se borim već duže vrijeme. Evo kako sam odlučio razmisliti o tome:

Uzmi suprotnost definiciji kako je navedena u Wikipediji (što uopće ne mijenja logičko značenje):

\ begin {align} {\ rm If} \ quad & \ neg \ \ forall \ theta \ P (g (T (x)) = 0) = 1 \\ {\ rm then} \ quad & \ neg \ \ forall \ theta \ E (g (T (x))) = 0 \ end {align}

Drugim riječima, ako postoji vrijednost parametra takva da $ g (T (x)) $ nije gotovo sigurno $ 0 $, tada postoji vrijednost parametra takva da očekivana vrijednost te statistike nije $ 0 $.

Hmm. Što to uopće znači?

Pitajmo što se događa kada $ T (x) $ NIJE dovršen ...

Statistika $ T (x) $ koja NIJE dovršena će imaju barem jednu vrijednost parametra tako da $ g (T (x)) $ nije gotovo sigurno $ 0 $ za tu vrijednost, a ipak je očekivana vrijednost 0 $ za sve vrijednosti parametara (uključujući i ovu).

Drugim riječima, postoje vrijednosti $ \ theta $ za koje $ g (T (x)) $ ima ne-trivijalnu raspodjelu (u sebi ima neke slučajne varijacije), a ipak očekivana vrijednost $ g (T (x)) $ je bez obzira na to uvijek $ 0 $ - ne pomiče se bez obzira na to koliko se $ \ theta $ razlikuje.

Kompletna statistika, s druge strane će, maknuti u očekivanoj vrijednosti na kraju ako je $ g (T (x)) $ netrivijalno raspoređen i centriran na $ 0 $ za neki $ \ theta $.

Drugim putem ako nađemo funkciju $ g (\ cdot) $ gdje je očekivana vrijednost nula za neku vrijednost $ \ theta $ (recimo $ \ theta_0 $) i ona ima netrivijalnu raspodjelu s obzirom na vrijednost $ \ theta $, tada mora postojati još jedan va vrijednost $ \ theta $ vani (recimo, $ \ theta_1 \ ne \ theta_0 $) koja rezultira drugačijim očekivanjima za $ g (T (x)) $.

To znači da ovu statistiku zapravo možemo koristiti za testiranje hipoteza i informativnu procjenu u kontekstu pretpostavljene distribucije naših podataka. Želimo ga moći centrirati oko pretpostavljene vrijednosti $ \ theta $ i postići da očekuje 0 za tu pretpostavljenu vrijednost $ \ theta $, ali ne i za sve ostale vrijednosti $ \ theta $. Ali ako statistika nije potpuna, to možda nećemo moći učiniti: možda nećemo moći odbiti bilo koju pretpostavljenu vrijednost $ \ theta $. Ali tada ne možemo graditi intervale povjerenja i vršiti statističke procjene.

Dobrodošli na stranicu i hvala što ste doprinijeli ovome.Dao sam si slobodu formatiranja vašeg odgovora pomoću oznake $ \ LaTeX $ koju nudi naša web stranica.Ako vam se ne sviđa, vratite ga uz moje isprike.(Ako vam se sviđa, više informacija o oblikovanju ima [ovdje] (http://stats.stackexchange.com/help/formatting).) Budući da ste ovdje novi, zašto ne biste se [registrirali] (http: //stats.stackexchange.com/help/account) svoj račun i krenite u našu [turneju] (http://stats.stackexchange.com/tour) koja sadrži informacije za nove korisnike.
Bjørn Kjos-Hanssen
2015-01-02 03:03:06 UTC
view on stackexchange narkive permalink

Geometrijski cjelovitost znači otprilike ovo: ako je vektor $ g (T) $ ortogonalan p.d.f. $ f_ \ theta $ od $ T $ za svaki $ \ theta $, $$ \ mathbb E_ \ theta g (T) = \ langle g (T), f_ \ theta \ rangle = 0 $$ pa $ g (T) = 0 $ tj. Funkcije $ f_ \ theta $ za varijabilne $ \ theta $ obuhvaćaju čitav prostor funkcija $ T $. Tako da bi na neki način bilo prirodnije reći da je

$ \ theta $ dovršen za $ T $

od onoga što mi kažemo,

$ T $ je dovršen za $ \ theta $ .

Na ovaj način nije toliko čudno da bi konstantna funkcija bila "dovršena"!


Možda primjer pomaže.

Pretpostavimo da su $ X $ i $ Y $ neovisne i identično raspoređene Bernoullijeve ($ \ theta $) slučajne varijable koje uzimaju vrijednosti u $ \ {0, 1 \} $, a $ Z = XY $. Tada je $ Z $ nepotpuno za $ \ theta $, jer uzimanje $ g = \ text {identity} $, $$ \ mathbb E_ \ theta (Z) = 0 $$ za svih $ 0< \ theta<1 $, ali unatoč tome $ \ mathbb P_ \ theta (Z = 0) \ ne 1 $.

Na ovaj način se vidi stvarno značenje onoga što "cxompleteness" znači u postavkama Hilbertovog prostora ...
Semoi
2017-06-15 16:52:37 UTC
view on stackexchange narkive permalink

Smatram da je ovo vrlo korisno:

Definicija: statistika $ T $ naziva se dovršena ako je $ E_ \ theta [g (T)] = 0 $ za sve $ \ theta $ i neka funkcija $ g $ implicira da je $ P_ \ theta (g (T) = 0) = 1 $ za sve $ \ theta $.

Smatrajte ovo analognim vektorima i čine li vektori {$ v_1, \ ldots, v_n $} cjeloviti skup (= osnovu) vektorskog prostora.

  • Ako obuhvaćaju čitav prostor, bilo koji $ v $ može se zapisati kao linearna kombinacija ovih vektora: $ v = \ sum_j a_j \ cdot v_j $.
  • Nadalje, ako je vektor $ w $ ortogonalan svim $ v_j $, tada je $ w = 0 $.

Da bismo uspostavili vezu s definicijom cjelovitosti, razmotrimo slučaj diskretne raspodjele vjerojatnosti. Počinjemo ispisivanjem uvjeta cjelovitosti $$ 0 = E_ \ theta [g (t)] = \ sum_t g (t) \ cdot P_ \ theta (T = t) = \ sum_j g (t_j) \ cdot P_ \ theta (T = t_j) = \ begin {bmatrix} g (t_1) \\ g (t_2) \\ \ ldots \\ g (t_n) \\ \ end {bmatrix} \ cdot \ begin {bmatrix} p_ \ theta (t_1) \\ p_ \ theta (t_2) \\ \ ldots \\ p_ \ theta (t_n) \\ \ end {bmatrix} $$ za sve $ \ theta $. Ovdje smo zbroj izrazili kao skalarni umnožak dva vektora $$ (g (t_1), g (t_2), ...) $$ i $$ (p_ \ theta (t_1), p_ \ theta (t_2), ...) $$, s $ p_ \ theta (t_j) = P_ \ theta (T = t_j) \ ne 0 $ - smatramo samo pozitivne vjerojatnosti, jer ako je $ p (t_j) = 0 $, to nam ne govori ništa o funkciji $ g (t_j) $. Sada vidimo analogiju s gore spomenutim uvjetom ortogonalnosti.

U principu može biti da $ g (t_j) $ nisu nula, ali da se zbrajaju na nulu. Međutim, kako je izjavio Lhunt, to je moguće samo ako

  • vektor vjerojatnosti $ (p_ \ theta (t_1), p_ \ theta (t_2), ...) $ ili se uopće ne mijenja ako je $ \ theta $ promijenjen,
  • ili ako se promijeni na "jednostavan način", npr. skače s jedne vrijednosti za sve $ j $ -e na drugu vrijednost za sve $ j $ -e,
  • ili ako se promijeni na "korelirani način", što bi moglo biti noćna mora.

Stoga je unakrsno poništavanje pojmova moguće samo ako raspodjela vjerojatnosti pruža ili "dosadni skup osnovnih vektora" ili noćnu moru.

Suprotno tome, ako raspodjela vjerojatnosti pruža "dovoljno bogat skup baznih vektora", jednadžba za vrijednost očekivanja podrazumijeva $ g (t_j) = 0 $ gotovo svugdje .Pod gotovo svugdje mislimo da bi mogao postojati skup vjerojatnosti nula, gdje $ g (t_j) \ ne 0 $ - na pr.u slučaju kontinuirane raspodjele vjerojatnosti to bi mogao biti skup pojedinačnih točaka.

Također vidimo da terminologija pomalo zavarava.Bilo bi točnije obitelj distribucija $ p_ \ theta (\ cdot) $ nazvati potpunom (a ne statistikom $ T $) - kako je navedeno u izvornom pitanju.U svakom slučaju, cjelovitost znači da zbirka distribucija za sve moguće vrijednosti $ \ theta $ pruža dovoljno bogat skup vektora.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...