Pitanje:
Razlika između standardne pogreške i standardne devijacije
louis xie
2012-07-15 15:21:12 UTC
view on stackexchange narkive permalink

Trudim se razumjeti razliku između standardne pogreške i standardnog odstupanja. Kako se razlikuju i zašto trebate izmjeriti standardnu ​​pogrešku?

Brzi komentar, a ne odgovor jer su već prisutna dva korisna: standardna devijacija svojstvo je (raspodjele) slučajnih varijabli. Standardna se pogreška umjesto toga odnosi na mjerenje na određenom uzorku. Njih dvoje mogu se zbuniti kada zamagljuju razliku između svemira i vašeg uzorka.
Moguće od interesa: http://stats.stackexchange.com/questions/15505/converting-standard-error-to-standard-deviation
četiri odgovori:
Harvey Motulsky
2012-07-16 19:11:56 UTC
view on stackexchange narkive permalink

Evo praktičnijeg (a ne matematičkog) odgovora:

  • SD (standardna devijacija) kvantificira raspršenje - koliko vrijednosti variraju od jedne do druge.
  • SEM (standardna pogreška srednje vrijednosti) kvantificira koliko točno znate pravu srednju vrijednost populacije. Uzima se u obzir i vrijednost SD-a i veličina uzorka.
  • I SD i SEM nalaze se u istim jedinicama - jedinicama podataka.
  • SEM je po definiciji uvijek manji od SD-a.
  • SEM postaje sve manji kako vaši uzorci postaju veći. To čini smisla, jer je sredina velikog uzorka vjerojatno bliža pravoj srednjoj populaciji nego što je srednja vrijednost malog uzorka. S ogromnim uzorkom, sa velikom preciznošću ćete znati vrijednost srednje vrijednosti, čak i ako su podaci vrlo raspršeni.
  • SD se ne mijenja predvidljivo dok prikupljate više podataka. SD koji izračunate iz uzorka najbolja je moguća procjena SD ukupne populacije. Kako prikupljate više podataka, preciznije ćete procjenjivati ​​SD stanovništva. Ali ne možete predvidjeti hoće li SD iz većeg uzorka biti veći ili manji od SD iz malog uzorka. (Ovo je pojednostavljenje, ne baš točno. Pogledajte komentare u nastavku.)

Imajte na umu da se standardne pogreške mogu izračunati za gotovo bilo koji parametar koji izračunate iz podataka, a ne samo za srednju vrijednost. Izraz "standardna pogreška" pomalo je dvosmislen. Gornje točke odnose se samo na standardnu ​​pogrešku srednje vrijednosti.

(Iz Vodiča za statistiku GraphPada koji sam napisao.)

+1 Za jasne, korisne savjete. No, slijede neka pojašnjenja, od kojih najvažnije ide do posljednjeg metka: ** Želio bih vas izazvati na igru ​​predviđanja SD-a. ** Primjećujemo SD od $ n $ iid uzoraka, recimo, normalnog distribucija. * Ja * ću predvidjeti hoće li SD biti veći ili niži nakon dodatnih 100 * n $ uzoraka, recimo. Ako sam u pravu, platiš mi dolar, inače ti platim dolar. (Uz pravilnu igru ​​- koju vas pozivam da shvatite! - očekivanje ove igre je za mene pozitivno, dostižući čak oko 0,18 američkih dolara kada je n = 2 američka dolara.)
@whuber: Naravno da si u pravu. Varijansa (SD na kvadrat) neće se promijeniti predvidljivo kad dodate više podataka. SD će postati malo veći kako se veličina uzorka povećava, pogotovo kada započnete s malim uzorcima. Ova je promjena sićušna u usporedbi s promjenom SEM-a kako se mijenja veličina uzorka.
@HarveyMotulsky: Zašto se sd povećava?
Kod velikih uzoraka, varijansa uzorka bit će prilično blizu varijansi populacije, pa će uzorak SD biti blizu SD populacije. S manjim uzorcima, varijansa uzorka u prosjeku će biti jednaka varijansi populacije, ali razlike će biti veće. Ako su simetrične kao varijance, bit će asimetrične kao SD. Primjer: Varijacija stanovništva iznosi 100. Dvije varijance uzorka su 80 ili 120 (simetrične). Uzorak SD trebao bi biti 10, ali bit će 8,94 ili 10,95. Prosječni SD uzoraka iz simetrične raspodjele oko varijance populacije, a srednji SD bit će nizak, s niskim N.
ocram
2012-07-15 15:51:31 UTC
view on stackexchange narkive permalink

Neka $ \ theta $ bude vaš parametar od interesa za koji želite zaključiti. Da biste to učinili, na raspolaganju vam je uzorak opažanja $ \ mathbf {x} = \ {x_1, \ ldots, x_n \} $, zajedno s nekom tehnikom za dobivanje procjene $ \ theta $, $ \ hat {\ theta} (\ mathbf {x}) $. U ovom zapisu izričito sam da $ \ hat {\ theta} (\ mathbf {x}) $ ovisi o $ \ mathbf {x} $. Dapače, da ste imali drugi uzorak, $ \ tilde {\ mathbf {x}} $, završili biste s drugom procjenom, $ \ hat {\ theta} (\ tilde {\ mathbf {x}}) $. To čini $ \ hat {\ theta} (\ mathbf {x}) $ realizacijom slučajne varijable koju označujem $ \ hat {\ theta} $. Ova slučajna varijabla naziva se procjenitelj. Standardna pogreška $ \ hat {\ theta} (\ mathbf {x}) $ (= procjena) je standardno odstupanje $ \ hat {\ theta} $ (= slučajna varijabla). Sadrži informacije o tome koliko ste sigurni u svoju procjenu. Ako je velik, znači da biste mogli dobiti potpuno drugačiju procjenu da ste izvukli drugi uzorak. Standardna pogreška koristi se za konstrukciju intervala povjerenja.

Je li standardna pogreška procjene jednaka standardnoj devijaciji procijenjene varijable?
Michael R. Chernick
2012-07-15 18:40:00 UTC
view on stackexchange narkive permalink

Da bi dovršio odgovor na pitanje, Ocram je lijepo riješio standardnu ​​pogrešku, ali je nije suprotstavio standardnoj devijaciji i nije spomenuo ovisnost o veličini uzorka. Kao poseban slučaj procjenitelja uzmite u obzir srednju vrijednost uzorka. Standardna pogreška za srednju vrijednost je $ \ sigma \, / \, \ sqrt {n} $ gdje je $ \ sigma $ standardna devijacija populacije. Dakle, u ovom primjeru eksplicitno vidimo kako se standardna pogreška smanjuje s povećanjem veličine uzorka. Standardno odstupanje najčešće se koristi za upućivanje na pojedinačna zapažanja. Dakle, standardna devijacija opisuje varijabilnost pojedinačnih promatranja, dok standardna pogreška pokazuje varijabilnost procjenitelja. Dobri procjenitelji su dosljedni, što znači da se konvergiraju u pravu vrijednost parametra. Kada se njihova standardna pogreška smanji na 0 kako se veličina uzorka povećava, procjenitelji su dosljedni, što se u većini slučajeva događa jer standardna pogreška ide na 0 kao što to eksplicitno vidimo sa sredinom uzorka.

Re: "... dosljedni, što znači da se njihova standardna pogreška smanjuje na 0" - to nije istina. Sjećate li se ove rasprave: http://stats.stackexchange.com/questions/31036/what-is-the-difference-between-a-consistent-estimator-and-an- unbiated-estimator?
Da, naravno da se sjećam rasprave o neobičnim iznimkama i razmišljao sam o tome kad sam odgovorio na pitanje. Ali pitanje se odnosilo na standardne pogreške i u pojednostavljenom smislu dobre procjene parametara su dosljedne i njihove standardne pogreške teže 0, kao u slučaju srednje vrijednosti uzorka.
Slažem se s vašim komentarom - standardna pogreška uzorka srednje vrijednosti iznosi 0 ** i ** vrijednost uzorka je dosljedna. Ali njegova standardna pogreška koja ide na nulu nije posljedica (ili ekvivalentna) činjenici da je dosljedna, što kaže i vaš odgovor.
@Macro da odgovor bi se mogao poboljšati što sam i odlučio. Mislim da je važno ne biti previše tehnički s OP-ima jer kvalificiranje svega može biti komplicirano i zbunjujuće. Ali tehničku točnost ne treba žrtvovati zbog jednostavnosti. Tako da mislim da je način na koji sam se obratio ovome u svom uređivanju najbolji način za to.
Slažem se da je važno da ne dobivate tehničke informacije ukoliko to nije prijeko potrebno. Moj jedini komentar bio je da, nakon što ste već odlučili uvesti pojam dosljednosti (tehnički koncept), nema koristi od pogrešnog karakteriziranja u ime lakšeg razumijevanja odgovora. Mislim da se vaše uređivanje ipak obraća mojim komentarima.
John
2016-04-18 04:19:18 UTC
view on stackexchange narkive permalink

(imajte na umu da se fokusiram na standardnu ​​pogrešku srednje vrijednosti, za koju vjerujem da je i ispitivač bio, ali možete generirati standardnu ​​pogrešku za bilo koji uzorak statistike)

Standardna je pogreška povezana standardnoj devijaciji, ali nisu ista stvar, a povećanje veličine uzorka ne čini ih bližim. Dapače, to ih čini udaljenijima. Standardno odstupanje uzorka približava se standardnom odstupanju populacije kako se veličina uzorka povećava, ali ne i standardna pogreška.

Ponekad je terminologija oko toga malo gusta za proći.

Kada prikupite uzorak i izračunate standardno odstupanje tog uzorka, kako uzorak raste u veličini, procjena standardnog odstupanja postaje sve preciznija. Iz vašeg pitanja izgleda da ste o čemu ste razmišljali. Ali također uzmite u obzir da je srednja vrijednost uzorka obično u prosjeku bliža prosjeku populacije. To je kritično za razumijevanje standardne pogreške.

Standardna pogreška govori o tome što bi se dogodilo ako dobijete više uzoraka zadane veličine. Ako uzmete uzorak od 10, možete dobiti procjenu srednje vrijednosti. Zatim uzimate još jedan uzorak od 10 i novu prosječnu procjenu itd. Standardno odstupanje sredstava tih uzoraka je standardna pogreška. S obzirom na to da ste postavili pitanje, sada vjerojatno možete vidjeti da je, ako je N veliko, tada standardna pogreška manja jer će manje vjerojatno da će sredstva uzoraka odstupati od stvarne vrijednosti.

Nekima koji zvuči nekako čudesno s obzirom da ste to izračunali iz jednog uzorka. Dakle, ono što biste mogli učiniti je pokretanje standardne pogreške kroz simulaciju kako biste pokazali vezu. U R-u to bi izgledalo ovako:

  # veličina uzorkovanog <- 10 # postavi pravu vrijednost srednje vrijednosti i standardne devijacijem <- 50s <- 100 # sada generira puno i puno uzoraka sa srednjom vrijednosti m i standardne devijacije s # i dobijte sredstva tih uzoraka. Spremi ih u god.
y <- replika (10000, srednja vrijednost (rnorm (n, m, s))) # standardna devijacija tih sredinassd (y) # proračun teorijskih standardnih pogrešaka / sqrt (n)  

Otkrit ćete da te posljednje dvije naredbe generiraju isti broj (približno). Možete mijenjati vrijednosti n, m i s i one će uvijek biti prilično blizu jedna drugoj.

Smatram da je ovo stvarno korisno, hvala na objavi.Bi li bilo pošteno opisati standardnu pogrešku kao "standardno odstupanje raspodjele uzorka"?Raspodela uzorka je y u vašem bloku koda iznad? To je ono što me zbunilo, povezujući parametre uzorka sd i značenje s parametrima raspodjele uzorka.
Ako promijenite svoj tekst kako biste odredili uzorke sredstava za ovaj slučaj, da.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...