Pitanje:
Zašto je srednja dob bolja statistika od srednje dobi?
Lazer
2010-09-11 01:26:57 UTC
view on stackexchange narkive permalink

alt text

alt text

Čini se da medijan statistika izbora kad je riječ o godinama.

Nisam u stanju objasniti si zašto bi aritmetička sredina bila gora statistika. Zašto je to tako?

Izvorno objavljeno ovdje, jer nisam znao da ovo mjesto postoji.

Čini se da ste već imali razuman odgovor na drugoj stranici?
@Shane: Ali možda različite web stranice imaju potencijal za prikupljanje različitih odgovora s različitih gledišta?
četrnaest odgovori:
#1
+47
whuber
2010-09-11 03:17:24 UTC
view on stackexchange narkive permalink

Po mom mišljenju, statistika ne daje dobar odgovor na ovo pitanje. Prosjek može biti relevantan u studijama smrtnosti, na primjer, ali dob nije lako izmjeriti kao što mislite. Stariji ljudi, nepismeni ljudi i ljudi u nekim zemljama trećeg svijeta, na primjer, obično zaokružuju svoju dob na višekratnik 5 ili 10.

Medijan je otporniji na takve pogreške od srednje vrijednosti. Štoviše, srednja dob je obično 20 - 40, ali ljudi mogu živjeti do 100 i više (sve veći i primjetniji udio stanovništva modernih zemalja sada živi više od 100). Ljudi takve dobi imaju 1,5 do 4 puta veći utjecaj na srednju vrijednost nego na medijan u usporedbi s vrlo mladim ljudima. Dakle, medijan je malo ažurnija statistika koja se odnosi na dobnu raspodjelu u zemlji i malo je neovisniji o stopama smrtnosti i očekivanom životnom vijeku nego što je srednja vrijednost.

Konačno, medijan nam daje malo bolja slika o tome kako izgleda sama dobna raspodjela: kada vidite primjerice medijan od 35 godina, znate da je polovica stanovništva starije od 35 godina i možete zaključiti neke stvari o natalitetu, dobi roditelja itd. ; ali ako je srednja vrijednost 35, ne možete reći toliko, jer bi na tih 35 moglo utjecati veliko ispupčenje stanovništva u dobi od 70 godina, ili možda jaz stanovništva u nekom dobnom rasponu zbog starom ratu ili epidemiji.

Stoga se iz demografskih, a ne statističkih razloga medijan čini dostojnijim uloge omnibus vrijednosti za sažimanje starosti relativno velike populacije ljudi.

Mislim da ste mislili "Medijan je otporniji na takve pogreške nego srednji". Ipak se slažem s vašim komentarima i vjerujem da američki popis obično navodi medijske vrijednosti za mnoge kategorije u službenim izvješćima (ne samo dobnu) iz u osnovi svih istih razloga. Dohodak je možda čak i bolji primjer od dobi za ilustraciju takvih stavova.
Činjenicu - sredina je osjetljiva na izvanredne vrijednosti / iskrivljene raspodjele - zamijenili ste izjavom o vrijednosti o sklonosti medijani nad srednjom vrijednosti. Zapravo ste tvrdili da sredinu ne treba preferirati jer ona nije medijan (slično kao oni koji kažu da sredinu treba koristiti samo na simetričnim raspodjelama, tj. Kada su srednja vrijednost i medijan jednaki).
@Alexis Ne slijedim vašu kritiku. Možete li objasniti? Napokon, ovaj odgovor pruža mnogo više od „činjenice“: sadrži ih podosta, zajedno s analizom njihovih implikacija. A konkretno na koju "izjavu o vrijednosti" mislite?
Moja briga je zbog činjeničnih karakteristika srednje i srednje vrijednosti (npr. Prva je osjetljiva na izvanredne vrijednosti, na primjer "Ljudi takve dobi imaju 1,5 do 4 puta veći utjecaj na srednju vrijednost nego na medijan u usporedbi s vrlo mladim ljudima.)" postaju prevedene u * vrijednosti * o njihovoj vrijednosti, naime "medijan nam daje malo bolju sliku o tome kako izgleda sama dobna raspodjela". Prvo je činjenica, a kasnije vrednovanje te činjenice. Moja briga je prebacivanje između njih dvoje. Više: http://stats.stackexchange.com/questions/96371/should-the-mean-be-used-when-data-are-skewed
@Alexis Hvala. Još uvijek se borim da razumijem što mislite pod pojmom "vrijednosti". Izjavio sam o vjernosti kojom nam statistika daje informacije o distribucijama, a ne o tome koliko ljudi brine o različitim dobima (što bi u takvom kontekstu obično značilo "vrijednost"). Podržavam tu izjavu standardnom mjerom osjetljivosti (utjecaja). Ako biste mi mogli pomoći da bolje razumem vašu zabrinutost, rado bih pojasnio objavu u vezi s tim. (Neki ispitanici na povezano pitanje imaju slične probleme s razumijevanjem vaše zabrinutosti.)
@whuber (hvala na strpljenju), to je upotreba riječi poput "bolje" u citatu u mom prethodnom komentaru, koji mislim da ovdje nosi konotaciju "koliko je ljudima stalo". Pretpostavljam da pokušavam postaviti pitanje "Ne mislimo li drugačije, a ne bolje?"
@Alexis Imajte na umu da se ovo pitanje ne odnosi na uporabu srednje vrijednosti ili medijana općenito, već na njihove korisne funkcije za procjenu * dobne raspodjele. * Imajte na umu da na samom početku moj odgovor priznaje da nema panaceje: da je srednja vrijednost korisno i relevantno * za određene svrhe. * Mislim da nisam počinio grijeh za koji me optužujete, što je nejasna primjena "boljeg": pažljivo sam odredio * kako se * medijan i srednja vrijednost razlikuju * u ovom kontekstu *. Čini mi se kao da imate problem zviznuti u vezi sa srednjacima * protiv *, ali ovo nije mjesto za to.
#2
+17
Dirk Eddelbuettel
2010-09-11 01:48:50 UTC
view on stackexchange narkive permalink

John vam je dao dobar odgovor na sestrinskoj stranici.

Jedan aspekt koji nije izričito spomenuo je robusnost: medijan kao mjera središnjeg mjesta radi bolje od srednje vrijednosti jer ima višu točku proboja (od 50%), dok srednja vrijednost ima vrlo nisku vrijednost od 0 (za detalje pogledajte wikipedia).

Intuitivno, to znači da pojedinačna loša opažanja ne iskrivljuju medijan, dok čine prosjek.

Analiza nije problem opisne statistike cijele populacije.
#3
+12
John D. Cook
2010-09-11 19:20:44 UTC
view on stackexchange narkive permalink

Evo mog odgovora koji je prvi put objavljen na math.stackexchange:

Medijan je ono što mnogi ljudi zapravo imaju na umu kad kažu "znači". Lakše je protumačiti medijan: polovica populacije je iznad ove dobi, a polovica ispod. Mean je malo suptilniji.

Ljudi traže simetriju i ponekad nameću simetriju kad je nema. Raspodjela dobi u populaciji daleko je od simetrične, pa bi srednja vrijednost mogla zavarati. Dobne raspodjele su nešto poput piramide. Puno djece, malo starijih. (Ili je barem tako u nekoj vrsti stabilnog stanja. U SAD-u je generacija baby boom-a nakon Drugog svjetskog rata iskrivila tu raspodjelu kako stari. Neki ljudi to nazivaju "kvadratura piramide" jer su bumeri napravili vrh piramide širi nego što je to bio u prošlosti.)

Uz asimetričnu raspodjelu, možda je bolje prijaviti medijan jer je to simetrična statistika. Medijana je simetrična čak i ako distribucija uzorkovanja nije.

U kojem je smislu medijan "simetrična" statistika? Sigurno nije slučaj da se raspodjele obično simetrično raspoređuju po svojim medijanima (niti o sredstvima). Ako mislite samo na ono što ste napisali u drugom komentaru da "medijan dijeli populaciju na pola" (što * definira * medijanu), vaš argument zvuči cirkularno: medijan je dobar jer je medijan medijana!
#4
+7
John
2010-09-11 05:30:30 UTC
view on stackexchange narkive permalink

Zašto je sjekira bolja od sjekire?

To je slično vašem pitanju. Oni samo znače i rade različite stvari. Ako se govori o medijanima, tada se priča koju pokušavaju prenijeti, model koji pokušavaju primijeniti na podatke, razlikuje od modela sa sredstvima.

#5
+4
ars
2010-09-12 10:01:58 UTC
view on stackexchange narkive permalink

Za konkretan primjer uzmite u obzir srednje dobne skupine za Kongo (DR Kongo) i Japan. Jedan je uništen građanskim ratom, drugi je dobro razvijen sa starenjem stanovništva. Prosječna vrijednost nije užasno zanimljiva za usporedbu jabuka s jabukama. S druge strane, medijan može biti informativan kao mjera središnje tendencije, jer prema definiciji imamo polovicu gore, pola dolje. Članak na wikipediji o Populacijskoj piramidi može biti prosvjetljujuć (pogledajte odjeljke o izbočenju mladih, starenju stanovništva).

#6
+3
Henry
2011-03-27 10:39:31 UTC
view on stackexchange narkive permalink

Mislim da ne postoji dobar opisni razlog za odabir medijane umjesto srednje vrijednosti za dobnu raspodjelu. U usporedbi prijavljenih podataka postoji jedna praktičnost.

Mnoge zemlje izvještavaju o svom stanovništvu u intervalima od 5 godina s otvorenim vrhom. To uzrokuje neke poteškoće pri izračunavanju srednje vrijednosti iz intervala, posebno za najmlađi interval (na koji utječu stope smrtnosti dojenčadi), gornji "interval" (što je sredina "intervala" 80+?) I bliske gornje intervale ( sredina svakog intervala obično je niža od sredine).

Daleko je lakše procijeniti medijanu interpoliranjem unutar medijana intervala, često aproksimirajući pretpostavljajući ravnu ili trapeznu dobnu raspodjelu u tom intervalu (stope smrtnosti u mnogim su zemljama relativno niske oko srednje vrijednosti, što čini ovo je razumnija aproksimacija nego za mlade ili stare).

#7
+3
Richard E. Gilder
2012-01-02 21:18:02 UTC
view on stackexchange narkive permalink

Skladišta podataka javnog zdravstva u Sjedinjenim Državama kreću se prema AGE u formatu godina od pet godina, zbog utjecaja propisa HIPAA na namjerno zasljepljivanje i maskiranje podataka iz razloga osobne privatnosti.

S obzirom na ovaj izazov onome što je bilo u prošlosti (prije HIPAA-e) prilično razina mjernog elementa podataka na temelju razlike između datuma rođenja i datuma smrti, možda ćemo morati ponovno razmotriti AGE kao varijablu ljestvice koja može biti parametarski opisan uopće u skupovima podataka o javnom zdravstvu, u korist modela koji opisuju STAROST na neparametarski način, kao rednu razinu mjere. Znam da se to mnogim frakcijama unutar zajednice biomedicinske informatike može činiti "prekomjerno", ali ova ideja može imati neke zasluge u smislu "interpretacije" kako je opisano u gornjim komentarima.

Što je sa svom analitičkom snagom koja je dostupna neparametarskim pristupima? Da, istina je da će svatko od nas gotovo univerzalno pokušati primijeniti GLM (opći linearni model) tehnike na varijablu koja nam se predstavlja u distribucijama koje se ponašaju na način kako se AGE ponaša.

Istodobno se moraju uzeti u obzir oblik te raspodjele i način na koji se taj oblik određuje efektima interakcije više dimenzija na višedimenzionalnim centroidima i podgrupama centroida prisutnih u distribuciji. Što učiniti s ovim vrlo složenim skupovima podataka?

Kad element podataka ne uspije ispuniti "pretpostavke modela", postupno skeniramo (rekao sam preko, a ne prema dolje; trebali bismo biti jednaki poslodavci metode, svaki alat dolazi iz tvornice s obrazac slijedi funkcionalna pravila) popis drugih mogućih modela za pronalaženje onih koji "ne propadaju" testovi pretpostavki.

U sadašnjem formatu u skupovima podataka o javnom zdravstvu doista trebamo (kao zajednicu za vizualizaciju podataka) osmisliti standardniji model za rad s AGE-om u koracima od pet godina (5YI). Moj glas za vizualizaciju podataka AGE (s obzirom na novi format 5YI) je korištenje histograma i dijagrama kutija i brkova. Da, to znači medijan. (Nije namjeravana igra riječi)

Ponekad slika zaista vrijedi tisuću riječi, a sažetak je sažetak tisuću riječi. Grafikon kutija i brkova prikazuje "oblik" raspodjele kao značajan simbolički prikaz histograma na gotovo ikoničnoj razini razlučivosti. Usporedba raspodjele petogodišnjih prirasta pokazivanjem okvira "rame uz rame" i brkova gdje se trenutno mogu vizualno usporediti uzorci od 75. do 50. (medijan) sa nižim 25. ntilima, učinio bi elegantan "univerzalni standard" za usporedbu AGE svijet. Za one od nas koji i dalje uživaju u uzbuđenju predstavljanja podataka kroz tekstualnu mehaniku tabličnog prikaza, dijagram "stabljike i lista" također može biti od koristi kada se koristi kao animirani element vizualne grafike u pristupu "iskričave linije" koji prikazuje varijacije oblika distribucije tijekom vremena.

DOBA je postala punoljetna. To treba dalje istražiti sa snažnijim računalnim algoritmima koji su sada dostupni.

Ovo je dobro napisan post, ali čini se da nema nikakve veze s izvornim pitanjem.
Mislim da se posredno, ali na odgovarajući način bavi očiglednom namjerom pitanja, @Andy. Krivica, ako postoji, leži u samom pitanju, koje je dvosmisleno, jer ne navodi smisao u kojem bi sredina mogla biti "gora" od medijane. Dobar odgovor stoga mora to istražiti i razmotriti svrhu sažimanja dobne raspodjele s jednom statistikom. Ovdje ovo prirodno dovodi do rasprave o tome što bi „dob“ mogla značiti i kako bi se na odgovarajući način usporedile dobne raspodjele.
#8
+3
Emil Friedman
2012-05-23 20:34:40 UTC
view on stackexchange narkive permalink

Da bismo dali koristan odgovor na izvorno pitanje, potrebno nam je pitanje koje stoji iza pitanja. Drugim riječima, "Zašto želite neku vrstu sažetke statistike koja uspoređuje dobnu raspodjelu različitih zemalja?" Medijan bi mogao biti najkorisniji za neka pitanja. Srednja vrijednost može biti najkorisnija za druge. I vjerojatno postoje pitanja gdje bi "postotak iznad (ili ispod) neke određene dobi" bio najkorisnija statistika.

#9
+2
Mike Dunlavey
2010-09-14 05:23:26 UTC
view on stackexchange narkive permalink

Ovdje dobivate dobre odgovore, ali dopustite mi da dodam samo svoja 2 centa. Radim u farmakometriji, koja se bavi stvarima poput volumena krvi, brzine eliminacije, osnovne razine učinka lijeka, maksimalnog učinka lijeka i takvih parametara.

Razlikujemo varijable koje mogu poprimiti bilo koju vrijednost plus ili minus, naspram vrijednosti koje mogu biti samo pozitivne. Primjer varijable koja može poprimiti bilo koju vrijednost, plus ili minus, bio bi učinak lijeka, koji bi mogao biti pozitivan, nula ili negativan. Primjer varijable koja realno može biti pozitivna je volumen krvi ili brzina eliminacije lijeka.

Modeliramo te stvari distribucijom koja je obično normalna ili lognormalna, normalna za one bilo koje vrijednosti i lognormalna za one jedine pozitivne. Lognormalan broj je broj E koji se uzima u moć normalno raspoređenog broja i zato može biti samo pozitivan.

Za normalno raspodijeljenu varijablu, medijan, srednja vrijednost i način su isti broj, tako da nije važno koji ćete koristiti. Međutim, za lognormalno distribuiranu varijablu srednja je vrijednost veća i od medijana i od načina, pa zapravo nije vrlo korisna. U stvari, medijan je mjesto na kojem osnovna norma ima svoje srednje značenje, pa je to puno privlačnija mjera.

Budući da dob (vjerojatno) nikad ne može biti negativna, lognormalna raspodjela vjerojatno je bolji njezin opis nego normalno, pa je srednja vrijednost (E do srednje vrijednosti osnovne normale) korisnija.

Raspodjela dobi sigurno nije normalna.
Mislim da ne možete zaključiti da se dob normalno distribuira samo iz činjenice da je uvijek pozitivna. Gama i Weibullova raspodjela također su uvijek pozitivne, pa zašto ne odabrati one?
@Rob: @nico: Siguran sam da si u pravu. Bio je to loš izbor primjera. Tipično modeliramo farmakometrijske parametre poput volumena i klirensa.
#10
+2
Susanne
2015-02-12 22:34:32 UTC
view on stackexchange narkive permalink

Učili su me da se medijan treba koristiti s opsegom i srednjom vrijednosti sa standardnom devijacijom. Kada govorimo o dobi, mislim da je raspon relevantniji način izražavanja širenja i da ga je lakše razumjeti za većinu. Na primjer, u ispitivanoj populaciji, srednja dob bila je 53 (SD 5,4) ili je srednja dob bila 48 (raspon 23-77). Iz tog bih razloga radije koristio medijan, a ne srednju vrijednost. Ali ovdje bi me jako zanimalo što bi statističar ili statističar rekao o upotrebi srednje vrijednosti s opsegom? To prilično vidim u znanstvenim radovima.

Dobrodošli u životopis, Susanne.Ako ste ovo objavili u pokušaju da dobijete odgovore, izbrišite ga i ponovo objavite kao novo pitanje.Vodič za upotrebu ove stranice dostupan je u našoj [pomoći].
#11
+1
user28
2010-09-11 02:33:58 UTC
view on stackexchange narkive permalink

Johnov odgovor na math.stackexchange može se promatrati kao sljedeći:

Kada imate iskrivljenu raspodjelu, medijan može biti bolja sažeta statistika od srednje vrijednosti.

Imajte na umu da kada kaže da ima više novorođenčadi nego odraslih, on u biti sugerira da je dobna raspodjela iskrivljena raspodjela.

Zapravo mislim da je danas pomak u mnogim zemljama više prema starijim osobama, a ne prema maloj djeci.
Možda je pogrešno obrnuto, ali općenito stoji. Za iskrivljene raspodjele medijan može imati više smisla od srednje vrijednosti.
Upravo sam ažurirao svoj odgovor na math.stackexchange kako bih naglasio upravo tu poantu. Ljudi traže simetriju i mogu pogrešno nametnuti simetriju kad je nema. Kada prijavite medijan, dajete odgovor koji je simetričan - medijan dijeli populaciju na pola - iako raspodjela nije simetrična.
Ovaj mi se odgovor uvijek čini pomalo prikriven: kada raspodjele nisu iskrivljene (tj. Simetrične su), srednja vrijednost * jednaka je * medijanu, pa je tako reći da je medijana "bolja" kada je raspodjela iskrivljena način na koji se može reći " koristite samo medijanu. "
#12
+1
Eustache
2012-03-10 16:27:28 UTC
view on stackexchange narkive permalink

Nadam se da će na srednju dob utjecati odstupanja u vašem skupu podataka, dok to nije slučaj za srednju dob. Uzmimo primjer skupa podataka cijepljenih pacijenata: 1,2,3,4,4,5,6,6,6,78 godinasrednja bi bila: 11,5, a srednja dob tih pacijenata je 4,5. na ovu je srednju dob utjecao odstupajući 78. medijan je najbolji pri radu sa skupovima podataka iskrivljene distribucije.

Pogledajte moj odgovor korisniku28.
#13
  0
Matt L.
2014-05-28 21:18:26 UTC
view on stackexchange narkive permalink

Svakako u slučaju demografske analize, smatrao bih da bi i srednja vrijednost i medijan bili vrijedni, posebno u kombinaciji jedni s drugima, ako tražite izvanredne vrijednosti ili područja rasta koja bi sama medijana mogla pogrešno označiti. U zajednicama s velikom umirovljeničkom zajednicom ili u području s eksplozijom nataliteta, samo medijan možda vam neće dati cjelovitu sliku i tu srednja vrijednost u usporedbi može biti vrlo korisna.

#14
  0
brethvoice
2020-03-31 19:21:02 UTC
view on stackexchange narkive permalink

KRATKI ODGOVOR: Srednja dob nije samo bolja od srednje dobi; no možda ste primijetili da ga koristi više ljudi. Dakle, bolje pitanje moglo bi biti: "Zašto bi više demografa koristilo srednju dob od srednje dobi?"

Statistika, kao rječnik, podrijetlom je iz države (nominalno pravne osobe) koja pokušava razumjeti svoju ljudsku populaciju. Zato razmislite o ljudima u tim vladama i o tome koliko informacija žele ili trebaju, kao i koliko vremena moraju posvetiti razumijevanju preciznog matematičkog značenja znanstvenih riječi.

Najlakši način sažimanja velikog broja podataka, bez upotrebe slike, jest prijavljivanje jednog broja; ovo je poznato kao procjenitelj predmetnog parametra (u ovom kavezu vrijeme proteklo od rođenja čovjeka, precizno do razine godina). Set. Jaynes je u svojoj knjizi P Teorija vjerojatnosti: Logika Science pokazao da se može izraditi procjenitelj temeljen na utilitarnoj funkciji gubitka koji sažima posljedice pogreške na temelju korištenja jednog broja umjesto cijelog skup podataka prilikom donošenja odluka na temelju tih podataka.

U Jaynesovoj knjizi on matematičkim dokazom pokazuje da je način, ili procjena najveće vjerojatnosti, procjenitelj koji minimizira gubitak u obliku Dirac-ove delta funkcije. Srednja vrijednost minimizira kvadratne funkcije gubitaka, tako da se daljnja ocjena dobije, gubitak (neželjena posljedica) vrlo brzo poveća kada prođete ljestvicu jedinice.

S druge strane, medijan minimizira funkciju gubitka oblikovanu poput obrnutog trokuta, tako da je samo pet puta manje poželjno isključiti se za jednu jedinicu preciznosti, a ne 25 puta (kao u slučaju kada se koristi sredstvo). Zapravo, jedinica preciznosti nema nikakve razlike, jer u takvoj trokutastoj šiljastoj funkciji gubitka nema zakrivljenosti.

S ovom teoretskom osnovom moglo bi se doslovno izvući funkcije gubitka koje uopće nisu simetrične i oblikovati beskonačan broj novih procjenitelja prilagođenih potrebama njihovih potrošača / korisnika. Druga alternativa rješavanju kulturnih očekivanja jednog broja je obrazovanje istih tih korisnika / potrošača informacija da mjera središnje tendencije može pružiti više informacija u kombinaciji s drugim parametrima distribucije, poput varijance, iskrivljenosti i kurtoze ( možda želite započeti sa samo varijancom i iskosa kako biste ih olakšali.

Varijansa je samo jedan primjer mjere disperzije; drugi Jaynes predlaže (u drugim spisima) oblikovanje Bayesove stražnje raspodjele i izračunavanje širine najkraćeg vjerodostojnog intervala s vrijednošću 0,5 (ili intervala pouzdanosti / standardne devijacije itd. ako ne kupujete Bayesovu teoriju - molim vas, nemojmo dobiti stranputicu). Intuitivnija metoda koju bi možda bilo lakše shvatiti više ljudi bio bi interkvartilni opseg, posebno kada se izvještava s medijanom kao odgovarajućom mjerom središnje tendencije.

Nisam siguran postoji li neparametarski oblik iskrivljenja ili kurtoze, ali ako postoje, gotovo će sigurno biti lakše razumjeti od ovih parametarskih analoga. Predosjećam da je glavni, ako ne i dominantan dio razloga da srednja dob raste češće od srednje dobi, jer jednostavno više privlači ljude s manje vremena ili želje da uđu u teoretske detalje o stvarima poput sigma-algebri, Lebesgueova teorija mjera itd. Koje su sve tehnički potrebne da bi se razumjeli uobičajeni temelji vjerojatnosnog zaključivanja.

Iako ovdje ima mnogo dobrih misli o procjeniteljima itd., Mislim da se pojavljuju na pogrešnom mjestu: ovo se pitanje odnosi samo na * opisnu * statistiku.Nije nužno namijenjeno procjenjivanju bilo čega.
@whuber koja je svrha bilo koje statistike, ako ne i opisivanje svojstva od interesa u vezi s nizom podataka jednim brojem?Slažem se da varijance, iskrivljenost, kurtoza ili veličine povezane s momentima višeg reda obično nisu procjenitelji, već kvalifikatori za mjeru središnje tendencije.Ali nadam se da nećemo zanemariti značenje riječi "vjerojatnost" u uobičajenom govoru.U kontekstu OP-a, čini se da je netko pitao "otprilike koliko ljudi ima godina na tom i takvom mjestu?"pa je medijan procjena jer karakterizira količinu (parametar) od interesa jednim brojem.
Razlika između opisne statistike i procjenitelja djelomično se sastoji u njezinoj uporabi: prva je svojstvo skupa podataka, čisto i jednostavno.Vjerojatnost nije uključena, niti je potrebna za stvaranje ili korištenje opisne statistike.Procjenitelj, naprotiv, pokušava u potpunosti okarakterizirati nešto drugo: naime, "populaciju" iz koje su podaci hipotetički izvedeni.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...