Pitanje:
Koje je vaše omiljeno laičko objašnjenje za težak statistički koncept?
brotchie
2010-07-20 03:43:51 UTC
view on stackexchange narkive permalink

Zaista uživam slušati jednostavna objašnjenja složenih problema. Koja je vaša omiljena analogija ili anegdota koja objašnjava težak statistički koncept?

Najdraže mi je Murrayjevo objašnjenje kointegracije pomoću pijanice i njezina psa. Murray objašnjava kako dva slučajna procesa (lutajući pijanac i njezin pas Oliver) mogu imati jedinstvene korijene, ali i dalje biti povezani (kointegrirani) jer su njihove zajedničke prve razlike stacionarne.

Pijanac kreće iz šankom, koji će besciljno lutati u slučajnom hodu. Ali povremeno intonira "Oliver, gdje si?", A Oliver prekida njegovo besciljno lutanje da laje. Čuje je; čuje ga. Misli: "Oh, ne mogu joj dopustiti da se previše udalji; zaključit će me." Ona misli: "Oh, ne mogu mu dopustiti da se previše udalji; probudit će me usred noći svojim lajanjem." Svaki od njih procjenjuje koliko je udaljen drugi i kreće se djelomično smanjiti taj jaz.

Deset odgovori:
#1
+18
Frank Harrell
2011-06-08 01:26:44 UTC
view on stackexchange narkive permalink

Vrijednost p mjera je koliko su podaci neugodni za nulu hipotezu

Nicholas Maxwell, Data Matters: Conceptual Statistics for a Random World Emeryville CA: Key College Publishing, 2004.

#2
+15
Neil McGuigan
2010-07-20 04:13:32 UTC
view on stackexchange narkive permalink
  1. Ako ste distribuciju (histogram) izrezali od drveta i pokušali je uravnotežiti na prstu, točka ravnoteže bila bi srednja vrijednost, bez obzira na oblik distribucije.

  2. Ako stavite štapić u sredinu svoje raspršene parcele i pričvrstite štapić na svaku podatkovnu točku aspringom, točka odmora štapića bit će vaša linija regresije. [1]

[1] to bi tehnički bila regresija glavnih komponenata. morali biste prisiliti opruge da se pomiču samo "okomito" kako bi bili najmanji kvadrati, ali primjer je ilustrativan u svakom slučaju.

Sila opruge proporcionalna je deformaciji, tako da ovo nije najmanje kvadratna regresija!
Dobar pokušaj! Ovisi o proljeću. Na primjer, ako je konstanta opruge 1 / sigma, izvrsno funkcionira;)
ne, ne, poanta je u tome da bi u statičkoj ravnoteži zbroj sila bio nula; pod pretpostavkom jednakih konstanti opruge, minimizirali biste zbroj apsolutnih odstupanja, tj. regresiju $ L_1 $, a ne najmanje kvadrate. To zanemaruje činjenicu da bi opruge morale slobodno plutati na štapu, pa bi se pomicale tako da deformacija ne bi bila u potpunosti u smjeru $ y $, što bi rezultiralo nečim poput prilagodbe glavnih komponenata, ali s apsolutnim pogreškama.
@shabbychef: Sila opruge proporcionalna deformaciji znači da je energija opruge proporcionalna deformaciji na kvadrat. Proljetna energija doista je ono što se minimizira u ravnoteži. Zbroj sila nula nije sila ili $ L_1 $ minimizirano. $ L_1 $ minimizira zbroj apsolutnih vrijednosti.
#3
+12
Shane
2010-07-23 18:58:08 UTC
view on stackexchange narkive permalink

Prije sam koristila šetnju pijanice za slučajnu šetnju, a pijanicu i njezina psa za kointegraciju; vrlo su korisni (djelomično i zato što su zabavni).

Jedan od mojih najdražih uobičajenih primjera je Paradoks za rođendan ( unos na wikipediji), što ilustrira neke važne koncepte vjerojatnosti. To možete simulirati u sobi punoj ljudi.

Usput, za neke toplo preporučujem "Podučavanje statistike: vreća trikova" Andrewa Gelmana za neke primjeri kreativnih načina poučavanja statističkih pojmova (vidi tablicu sadržaja). Također pogledajte njegov rad o kolegiju koji predaje o nastavi predavanja statistike: "Tečaj o podučavanju statistike na sveučilišnoj razini". I o "Poučavanju Bayesa postdiplomskim studentima političkih znanosti, sociologije, javnog zdravstva, obrazovanja, ekonomije, ...".

Za opis Bayesovih metoda, korištenjem nepravednog novčića i okretanje više puta prilično je čest / učinkovit pristup.

Ne postoji nepoštena kovanica: http://www.stat.columbia.edu/~gelman/research/published/diceRev2.pdf
#4
+12
Graham Cookson
2010-07-23 20:09:02 UTC
view on stackexchange narkive permalink

Volim demonstrirati varijacije uzorkovanja i u osnovi centralni granični teorem kroz vježbu "u klasi". Svi u razredu od oko 100 učenika napišu svoju dob na papir. Svi su papiri iste veličine i presavijeni na isti način nakon što sam izračunao prosjek. Ovo je stanovništvo i ja izračunam prosječnu dob. Tada svaki učenik nasumično odabere 10 papirića, zapiše dob i vrati ih u vreću. (S) izračunava srednju vrijednost i predaje torbu sljedećem učeniku. Na kraju imamo 100 uzoraka od po 10 učenika, koji procjenjuju prosjek populacije, što možemo opisati histogramom i nekim opisnim statistikama.

Zatim ovaj put ponavljamo demonstraciju koristeći skup od 100 "mišljenja" koji ponavljaju neka pitanja Da / Ne iz nedavnih anketa, na pr. Da su izbori (Britanski general) raspisani sutra, biste li razmotrili glasanje za Britansku nacionalnu stranku. Studenti uzimaju uzorke od 10 ovih mišljenja.

Na kraju smo pokazali varijacije uzorkovanja, teorem o središnjoj granici itd. S kontinuiranim i binarnim podacima.

#5
+10
Stephen Turner
2010-07-20 03:52:23 UTC
view on stackexchange narkive permalink

Definitivno problem Monty Halla. http://en.wikipedia.org/wiki/Monty_Hall_problem

+1 taj mi je problem iskrivio mozak kad sam prvi put pročitao i razmišljao o njemu - a rješenje je prilično jednostavno, ali puno toga podučava o vjerojatnosti.
Smatram da je problem Monty Halla sve samo ne obično laičko objašnjenje vjerojatnosti. Razumijem to, ali još uvijek imam poteškoća oko toga da je omotam glavom, a kamoli da je razumijem dovoljno dobro da to objasnim ne-statističkoj osobi i da je nauče iz toga ... Svejedno, ne određujete je li problem je vaš * težak koncept * ili vaše * laičko objašnjenje *. -1 dok to ne učinite.
Jednostavan način objašnjenja problema Monty Halla je zamisliti isti problem, ali s 1000 vrata - njih 999 ima kozu iza sebe, a samo 1 od njih ima automobil iza sebe. Recimo da ste odabrali vrata, a voditelj emisije otvara 998 drugih vrata i pita vas želite li promijeniti svoju odluku na ona vrata koja on nije otvorio. Znajući da nije mogao otvoriti vrata s automobilom iza njih, morali biste * se prebaciti na druga vrata (ili biti smiješno uvjereni da ste bili u pravu u svom početnom izboru).
#6
+10
AdamV
2010-07-22 20:49:54 UTC
view on stackexchange narkive permalink

1) Dobar prikaz kako treba definirati "slučajno" kako bi se utvrdila vjerojatnost određenih događaja:

Kolika je šansa da će slučajna crta povučena preko kruga biti duža od radijus?

Pitanje potpuno ovisi o tome kako nacrtate liniju. Mogućnosti koje u stvarnom svijetu možete opisati za krug nacrtan na tlu mogu uključivati:

Nacrtajte dvije slučajne točke unutar kruga i povucite crtu kroz njih. (Pogledajte gdje padaju dvije muhe / kamenje ...)

Odaberite fiksnu točku na opsegu, a zatim slučajnu negdje drugdje u krugu i pridružite im se. (Zapravo je ovo polaganje štapića preko kruga pod promjenjivim kutom kroz datu točku i slučajno, npr. Tamo gdje kamen padne.)

Nacrtajte promjer. Slučajno odaberite točku duž nje i nacrtajte okomicu kroz nju. (Motajte štap u ravnoj liniji tako da počiva na krugu.)

Relativno je lako pokazati nekome tko može izvesti neku geometriju (ali ne nužno statistiku) odgovor na pitanje može prilično varirati široko (od oko 2/3 do otprilike 0,866 ili tako nekako).

2) Preokrenuti inženjering bacanja novčića: bacite ga (recimo) deset puta i zapišite rezultat. Utvrdite vjerojatnost upravo tog niza $ \ left (\ frac {1} {2 ^ {10}} \ right) $. Mala prilika, ali upravo ste to vidjeli vlastitim očima! ... Svaka se sekvenca mogla pojaviti, uključujući deset glava u nizu, ali laicima je teško zaokružiti glavu to. Kao bis, pokušajte ih uvjeriti da imaju jednako dobre šanse za dobitak na lutriji brojevima od 1 do 6 kao i bilo koja druga kombinacija.

3) Objašnjenje zašto medicinska dijagnoza može izgledati stvarno pogrešno. Test za bolest foo koji je 99,9% točan u identificiranju onih koji ga imaju, ali .1% lažno pozitivno dijagnosticira one koji to zapravo nemaju, može se činiti pogrešnim toliko često kad je prevalencija bolesti stvarno niska ( npr. 1 na 1000), ali mnogi pacijenti se testiraju na to.

Ovo je najbolje objasniti stvarnim brojevima - zamislite da je testiran milijun ljudi, dakle 1000 ima bolest, 999 je točno identificirano, ali 0,1% od 999 000 je 999 osoba kojima se kaže da ih imaju, ali nemaju. Dakle, polovica onih kojima se kaže da ih zapravo nemaju, unatoč visokoj razini preciznosti (99,9%) i niskoj razini lažnih pozitivnih rezultata (0,1%). Drugi (idealno drugačiji) test tada će razdvojiti ove skupine.

[Inače, brojeve sam odabrao jer je s njima lako raditi, naravno da ne moraju dodavati do 100% jer su točnost / lažno pozitivne stope neovisni čimbenici testa.]

Mislim da se vaš prvi primjer odnosi na Bertrandov paradoks. Vrlo lijepa ilustracija različitih načina definiranja vjerojatnosnog prostora!
#7
+9
John D. Cook
2010-07-27 01:06:10 UTC
view on stackexchange narkive permalink

Knjiga Sama Savagea Propust prosjeka ispunjena je dobrim laičkim objašnjenjima statističkih koncepata. Konkretno, dobro objašnjava Jensenovu nejednakost. Ako je graf vašeg povrata ulaganja konveksan, tj. "Smješka vam se", tada vam slučajnost ide u prilog: vaš prosječni povrat veći je od vašeg prosječnog povrata.

#8
+8
ars
2010-07-23 06:48:57 UTC
view on stackexchange narkive permalink

Na liniji srednje vrijednosti kao točke ravnoteže, sviđa mi se ovaj pogled na medijanu kao točku ravnoteže:

#9
+6
Jeromy Anglim
2013-02-26 15:29:28 UTC
view on stackexchange narkive permalink

Behar i suradnici imaju zbirku od 25 analogija za poučavanje statistike. Evo dva primjera:

2.9 Svi su modeli teoretski: Nema savršenih sfera u svemir Čini se da je najčešći geometrijski oblik u svemiru sfera. Ali koliko matematički savršenih sfera postoji u svemiru? Odgovor je nijedan. Ni Zemlja, ni Sunce, ni biljarska kugla nisu savršena sfera. Dakle, ako nema istinskih sfera, kakve su koristi formule za utvrđivanje površine ili volumena kugle? Tako je i sa statističkim modelima općenito, a posebno s normalnom raspodjelom. Iako je jedan od najčešćih primjera raspodjela visine, ako bismo trebali imati na raspolaganju visinu svake odrasle osobe na planetu, profil histograma ne bi odgovarao Gaussovoj krivulji zvona, čak ni da su podaci stratificirani prema spolu, rasa ili bilo koja druga karakteristika. No, model normalne distribucije i dalje daje približne rezultate koji su dovoljno dobri u praktične svrhe.

2.25 Ostaci ne bi trebali sadržavati informacije: Vreća za smeće Rezidual je ono što ostaje nakon uklanjanja svih podataka iz podataka. Budući da ne bi trebali nositi nikakve podatke, smatramo ih "smećem". Potrebno je osigurati da ne bacimo smeće koje ima vrijednost (informacije) i koje se može iskoristiti za bolje objašnjenje ponašanja zavisne varijable.

Ostali primjeri uključuju

  • "Učinak veličine uzorka na usporedbu tretmana: Uvećavanje dalekozora"
  • "Veličina uzorka naspram veličine populacije: žlica za kušanje juhe"

Literatura

  • Behar, R., Grima, P., & Marco-Almagro, L. (2012). Dvadeset pet analogija za objašnjenje statističkih pojmova. Američki statističar, (upravo prihvaćen).
#10
+3
Mike Dunlavey
2010-09-14 06:02:44 UTC
view on stackexchange narkive permalink

Zabavno pitanje.

Netko je saznao da radim u biostatistici i pitao me (u osnovi) "Nije li statistika samo način laganja?"

(Što donosi uzvratiti citat Marka Twaina o Lažima, Prokletim lažima i Statistici.)

Pokušao sam objasniti da nam statistika omogućava sa 100-postotnom preciznošću da, s obzirom na pretpostavke i dane podatke, da vjerojatnost takvih -a-i bilo je točno takvo-takvo.

Nije bila impresionirana.

"Omogućuje nam da sa 100% preciznošću kažemo koliko je točno naš nedostatak preciznosti"
Ako ne izravno opovrgavanje, odgovor @Jeromy's sugerira zašto pojam "100% preciznosti" treba ukinuti.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...