Pitanje:
Je li to rješenje problema p-vrijednosti?
whuber
2016-04-01 03:14:42 UTC
view on stackexchange narkive permalink

U veljači 2016. Američko statističko udruženje objavilo je službenu izjavu o statističkoj značajnosti i p-vrijednostima. Naša nit o tome opširno raspravlja o tim problemima. Međutim, niti jedno tijelo nije ponudilo univerzalno priznatu učinkovitu alternativu - do sada. Američko statističko društvo (ASS) objavilo je svoj odgovor, p-vrijednosti: Što je sljedeće?

"Vrijednost p nije dobra za puno. "

Mislimo da ASA nije otišao dovoljno daleko. Vrijeme je da se prizna da je era p-vrijednosti gotova. Statističari su ih uspješno svugdje zbunjivali dodiplomske studente, varali znanstvenike i zavaravali urednike, ali svijet počinje prozirati ovu varku. Moramo napustiti ovaj pokušaj statističara s početka 20. stoljeća da kontroliraju donošenje odluka. Moramo se vratiti onome što stvarno djeluje.

Službeni ASS prijedlog je sljedeći:

Umjesto p-vrijednosti , ASS zagovara STOP (postupak SeaT-Of-Pants). Ovu počašćenu i provjerenu metodu koristili su stari Grci, renesansni ljudi i svi znanstvenici dok Ronald Fisher nije naišao i propao stvari. STOP je jednostavan, izravan, vođen podacima i autoritativan. Da bi to izveo, autoritet (stariji muškarac, po želji) pregledava podatke i odlučuje slažu li se s njegovim mišljenjem. Kad odluči da jesu, rezultat je "značajan". Inače nije i od svih se traži da zaborave na cijelu stvar.

Načela

Odgovor se odnosi na svih šest ASA-ovih principa.

  1. STOP može naznačiti koliko su podaci nekompatibilni s navedenim statističkim modelom.

    Sviđa nam se ova fraza jer je tako otmjen način reći da će STOP odgovoriti na bilo koje pitanje da ili ne. Za razliku od p-vrijednosti ili drugih statističkih postupaka, to ne ostavlja sumnju. To je savršen odgovor onima koji kažu "ne treba nam nikakva smrdljiva ništa hipoteza! Koji je *?! @ To uopće, uopće? Nitko nikada nije mogao shvatiti što bi trebalo biti. "

  2. STOP ne mjeri vjerojatnost da je hipoteza istinita: zapravo odlučuje je li to istina ili ne.

    Svi su zbunjeni vjerojatnostima. Izbacivanjem vjerojatnosti iz slike, STOP eliminira potrebu za godinama preddiplomskog i diplomskog studija. Sada svatko (dovoljno star i muški) može izvoditi statističku analizu bez boli i mučenja slušajući čak i jedno statističko predavanje ili pokrećući tajni softver koji izbacuje nerazumljive rezultate.

  3. Znanstveni zaključci i poslovne ili političke odluke mogu se temeljiti na zdravom razumu i stvarnim autoritetima.

    Vlasti su ionako uvijek donosile važne odluke, pa samo priznajmo i izrežemo posrednike. Korištenje STOP-a oslobodit će statističare da rade ono za što su najprikladniji: pomoću brojeva zataškavaju istinu i posvećuju preferencije moćnika.

  4. Ispravno zaključivanje zahtijeva potpuno izvještavanje i transparentnost.

    STOP je najtransparentniji i najočitiji statistički postupak koji je ikad izmišljen: pogledate podatke i odlučite. Eliminira sve one zbunjujuće z-testove, t-testove, testove hi-kvadrata i postupke abecedne juhe (ANOVA! GLM! MLE!) Koje ljudi koriste kako bi sakrili činjenicu da nemaju pojma što podaci znače.

  5. STOP mjeri važnost rezultata.

    To se samo po sebi razumije: ako osoba u tijelo koristi STOP, tada rezultat mora biti važan.

  6. Sam po sebi STOP pruža dobru mjeru dokaza u vezi s modelom ili hipotezom.

    Ne bismo ne bismo htjeli izazvati autoritet, zar ne? Istraživači i donositelji odluka prepoznat će da STOP pruža sve informacije koje trebaju znati. Iz tih razloga analiza podataka može završiti STOP-om; nisu potrebni alternativni pristupi, poput p-vrijednosti, strojnog učenja ili astrologije.

Ostali pristupi

Neki statističari preferiraju takozvane "Bayesove" metode, u kojima se opskurni teorem posthumno objavljen od strane klerika iz 18. stoljeća bez razmišljanja primjenjuje za rješavanje svakog problema. Najistaknutiji zagovornici slobodno priznaju da su ove metode "subjektivne". Ako ćemo se služiti subjektivnim metodama, očito je da će što je autoritetniji i upućeniji donositelj odluka to bolji rezultat. STOP se stoga pojavljuje kao logična granica svih Bayesovih metoda. Zašto se truditi raditi te grozne izračune i vezati toliko računarskog vremena, kad možete samo pokazati podatke odgovornom momku i pitati ga kakvo je njegovo mišljenje? Kraj priče.

Nedavno se pojavila još jedna zajednica koja izaziva svećenstvo statističara. Nazivaju se "strojnim učenicima" i "znanstvenicima podataka", ali zapravo su samo hakeri koji traže viši status. Službeno je stajalište ASS-a da bi ti momci trebali krenuti u vlastitu profesionalnu organizaciju ako žele da ih ljudi shvate ozbiljno.


Pitanje

Je li ovo odgovor na probleme koje je ASA identificirao s p-vrijednostima i testiranjem nulte hipoteze? Može li doista ujediniti Bayesovu i Frekvencionističku paradigmu (kako se implicitno tvrdi u odgovoru)?

"Donald Trump za vrhovnog suca STOP ASS: učinite statistiku opet sjajnom!"
Jasno je da je STOP neoptimalan postupak.Iznenađen sam da je to izbjeglo tako cijenjenoj organizaciji učenjaka kao što je ASS.Pametno, zašto uopće gubiti vrijeme gledajući podatke *?Jednostavno dajte svoj odgovor da / ne.Ova se metodologija već trenutno koristi s velikim učinkom.Brojne su studije slučaja, posebno u Sjedinjenim Državama tijekom godina djeljivih na 4.
Shvaćate li da ovo ** Američko statističko društvo ** nije stvarna organizacija?(Bilo je to ime * Američkog statističkog udruženja * od studenog 1839. do veljače 1840., ali to se teško broji.) STOP je šala
Mislim da bi tvrtke također mogle imati ogromnu korist od usvajanja ovih metoda, jer više ne bi trebale snositi velike troškove zapošljavanja ljudi koji bi analizirali njihove podatke.
@henry Kao da nam oznaka [april-1] to nije rekla?
@Henry Ozbiljno?Možete li nam pokazati * bilo koju * lažnu organizaciju koja postigne preko četvrt milijuna posjeta kada Google-om imenujete njeno ime?
A tko je rekao da statističari nemaju smisla za humor?Iako kad stvarno razmislim, nekako biste ** morali ** imati nekoga da biste preživjeli na ovom polju, videći koliko često se ti temeljni kamenci statističke prakse zlostavljaju i krivo shvaćaju, bilo neznanjem ili obmanom.
@Glen_b: Oprostite - propustio sam oznaku i jedini izgovor mi je bio da je još uvijek bio ožujak u mojoj vremenskoj zoni kada sam pročitao poruku.whuber: Nikad nepostojeći ["Journal of the American Statistical Society"] (https://www.google.com/search?q=%22Journal+of+the+American+Statistic+Society%22) očito dobiva polamilijuna pogodaka, a vjerojatno postoji i zanimljiva studija o obrascima [kada je kao takav citiran] (https://scholar.google.com/scholar?q=%22Journal+of+the+American+Statistic+Society%22) u istraživačkim radovima
STOP je dobro i dobro, ali ponekad vam je potrebna neovisna analiza kako biste zaključku dali vjerodostojnost.Stoga bi trebalo naručiti neovisnu studiju i stvoriti "razumne" pretpostavke za studiju koje jamče da neovisna analiza donosi točan zaključak.Ovo je vrlo česta metoda.Upečatljivo je to što mnogi analitičari koji provode "neovisnu analizu" uopće ne shvaćaju što se događa.Naravno, ljudi se razlikuju u svojoj sofisticiranosti u pogledu toga koliko se bezazlene pretpostavke koje iznose, kreću od prilično prokleto suptilnih do nevjerojatno očitih.
Tri odgovori:
Matthew Drury
2016-04-01 10:44:01 UTC
view on stackexchange narkive permalink

Zagovaram svoj vlastiti novi pristup statističkom odlučivanju pod nazivom RADD: R oll A D amn D tj. Također se obraća svim ključnim točkama.

1) RADD može naznačiti koliko su podaci kompatibilni sa navedenim statističkim modelom.

Ako bacite veći broj, očito je da dokazi više idu u prilog vašem modelu! Dodatna je prednost što, ako želimo još više samopouzdanja, možemo baciti kocku s više strana. Možete čak pronaći 100 bočnih kockica ako pretražite dovoljno!

2) RADD može odlučiti je li hipoteza istinita ili ne.

Morate baciti samo dvostrani kalup, tj. baciti novčić.

3) RADD se može koristiti za donošenje poslovnih odluka ili odluka o politikama

Dovedite gomilu kreatora politike u sobu i neka svi bace kockice! Najveće pobjede!

4) RADD je proziran.

Rezultat se može snimiti, a sama matrica zadržati za daljnja istraživanja *

5) RADD mjeri važnost rezultata.

Očito, pomicanje više označava vrlo važnu dogodio se događaj.

6) RADD pruža dobru mjeru dokaza.

Nismo li rekli da su veće role bolje?

Dakle, ne, STOP nije odgovor. Odgovor je RADD.

Da ne zaboravimo, može osigurati kontrolu pogrešaka tipa I (na bilo kojoj željenoj razini s obzirom na dovoljno jednostrane kockice), npr.odbacivanjem nulte hipoteze samo kada se pojavi jedna od 5 strana s najvećim brojem 100-stranskih kockica kako bi se postigla 5% stopa pogreške tipa I.
Zaboravili ste spomenuti [cool platonske poliedre i neke cool neplatonske poliedre] (http://www.chessex.com/).
Tim
2016-04-01 12:49:14 UTC
view on stackexchange narkive permalink

Iz svog iskustva moram reći da je STOP u poslovnoj stvarnosti zadani kriterij za donošenje odluka, preferiran pred $ p $ -vrijednostima i ostalim frekventnim, ili Bayesovim metodama. Iz poslovne perspektive STOP pruža jednostavne i konačne odgovore što ga čini pouzdanijim od neizvjesnih "vjerojatnosnih" metoda. Štoviše, u velikoj većini slučajeva jednostavnije je provesti i lakše se prilagoditi promjeni stvarnosti od ostalih metoda. Odluke da / ne uvjerljivije su za srednju i višu upravu. "STOP izvješća" u većini su slučajeva kraća i lakša za čitanje od onih koja se temelje na podacima. Štoviše, usvajanje ove metode omogućava poslodavcu da smanji troškove znanstvenika podataka i SAS licenci. Rekao bih da je jedini problem sa STOP-om taj što je teže izraditi PowerPoint prezentaciju koja prezentira STOP rezultate, ali ovo je polje koje se dinamički razvija, pa bi se u budućnosti mogle predložiti bolje metode vizualizacije.

Kad se PowerPointovi dijapozitivi sa zaključkom kratko upoznaju, prekasno je za promjenu, tako da postoje dva izbora, prilagodite analizu zaključku ili se uopće ne zamarajte analizom.
@MarkL.Kamena sigurno!Meni se osobno sviđa ideja o izradi ploha za prezentaciju prije nego što vidim podatke, ideja je utemeljena u Bayesovom razmišljanju i nazivam ih apriornim zapletima :) Mislim da se ovaj pristup prvi put pojavio u tisku ovdje: http: // dilbert.com / strip / 2008-05-08
Joe_74
2016-04-01 03:39:31 UTC
view on stackexchange narkive permalink

Ovaj fini dodatak raspravi o vrijednosti p, zanimljiv, ali po mom mišljenju i pomalo ustajao, podsjeća me na jedinstveni članak objavljen prije nekoliko godina u božićnom izdanju British Medical Journal (BMJ ), koji svakog Božića objavljuje stvarne, ali smiješne istraživačke članke. Konkretno, ovo djelo Isaacs i Fitzgerald istaklo je sedam ključnih alternativa medicini koja se temelji na dokazima (tj. medicinska praksa utemeljena na stvarnim kliničkim i statističkim dokazima) :

  • Lijek zasnovan na eminenciji
  • Lijek zasnovan na vehemenciji
  • Lijek zasnovan na elokvenciji
  • Lijek zasnovan na providnosti
  • Lijek zasnovan na difuziji
  • Lijek zasnovan na nervozi
  • Lijek zasnovan na povjerenju

Najzanimljivije je da morate pogledati stupce koji ističu mjerne uređaje i jedinice mjerenja za gornje predmete (npr. audiometar i decibeli za medicinu temeljenu na vehemensu!).

+1.Hvala vam na sjajnom doprinosu, savršeno u duhu pitanja.(1) Samo da pojasnim: je li rasprava o vrijednosti p smatrana "ustajalom" ili samo ovo pitanje?(2) Biste li znali gdje možete pronaći referencu (6), "J Eksponencijalne plaće"?Siguran sam da bi imao puno strastvenih čitatelja da je poznatiji.
(1) Vaš je prilog "svježe ovjeren" (ako citiram rottentomatoes.com).Suprotno tome, smatram da je pomalo ustajalo ovo naglašavanje ograničenja p vrijednosti.U eri strojnog učenja, velikih podataka i slabe znanstvene pismenosti u javnosti, stav ASA mogao bi izgledati pomalo mazohistički.(2) Mislim da ćete taj članak pronaći u istom časopisu u kojem su objavili randomizirano ispitivanje preporučeno u ovom drugom BMJ-ovom božićnom članku: http://www.bmj.com/content/327/7429/1459.
Uvijek zaboravim, koristi li medicina zasnovana na povjerenju zaključak utemeljen na Dunning-Krugeru?


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...