Pitanje:
Zašto robusne (i otporne) statistike nisu zamijenile klasične tehnike?
doug
2010-08-03 12:49:34 UTC
view on stackexchange narkive permalink

Prilikom rješavanja poslovnih problema korištenjem podataka, uobičajeno je da je barem jedna ključna pretpostavka da je klasična statistika ispod igla nevažeća. Većinom se nitko ne trudi provjeriti te pretpostavke tako da zapravo nikada ne znate.

Na primjer, toliko je uobičajenih mjernih podataka na mreži "dugorepih" (u odnosu na normalnu distribuciju) do sada toliko dobro dokumentirano da to uzimamo zdravo za gotovo. Još jedan primjer, internetske zajednice - čak i u zajednicama s tisućama članova, dobro je dokumentirano da se daleko najveći udio u doprinosu / sudjelovanju u mnogim od ovih zajednica može pripisati malobrojnoj skupini "sudionika". (Npr., Prije nekoliko mjeseci, neposredno nakon što je SO API postao dostupan u beta verziji, član StackOverflow objavio je kratku analizu podataka koje je prikupio putem API-ja; njegov zaključak - manje od jedan posto članova SO-a čini većinu aktivnosti na SO -u (vjerojatno postavljanje pitanja i odgovaranje na njih), ostalih 1-2% čini ostatak, a ogromna većina članova ne poduzima ništa).

Takve se distribucije - opet češće pravilo, a ne iznimka - često najbolje modeliraju pomoću funkcije gustoće zakona snage . Za ovu vrstu raspodjele čak je i središnji granični teorem problematično primijeniti.

Dakle, s obzirom na obilje populacija poput ove koje zanimaju analitičare, i s obzirom na to da klasični modeli imaju dokazano lošu izvedbu na tim podacima, a s obzirom na to da da robusne i otporne metode postoje već neko vrijeme (vjerujem barem 20 godina) - zašto se ne koriste češće? (Pitam se i zašto ih ne koristim češće, ali to zapravo nije pitanje za CrossValidated.)

Da, znam to postoje poglavlja iz udžbenika posvećena u potpunosti robusnim statistikama i znam da postoji (nekoliko) R paketa ( robustbase je onaj kojeg poznajem i koristim) itd.

A opet s obzirom na očite prednosti ovih tehnika, oni su često očito bolji alat za posao - zašto se ne koriste puno češće ? Ne bismo li trebali očekivati ​​da ćemo vidjeti robusne (i otporne) statistike koje se koriste puno češće (možda čak i pretpostavljeno) u usporedbi s klasičnim analogima?

Jedino bitno (tj. Tehničko) objašnjenje koje sam čuo je da je robusno tehnikama (isto tako i kod otpornih metoda) nedostaje snaga / osjetljivost klasičnih tehnika. Ne znam je li to doista istina u nekim slučajevima, ali znam da u mnogim slučajevima nije istina.

Završna riječ predujma: da, znam da ovo pitanje nema niti jednu dokazljivo točan odgovor; vrlo malo pitanja na ovoj stranici. Štoviše, ovo je pitanje istinsko istraživanje; to nije izgovor za unapređivanje gledišta - ovdje nemam stajalište, samo pitanje za koje se nadam nekim pronicljivim odgovorima.

Crni labud Nassima Nicholasa Taleba objašnjava zašto su se u financijskom svijetu koristili jednostavni modeli i kakve je opasnosti to dovelo. Posebna je pogreška izjednačavanje vrlo niskih vjerojatnosti s nulom i slijepa primjena normalne raspodjele u upravljanju rizicima!
Ispitivanja koja se oslanjaju na mnoge pretpostavke snažnija su kada su te pretpostavke zadovoljene. Možemo testirati značaj odstupanja pretpostavljajući da su opažanja IID Gaussova, što kao statistiku daje srednju vrijednost. Manje restriktivni skup pretpostavki govori nam da se služimo medijanom. Možemo ići dalje i pretpostaviti da su opažanja povezana kako bi se dobila još veća robusnost. Ali svaki korak smanjuje snagu našeg testa, a ako uopće ne pretpostavimo, test je beskoristan. Robusni testovi implicitno daju pretpostavke o podacima i bolji su od klasičnih samo kada se te pretpostavke bolje podudaraju sa stvarnošću
četrnaest odgovori:
#1
+69
John D. Cook
2010-08-03 17:22:58 UTC
view on stackexchange narkive permalink

Istraživači žele male p-vrijednosti, a manje p-vrijednosti možete dobiti ako koristite metode koje čine jače distribucijske pretpostavke. Drugim riječima, ne-robusne metode omogućuju vam objavljivanje više radova. Naravno, veći broj ovih članaka može biti lažno pozitivan, ali publikacija je publikacija. To je cinično objašnjenje, ali ponekad vrijedi.

"ponekad" je potcjenjivanje ... logika autora nije često tako izravna, ali scenarij poticaja / nagrade takav je da će ljudi to učiniti kao uvjet
Ne smatram da su istraživači neiskreni koliko da djeluju iz neznanja. Ne razumiju što statistika znači ili pretpostavke koje zahtijevaju, ali kao što ste rekli, oni jasno razumiju poticaj / nagradu: p> 0,05 => nema publikacije.
Morate predstaviti i nešto što razumiju oni koji su na vlasti (donositelji odluka, nadzornici, recenzenti). Stoga to mora biti na zajedničkom jeziku koji se razvija prilično sporo, jer su ti ljudi stariji i otporniji na promjene, uglavnom jer to može onesposobiti njihovu dosadašnju karijeru!
Dobra poanta. "Razumijem p-vrijednosti. Samo mi dajte p-vrijednost." Ironično, oni vjerojatno * ne * razumiju p-vrijednosti, ali to je druga stvar.
Ne vjerujem da je ovo kategorički točno. Barem sam čuo kako moderna neparametrija često žrtvuje vrlo malo snage, ako je uopće postoji. AFAIK, gubitak snage najizraženiji je u testovima koji uključuju transformaciju ranga, a koje su jedva sveprisutne među robusnim metodama.
#2
+43
conjugateprior
2010-10-28 23:14:53 UTC
view on stackexchange narkive permalink

Dakle, "klasični modeli" (kakvi god da su - pretpostavljam da mislite na nešto poput jednostavnih modela koji se podučavaju u udžbenicima i koje procjenjuje ML) ne uspijevaju na nekim, možda mnogim stvarnim skupovima podataka.

Ako model ne uspije, postoje dva osnovna pristupa popravljanju:

  1. Napravite manje pretpostavki (manje modela)
  2. Napravite više pretpostavki (više model)

Robusne statistike, kvazi vjerojatnost i GEE pristupi prvom pristupu promjenom strategije procjene u onu u kojoj model ne vrijedi za sve podatkovne točke (robustan) ili ne mora karakterizirati sve aspekte podataka (QL i GEE).

Alternativa je pokušaj izgradnje modela koji eksplicitno modelira izvor onečišćenja podatkovnih točaka ili aspekte izvornog modela koji se čine lažnima, a da metoda procjene ostane ista kao i prije.

Neki intuitivno preferiraju prvo (posebno je popularno u ekonomiji), a neki intuitivno preferiraju drugo (osobito je popularno među Bayesovcima, koji su sretniji sa složenijim modelima, posebno kad shvate da idu da ionako koriste simulacijske alate za zaključivanje).

Pretpostavke distribucije masnog repa, na pr. koristeći negativni binom umjesto poissona ili t, a ne normalno, pripadaju drugoj strategiji. Većina stvari označenih kao "robusna statistika" pripada prvoj strategiji.

Čini se da je izvođenje procjena za prvu strategiju za realno složene probleme prilično teško. Nije to razlog što to ne činite, ali možda je objašnjenje zašto se to ne čini vrlo često.

+1. Vrlo dobro objašnjenje. Također mislim da su neke "robusne" metode prilično ad hoc (krnja sredstva), te da je "robusna" vezana uz određeni aspekt metode i nije općenita kvaliteta, ali mnogi ljudi "robusnu" interpretiraju u značenju "ne razumijem" ne moram brinuti o svojim podacima jer je moja metoda robusna ".
Sjajan odgovor. Smeta mi što se toliko odgovora usredotočuje na poteškoće u razumijevanju robusnih statistika ili na poticaje za ignoriranje kršenja pretpostavki. Oni ignoriraju [ljude vani] (http://www.tandfonline.com/doi/abs/10.1198/000313006X152207) koji znaju da postoje slučajevi kada su potrebne robusne statistike, a kada nisu.
#3
+29
csgillespie
2010-08-03 22:03:59 UTC
view on stackexchange narkive permalink

Predložio bih da to zaostaje u nastavi. Većina ljudi statistiku uči ili na fakultetu ili na sveučilištu. Ako statistika nije vaš prvi stupanj i umjesto toga ste diplomirali matematiku ili računarstvo, vjerojatno pokrivate samo osnovne module statistike:

  1. Vjerojatnost
  2. Ispitivanje hipoteze
  3. Regresija

To znači da kada se suočite s problemom pokušate iskoristiti ono što znate da biste riješili problem.

  • Podaci nisu normalni - uzmite zapisnike.
  • Podaci imaju dosadne odstupanja - uklonite ih.

Osim ako nešto ne naletite u suprotnom, tada je teško učiniti nešto bolje. Zaista je teško pomoću Googlea pronaći nešto ako ne znate kako se to zove!

Mislim da će sa svim tehnikama trebati neko vrijeme dok se novije tehnike ne filtriraju. Koliko je trebalo standardnim testovima hipoteza da budu dio standardnog kurikuluma statistike?

BTW, sa statističkim stupnjem i dalje će zaostajati u nastavi - samo kraći!

Ali ovo postavlja zanimljiv pedagoški problem, barem u psihologiji, jer koliko znam većina uvodnih statističkih knjiga koje se koriste u mom području zapravo ne raspravlja o robusnim mjerama, osim kao po strani.
To je vrlo točno, a također u psihologiji postoji dosadna zbrka između neparametarskog i nenormalnog, što čini da ometa razumijevanje.
Neki od nas psihologa samo smo zbunjeni zbog svega statističkog! :)
#4
+21
Wesley Burr
2010-08-06 08:06:42 UTC
view on stackexchange narkive permalink

Svatko tko je obučen za statističku analizu podataka na razumnoj razini redovito koristi koncepte robusne statistike. Većina istraživača zna dovoljno za traženje ozbiljnih odstupanja i pogrešaka u bilježenju podataka; politika uklanjanja sumnjivih točaka podataka seže još u 19. stoljeće s lordom Rayleighom, G.G. Stokes, i drugi njihove dobi. Ako je pitanje:

Zašto istraživači ne koriste suvremenije metode za izračunavanje procjena lokacije, skale, regresije itd.?

onda odgovor je dat gore - metode su u velikoj mjeri razvijene u posljednjih 25 godina, recimo 1985. - 2010. Kašnjenje u učenju novih metoda, kao i inercija sastavljena od "mita" da nema ništa loše u slijepom korištenju klasične metode. John Tukey komentira da samo koje metode koje su čvrste i otporne koristite nije važno - važno je da neke koristite. Sasvim je ispravno redovito koristiti i klasične i robusne / rezistentne metode, a brinuti samo kada se razlikuju dovoljno da bi bile bitne. Ali kad se razlikuju , trebali biste razmisliti oštro .

Ako je umjesto toga, pitanje je:

Zašto se istraživači ne zaustave i ne postave pitanja o svojim podacima, umjesto da slijepo primjenjuju vrlo nestabilne procjene?

onda se odgovor zaista svodi na trening. Previše je istraživača koji nikada nisu bili pravilno obučeni za statistiku, sažeti po općenitom oslanjanju na p-vrijednosti kao "statističku značajnost" koja su sve i na kraju.

@Kwak: Huber's procjene iz 1970-ih su snažne, u klasičnom smislu riječi: opiru se izvanrednim rezultatima. A procjene ponovnog pada zapravo datiraju znatno prije 1980-ih: Princetonova studija robusnosti (iz 1971.) uključila je bisquare procjenu položaja, ponovnu procjenu.

http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1043351251Besplatno dostupan dokument koji je napisao Peter Huber o doprinosima Johna Tukeyja snažnoj statistici. Razumno lako čitanje, svjetlo na formulama.
#5
+20
Carlos Accioly
2010-08-04 01:26:23 UTC
view on stackexchange narkive permalink

Statistika je alat za istraživače koji nisu statistički nastrojeni i jednostavno ih nije briga.

Jednom sam pokušao pomoći u članku o medicini koji je moja bivša supruga koautorirala. Napisao sam nekoliko stranica opisujući podatke, što oni sugeriraju, zašto su određena zapažanja izuzeta iz studije ... a vodeći istraživač, liječnik, sve je to bacio i zamolio nekoga da izračuna p-vrijednost, što je sve što ona (i baš svima koji bi čitali članak) bilo je stalo.

#6
+12
robin girard
2010-08-03 14:05:57 UTC
view on stackexchange narkive permalink

Dajem odgovor u dva smjera:

  1. stvari koje su robusne nisu nužno označene kao robusne. Ako vjerujete da čvrstina prema svemu postoji, naivni ste.
  2. Statistički pristupi koji ostavljaju problem robusnosti ponekad nisu prilagođeni stvarnom svijetu, ali su često vrijedniji (kao koncept) od algoritma koji izgleda poput kuhinjske pripreme.

Prvo, mislim da postoji puno dobrih pristupa u statistici (naći ćete ih u R paketima, ne nužno sa robusno spomenuto negdje) koje su prirodno robusne i testirane na stvarnim podacima, a činjenica da negdje ne nalazite algoritam s "robusnim" ne znači da nije robustan. U svakom slučaju, ako mislite da robusnost znači biti univerzalan, nikada nećete pronaći nijedan robustan postupak (bez besplatnog ručka), trebate imati određeno znanje / stručnost o podacima koje analizirate kako biste koristili prilagođeni alat ili stvorili prilagođeni model.

S druge strane, neki pristupi u statistici nisu robusni jer su posvećeni jednoj jedinoj vrsti modela. Mislim da je dobro ponekad raditi u laboratoriju i pokušati razumjeti stvari. Također je dobro odvojeno tretirati problem kako bismo shvatili u kojem je problemu naše rješenje ... ovako radi matematičar. Primjer Gaussovog modela elocant: toliko je kritiziran jer gausova pretpostavka nikada nije ispunjena, ali je donio 75% ideja koje se danas koriste praktički u statistici. Zaista mislite da se sve ovo odnosi na pisanje papira radi poštivanja pravila objavljivanja ili propadanja (što se meni ne sviđa, slažem se)?

#7
+11
JoFrhwld
2010-08-04 23:12:24 UTC
view on stackexchange narkive permalink

Kao netko tko je naučio malo statistike za moje vlastito istraživanje, pretpostavit ću da su razlozi pedagoški i inercijski.

U svom sam području primijetio redoslijed kojim teme koje se podučavaju odražavaju povijest polja. Prvo se podučavaju one ideje koje su došle prve itd. Za ljude koji ulaze u statistiku samo radi letimičnih poduka, to znači da će prvo naučiti klasičnu statistiku, a vjerojatno i posljednju. Tada, čak i ako nauče više, klasične stvari s kojima se drže bolje zbog efekata primatnosti.

Također, svi znaju što je t-test s dva uzorka. Manje od svih zna što je test Mann-Whitney ili Wilcoxon Rank Sum. To znači da moram objasniti koji je moj robusni test uložiti samo malo energije, nasuprot tome što ne bih trebao raditi bilo koji test s klasičnim testom. Takvi uvjeti očito će rezultirati manjim brojem ljudi koji se koriste robusnim metodama nego što bi trebalo.

#8
+9
David Rebelo
2011-01-04 05:00:02 UTC
view on stackexchange narkive permalink

Wooldridge "Uvodna ekonometrija - suvremeni pristup" 2E str.261.

Ako standardne pogreške robusne heteroskedastičnosti vrijede češće od uobičajenih OLS standardnih pogrešaka, zašto smetamo uobičajenim standardnim pogreškama uopće? ... Jedan od razloga zbog kojeg se još uvijek koriste u radu na presjecima jest taj da, ako pretpostavka homoskedastičnosti vrijedi i pogreške se normalno distribuiraju, tada uobičajena t-statistika ima točnu t raspodjelu, bez obzira na veličinu uzorka. Robusne standardne pogreške i robusne t statistike opravdane su samo kad veličina uzorka postane velika. S malim veličinama uzorka, robusna statistika t može imati raspodjele koje nisu baš bliske t raspodjeli i koje bi mogle odbaciti naše zaključke. U velikim uzorcima možemo uvijek prijaviti samo standardne pogreške robusne Heteroskedastičnosti u aplikacijama presjeka, a ova se praksa sve više slijedi u primijenjenom radu.

Loše vijesti ovdje: http://pan.oxfordjournals.org/content/23/2/159
#9
+7
Joe
2010-08-30 19:11:06 UTC
view on stackexchange narkive permalink

Iako se međusobno ne isključuju, mislim da je sve veća popularnost Bayesove statistike dio toga. Bayesova statistika može postići puno istih ciljeva pomoću prioriteta i prosjeka modela, a u praksi je malo robusnija.

#10
+6
mirror2image
2011-05-12 13:12:00 UTC
view on stackexchange narkive permalink

Nisam statističar, moje iskustvo u statistici prilično je ograničeno, samo koristim robusne statistike u procjeni računalnog vida / 3D rekonstrukcije / poza. Evo mog stava o problemu s gledišta korisnika:

Prvo, robusne statistike su se puno koristile u inženjerstvu i znanosti, a da ih nisu nazvale "robusnim statistikama". Mnogi ga ljudi koriste intuitivno, dolazeći do njega u procesu prilagođavanja određene metode stvarnom problemu. Na primjer, iterativni ponovljeni vagovi najmanjih kvadrata i obrezanih sredstava / skraćenih najmanjih kvadrata koji se često koriste, a da samo korisnik ne zna da je koristio robusne statistike - oni samo čine metodu izvedljivom za stvarne, nesintetičke podatke.

Drugo, i "intuitivna" i svjesna robusna statistika praktički se uvijek koristi u slučaju kada su rezultati provjerljivi ili ako postoje jasno vidljivi mjerni podaci o pogreškama. Ako su rezultati dobiveni normalnom raspodjelom očito nevaljani ili pogrešni, ljudi počinju petljati s utezima, obrezivanjem, uzorkovanjem, čitaju neki papir i na kraju koriste robusne procjenitelje, bez obzira znaju li pojam ili ne. S druge strane, ako krajnji rezultat istraživanja samo neke grafike i dijagrami, a nema neosjetljivosti za provjeru rezultata ili ako normalna statistika daje dovoljno dobre rezultate, ljudi se jednostavno ne zamaraju.

I na kraju, o korisnosti robusne statistike kao teorije - iako je sama teorija vrlo zanimljiva, često ne daje nikakve praktične prednosti. Većina robusnih procjenitelja prilično je trivijalna i intuitivna, često ih ljudi izmišljaju bez ikakvog statističkog znanja. Teorija, poput procjene točke sloma, asimptotike, dubine podataka, heteroskedacnosti itd. Omogućuje dublje razumijevanje podataka, ali u većini slučajeva to je jednostavno nepotrebno. Velika izuzetak je presjek robusne statistike i kompresivnog senziranja, koji daju neke nove praktične metode poput "prekriži i buketiraj"

#11
+5
Andy W
2011-01-05 01:39:25 UTC
view on stackexchange narkive permalink

Moje znanje o robusnim procjeniteljima odnosi se isključivo na robusne standardne pogreške za regresijske parametre, tako da će moj komentar biti samo u vezi s njima. Predložio bih ljudima da pročitaju ovaj članak,

O takozvanom "Huberovom procjenitelju sendviča" i "Robusnim standardnim pogreškama" autora: Freedman, A. David, Američki statističar, sv. 60, br. 4. (studeni 2006.), str. 299-302. doi: 10.1198 / 000313006X152207 ( PDF verzija)

Ono što me zabrinjava kod ovih pristupa nije da su pogrešni, već jednostavno odvraćajući pažnju od većih problema. Stoga se u potpunosti slažem s odgovorom Robina Girarda i njegovim spominjanjem "bez besplatnog ručka".

#12
+3
JohnRos
2011-11-07 23:15:35 UTC
view on stackexchange narkive permalink

Račun i vjerojatnost potrebni za robusnu statistiku (obično) su teži, pa (a) ima manje teorije i (b) je je teže shvatiti.

#13
+2
Christoph Hanck
2015-04-13 16:48:44 UTC
view on stackexchange narkive permalink

Iznenađen sam kad vidim da se Gauss-Markov teorem ne spominje na ovom podužem popisu odgovora, afaics:

U linearnom modelu sa sfernim pogreškama (koji uz način uključuje pretpostavku da nema odstupanja, putem konačne varijance pogreške), OLS je učinkovit u klasi linearnih nepristranih procjenitelja - postoje (sigurno, restriktivni) uvjeti pod kojima "ne možete bolje od OLS-a".

Ne tvrdim da bi ovo trebalo opravdavati upotrebu OLS-a gotovo cijelo vrijeme, ali sigurno doprinosi zašto (pogotovo jer je dobar izgovor da se toliko poučavamo u OLS-u u nastavi).

Pa, da, ali to pretpostavlja da je minimaliziranje varijance relevantan kriterij, a s teškim repovima to možda i nije tako!
Naravno.Samo sam htio dodati ono što smatram da je možda najpoznatiji razlog da smatram da je OLS korisna tehnika na popis razumljivih razloga zašto ga robusne tehnike nisu * zamijenile: postoje slučajevi u kojima ga ne biste trebali zamijeniti.
#14
  0
ayorgo
2018-04-19 15:20:00 UTC
view on stackexchange narkive permalink

Pretpostavljam da robusne statistike nikada nisu dovoljne, tj. da bi bile pouzdane, ove statistike preskaču neke informacije o distribuciji.I sumnjam da to nije uvijek dobro. Drugim riječima, postoji kompromis između robusnosti i gubitka informacija.

Npr.medijan je robustan jer (za razliku od srednje vrijednosti) koristi informacije samo o polovici elemenata (u diskretnom slučaju): $$ medijana (\ {1, 2, 3, 4, 5 \}) = 3 = medijana (\ {0,1, 0,2, 3, 4000, 5000 \}) $$

Pogledajte https://stats.stackexchange.com/questions/74113/when-is-the-median-more-affected-by-sampling-error-than-the-mean za situaciju u kojoj je medijan vrlo krhak i srednja vrijednostse vrlo dobro ponaša.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...