Pitanje:
Koje bih najbolje prakse trebao slijediti prilikom pripreme parcela?
user28
2010-07-21 16:00:45 UTC
view on stackexchange narkive permalink

Obično donosim vlastite idiosinkratske odluke prilikom pripreme zavjera. Međutim, pitam se postoje li neke najbolje prakse za generiranje parcela.

Napomena: Robov komentar na odgovor na ovo pitanje ovdje je vrlo relevantan.

Petnaest odgovori:
#1
+24
Peter Smit
2010-07-21 16:18:56 UTC
view on stackexchange narkive permalink

Načela Tufte vrlo su dobra praksa u pripremi zavjera. Pogledajte i njegovu knjigu Lijepi dokazi

Načela uključuju:

  • Održavanje visokog omjera podataka i tinte
  • Uklanjanje grafikona smeće
  • Dajte grafičkim elementima više funkcija
  • Imajte na umu gustoću podataka

Pojam za pretraživanje je Vizualizacija informacija

Tufteov vizualni prikaz kvantitativnih informacija (http://www.amazon.com/o/ASIN/0961392142/ref=nosim/gettgenedone-20) bolji je od IMO-a Beautiful Evidence. Sve su mu četiri knjige dobre, ali ako imate priliku pohađati neki od njegovih tečajeva, napravite to.
Slažem se s većinom onoga što Tufte kaže, ali moram reći, njegovi [low data: ink boxplots] (http://indiemaps.com/blog/2008/02/props-to-box-plots/) su jednostavno idiotski. Mislim da mi treba 3-4 puta više vremena da shvatim od standardnih ploča. Zadane vrijednosti R su puno bolje (iako su crte na krajevima repova nepotrebne). Tradicionalni plakari imaju dodatnu prednost što mogu predstavljati veličinu uzorka (s širinom) i standardna odstupanja (s urezima).
+1 @ naught101 nekoliko drugih dijeli ovo mišljenje na `SO`: http://stackoverflow.com/questions/6973394/functions-available-for-tufte-boxplots-in-r#comment8320383_6973394
#2
+15
Shane
2010-07-21 16:16:55 UTC
view on stackexchange narkive permalink

Mogli bismo ovdje ostati čitav dan označavajući najbolje prakse, ali trebali biste započeti s čitanjem Tuftea. Moja primarna preporuka:

Neka bude jednostavno.

Često ljudi pokušavaju učitati svoje karte s informacijama. Ali trebali biste zapravo imati samo jednu glavnu ideju koju pokušavate prenijeti, a ako netko ne dobije vašu poruku gotovo odmah, onda biste trebali razmisliti kako ste je predstavili. Stoga nemojte početi raditi na grafikonu sve dok sama poruka nije jasna. Occamov brijač vrijedi i ovdje.

Slažem se s većinom ove točke, ali mislim da "Neka bude jednostavno". mogao biti nejasan. Vaša je glavna poanta da biste trebali znati što želite da grafikon prenese. "Neka bude jednostavno." iznosi neke druge ideje, poput "Omjer podataka: tinte trebao bi biti visok.", što Tufte potiče, i "Ne predstavljajte više od tri varijable.", što Tufte obeshrabruje.
Jasno je da je ovaj savjet neizmjerno bolji od suprotnog.Ali postoje situacije u kojima je graf nužno složen i zahtijeva detaljno, pažljivo i pažljivo proučavanje.Ali komplikacija bi i sama trebala biti što jednostavnija.Na primjer, 25 ploha u matrici 5 x 5 možda će trebati dulje proučavanje, ali ideja da svaki prikazuje samo neke podatke relativno je lako dokučiti.
#3
+12
Ian Turner
2010-07-21 16:20:45 UTC
view on stackexchange narkive permalink

Jedno osnovno pravilo koje se ne držim uvijek, ali koje je povremeno korisno jest uzeti u obzir da je vjerojatno da će vaša parcela u nekom trenutku u budućnosti biti

  • poslano faksom,
  • fotokopirano i / ili
  • reproducirano u crno-bijeloj tehnici.

Morate pokušati napraviti svoje parcele dovoljno jasno da čak i ako se neprecizno reproduciraju u budućnosti, podaci koje radnja pokušava prenijeti i dalje su čitljivi.

Mislim da mislite poslati faksom u nekom trenutku ** prošlosti **;)
+1 za ovo. Vaša osnovna zavjera, srce vašeg rada, ne bi trebala biti potpuno nerazumljiva, jer sam je isprintao.
[ovaj odgovor] (http://stats.stackexchange.com/a/11460/9007) rješava sličan problem.
#4
+8
Benjamin Bannier
2010-07-21 18:01:40 UTC
view on stackexchange narkive permalink

Osim što prenosim jasnu poruku, uvijek se trudim sjetiti se spletke:

  • veličine fonta za naljepnice i legende trebale bi biti dovoljno velike, po mogućnosti iste veličine fonta i fonta korištenog u konačnom publikacija.
  • širine linija trebale bi biti dovoljno velike (linije od 1 pt obično nestaju ako se crteži samo malo smanje). Pokušavam prijeći na širine linija od 3 do 5 pt.
  • ako crtanjem više nizova podataka / krivulja u boji osiguravam da ih može razumjeti ako se ispisuju crno-bijelo, npr. korištenjem različitih simbola ili stilova linija pored boje.
  • uvijek koristite format bez gubitaka (ili blizu njega), npr. vektorski format poput pdf, ps ili svg ili png ili gif visoke rezolucije (jpeg uopće ne radi i nikada nije dizajniran za linijske crteže).
  • pripremite grafiku u konačnom omjeru slike koja će se koristiti u publikacija. Kasnija promjena omjera može dobiti iritantne oblike fonta ili simbola.
  • uvijek uklonite beskorisnu gužvu iz programa crtanja poput neiskorištenih podataka histograma, linija trenda (teško korisnih) ili zadanih naslova.

Konfigurirao sam svoj softver za crtanje (matplotlib, ROOT ili root2matplotlib) da većinu toga radi prema zadanim postavkama. Prije nego što sam koristio gnuplot kojemu je ovdje bila potrebna dodatna briga.

#5
+8
user88
2010-07-22 01:11:03 UTC
view on stackexchange narkive permalink

Na polju fizike postoji pravilo da cijeli rad / izvještaj treba biti razumljiv samo iz brzog uvida u crteže. Stoga bih im uglavnom savjetovao da budu sama po sebi razumljiva.
To također podrazumijeva da uvijek morate provjeriti je li vaša publika upoznata s nekom vrstom zavjere - jednom sam pogriješio pretpostavljajući da svaki znanstvenik zna kakve zavjere su, a zatim izgubili sat vremena da to objasnimo.

Simpatije prema iskustvu ploča, ali ono što to implicira je (a) upotreba relativno jednostavne varijante (npr. Prikazivanje medijana, kvartila, 5% i 95% bodova i svih podatkovnih točaka nakon toga), umjesto pokazivanja bilo čega na temelju konvencije usredotočene na1,5 IQR;(b) dodavanje opisa koji konvencije čini eksplicitnim.
#6
+6
Bossykena
2010-07-21 22:26:15 UTC
view on stackexchange narkive permalink

Evo mojih smjernica koje se temelje na najčešćim pogreškama koje vidim (uz sve ostale spomenute dobre točke)

  • Koristite grafikone raspršivanja, a ne crteže linija, ako redoslijed elemenata nije relevantno.
  • Kada pripremate parcele koje su namijenjene usporedbi, koristite isti faktor razmjera za sve njih.
  • Još bolje - pronađite način za kombiniranje podataka u jednom grafikonu (npr. okviri za prikaz bolji su od nekoliko histograma za usporedbu velikog broja distribucija).
  • Ne zaboravite da odredite jedinice
  • Koristite legendu samo ako morate - općenito je jasnije izravno označavati krivulje.
  • Ako morate upotrijebiti legendu, premjestite je unutar crteža, u prazno područje.
  • Za linijske grafikone ciljajte na omjer slike koji daje crte koje su približno na 45o sa stranicom.
* "boxplots su bolji od nekoliko histograma za usporedbu velikog broja distribucija" * - to vrijedi samo ako su vaši podaci unimodalni i nemaju kurtozu ili neke druge značajke koje boxplots ne mogu uhvatiti ..
#7
+6
visnut
2010-08-13 06:30:32 UTC
view on stackexchange narkive permalink

Pogledajte R grafičku biblioteku, ggplot2. Pojedinosti su na web stranici http://had.co.nz/ggplot2/ Ovaj paket generira vrlo dobre zadane plohe koje slijede načela Tufte, smjernice Clevelanda i Ihakin paket boja.

#8
+6
Andrej Panjkov
2011-06-02 08:51:32 UTC
view on stackexchange narkive permalink

Ako crtate u boji, uzmite u obzir da daltonisti mogu imati problema s razlikovanjem elemenata samo po boji. Dakle:

  • Koristite stilove linija za razlikovanje linija.
  • Upotrijebite dodatnu težinu u elementima, širinu linije učinite najmanje 2 pt itd.
  • Koristite drugačije oznake kao i boje za razlikovanje točaka.
  • Upotrijebite oznake i napomene, pozivajući se također na položaj i stil.
  • Kad se referirate na elemente crteža u tekstu, opišite ih bojom, relativnim položajem i stil: "crvena, gornja, crtica-krivulja"
  • Upotrijebite paletu prilagođenu slijepim bojama. Pogledajte http://www.vischeck.com/vischeck/,, http://jfly.iam.u-tokyo.ac.jp/color/#pallet. Imam jednostavnu python implementaciju palete u posljednjoj referenci na code.google.com, potražite python-cudtools
Uzmite u obzir i činjenicu da će to netko možda morati isprintati na sivom printeru. To sam već radio - za zadaću sam koristio zadane boje ggplot2 (koje sjajno izgledaju na ekranu), koje sam zatim ispisao crno-bijelo, a pola boja se nije moglo razlikovati od ostalih! \*rumenilo\*
#9
+4
Frank Harrell
2011-06-02 17:47:18 UTC
view on stackexchange narkive permalink

Ovo su prekrasni prijedlozi. Okupili smo puno materijala na http://biostat.mc.vanderbilt.edu/StatGraphCourse. Skupina statističara u farmaceutskoj industriji, akademskoj zajednici i FDA također stvara resurs koji će biti vrlo koristan za klinička ispitivanja i srodna istraživanja. Mnogo novog materijala bit će predstavljeno za mjesec dana, ali već je puno toga - http://www.ctspedia.org/do/view/CTSpedia/PageOneStatGraph

Moj osobni favorit Grafička knjiga je Elementi grafičkih podataka autora Williama Clevelanda.

Što se tiče softvera, po mom mišljenju teško je pobijediti R-ove pakete ggplot2 i rešetke. Stata također podržava izvrsnu grafiku.

#10
+3
Matti Pastell
2010-07-22 16:05:55 UTC
view on stackexchange narkive permalink

Ovisi i o tome gdje ne želite objaviti svoje parcele. Uštedjet ćete si puno neprilika konzultirajući vodič za autore prije nego što napravite zavjere za časopis.

Također spremite grafike u formatu koji je lako izmijeniti ili spremite kôd koji ste koristili za njihovo stvaranje. Velika je vjerojatnost da trebate ispraviti.

#11
+3
Pablo Marin-Garcia
2011-06-01 00:35:02 UTC
view on stackexchange narkive permalink

Ne upotrebljavajte dinamit plote: http://pablomarin-garcia.blogspot.com/2010/02/why-dynamite-plots-are-bad.html, koristite violinske parcele ili slično (obitelj boxplots)

#12
+2
Freya Harrison
2010-07-22 18:41:54 UTC
view on stackexchange narkive permalink

Dodao bih da bi izbor parcele trebao odražavati vrstu statističkog testa koji se koristi za analizu podataka. Drugim riječima, koje god se karakteristike podataka koristile za analizu, trebale bi se vizualno prikazati - tako biste prikazali sredstva i standardne pogreške ako ste koristili t-test, ali okvirne plohe ako ste koristili Mann-Whitneyev test.

#13
+2
David J.
2011-12-07 09:12:54 UTC
view on stackexchange narkive permalink

Ostali su odgovori previše formulirani da bi bili uvjerljivi, pa dajte općenitiji odgovor. Neko sam se vrijeme mučio s ovim pitanjem. Nudim ovaj postupak:

  1. Upoznajte svoju poruku
  2. Upoznajte svoju publiku
  3. Upoznajte svoja ograničenja
  4. Prilagodite svoju poruku svom publika s obzirom na vaša ograničenja

Skeptičan sam prema pokrivačima kao što je "neka bude jednostavno" - što to znači? Pa, to ovisi o publici. Neka publika pojest će tuftejski stil. Ali neka publika povremeno cijeni malo smeća s grafikona. Nekim ljudima dosadne parcele dosade. Neki vole šarene pozadine. Je li toliko pogrešno angažirati ih malo čak i ako ugrožavate "estetsku" čistoću? Na vama je da odlučite.

Reakcija vaše publike bit će važan odgovor, ali ne i jedini. Ako pronađete način da izmjerite njihovo razumijevanje prije i nakon vaše prezentacije, počet ćete razumjeti utjecaj koji ste ostvarili.

"točan" odgovor ovisit će o sljedećim vrstama pitanja:

  • Koje ćete medije koristiti?

  • Stvarate li statički ili interaktivne radnje?

  • Pokušavate li ispričati unaprijed definiranu priču (izlaganje) ili potaknuti eksperimentiranje (istraživanje)?

  • U kojoj mjeri želite da publika donosi vlastite zaključke?

  • U kojoj mjeri želite da publika slijedi i da vas vaša priča uvjeri?

  • U kojoj mjeri želite da publika ospori vaše nalaze?

Ukratko, dizajn vaši materijali namjerno daju vašu poruku, publiku i ograničenja.

"Uključiti" ili odvratiti pozornost? Boja može biti u redu, ali u konačnici ste tu zbog podataka, a estetika bi trebala služiti podacima, a ne obrnuto.
#14
+2
naught101
2012-04-20 06:29:44 UTC
view on stackexchange narkive permalink

Čini se da se sjećam da je Tufte spomenuo, a nije u ostalim odgovorima, to je mapiranje - tj. na vašem grafikonu predstavite položaj, smjer, veličinu itd. stvarnost . Ono što se nalazi na grafikonu trebalo bi biti u stvarnom svijetu. Ono što je veliko, trebalo bi biti veliko (imajući na umu da područja trebaju predstavljati područja, a zapremine. Nikada ne pokušavajte prikazati skalarnu vrijednost po području, vrlo je dvosmisleno!). To se također odnosi na boje, oblike itd., Ako su relevantni.

Zanimljiv je primjer ovdje grafikon "serije suknji": http: // a-little-book-of-r -for-time-series.readthedocs.org/en/latest/src/timeseries.html. Iako je tehnički ispravno, a duljina suknje "viša" zauzima viši položaj na grafikonu, zapravo je prilično zbunjujuće, jer duljina suknje započinje od vrha , a ide dolje (za razliku od ljudi ili drveća, gdje mjerimo visinu od tla). Dakle, povećana duljina suknje zapravo predstavlja nižu vrijednost:

  suknje <- scan ("http://robjhyndman.com/tsdldata/roberts/skirts.dat", preskoči = 5) suknjeserija <- ts (suknje, start = c (1866)) plot.ts (suknje, ylim = c (max (suknje), min (suknje)))  

enter image description here

Postoje, kao i uvijek uvijek, poteškoće. Na primjer, obično smatramo da se vrijeme kreće naprijed, a na zapadu barem čitamo slijeva udesno, pa i naši grafikoni vremenskih serija obično teku s lijeva na desno kako se vrijeme povećava. Pa što se događa ako želite s vremenom predstaviti nešto što je najbolje predstaviti bočno (npr. Mjerenja nečega istok-zapad)? U tom slučaju morate napraviti kompromis i prikazati vrijeme koje se kreće prema gore ili prema dolje (što opet ovisi o kulturološkoj percepciji) ili odabrati mapiranje bočne varijable prema gore / dolje na vašem grafikonu.

Primjer kompromisa vremena i prostora nalazi se u knjizi Izrada karata (kritična rasprava i primjeri [ovdje dati] (http://freegeographytools.com/2011/making-maps-a-visual-guide-to-map -design-for-gis-a-review-of-the-second-edition).
Lijep (užasan) primjer! Karte donose još jedan, teži kompromis: pokušaj prikazivanja 2 dimenzije + vremena na dvodimenzionalnoj stranici (npr. Karte kontinentalnog zanosa). Prilično teško. Ali pretpostavljam da su tome animacije :)
Vaš poučni primjer omogućuje spominjanje dvije dodatne točke koje se često javljaju.1. S vremenskom osi, naslov ili oznaka poput "TIme" obično je suvišan.2. Naslovi ili naljepnice poput "suknje" mogu se uvijek poboljšati kratkim, ali informativnim objašnjenjem, uključujući mjerne jedinice po potrebi.
#15
+1
Baltimark
2010-07-21 23:11:59 UTC
view on stackexchange narkive permalink

Ovisi o načinu na koji će se raspravljati o parcelama.

Na primjer, ako šaljem zavjere za grupni sastanak koji će biti obavljen s pozivima s različitih mjesta, radije bih ih sastavio u Powerpointu, a ne u Excelu, pa je lakše prelistavati.

Za pojedinačne tehničke pozive stavit ću nešto u excel kako bi klijent mogao pomaknuti zaplet i pregledati neobrađene podatke. Ili, mogu unijeti p-vrijednosti u stanice uz bočne koeficijente regresije, na pr.

Imajte na umu: zavjere su jeftine, posebno za prezentaciju ili za slanje e-pošte grupi. Radije bih napravio 10 jasnih crteža koje možemo prelistati, nego 5 crteža gdje pokušavam staviti različite kohorte (npr. "Mužjaci i ženke") na isti grafikon.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...