Pitanje:
Koja je razlika između diskretnih podataka i kontinuiranih podataka?
Albort
2010-07-20 08:53:55 UTC
view on stackexchange narkive permalink

Koja je razlika između diskretnih podataka i kontinuiranih podataka?

Jeste li prvo isprobali Google? Za mene daje [ovo] (https://web.archive.org/web/20130510121554/http://infinity.cos.edu/faaching/woodbury/stats/tutorial/Data_Disc_Cont.htm).
Evo lijepog videozapisa koji odgovara na vaše pitanje. https://www.youtube.com/watch?v=MIX3ZpzEOdM
Razmislite samo o digitalnom i analognom.Ista stvar - različita imena.
Uistinu ne znam koja je razlika između "diskretnih" i "kontinuiranih" podataka.Iz nekih se razloga čini da uvodni zavodi zaista uživaju tjerati učenike da pamte pravila kako bi razlikovali ove dvije stvari.Koliko sam uspio razumjeti, razlike nisu u podacima - već u načinu na koji odabiremo modeliranje podataka.
Ovo je bio najbolji rezultat na Googleu, @robingirard.
Svi stvarni i fizički postojeći podaci, bili oni pohranjeni u pisanom obliku, na vrpci, disku ili u mozgu, diskretni su i u prostoru i u vremenu, barem dokle god imamo QFT temeljniji od Newtona, što znači da kontinuirani podaci nestvarno postoji, ali se može izvesti iz diskretnih podataka.
Deset odgovori:
#1
+64
walkytalky
2010-07-20 09:16:53 UTC
view on stackexchange narkive permalink

Diskretni podaci mogu poprimiti samo određene vrijednosti. Moglo bi postojati beskonačan broj tih vrijednosti, ali svaka je različita i između njih nema sive površine. Diskretni podaci mogu biti numerički - poput broja jabuka - ali mogu biti i kategorični - poput crvene ili plave, ili muške ili ženske, ili dobre ili loše.

Kontinuirani podaci nisu ograničene na definirane zasebne vrijednosti, ali mogu zauzimati bilo koju vrijednost u kontinuiranom rasponu. Između bilo koje dvije kontinuirane vrijednosti podataka može postojati beskonačan broj drugih. Kontinuirani podaci uvijek su u biti numerički.

Ponekad ima smisla diskretne podatke tretirati kao kontinuirane i obrnuto :

  • Na primjer, nešto poput visina je kontinuirano, ali često zapravo ne brine previše o sitnim razlikama i umjesto toga grupira visine u brojne diskretne kante - tj. Samo mjerne centimetre - -.

  • Suprotno tome, ako računamo velike količine nekih diskretnih entiteta - - npr. zrna riže, termita ili novčića u gospodarstvu - može odlučiti da 2.000.006 i 2.000.008 ne misli kao presudno
    različite vrijednosti, već kao obližnje točke na približnom
    kontinuumu.

To također ponekad može biti korisno da bi numeričke podatke tretirali kao kategorične , npr.: premala težina, normalno, pretilo. To je obično samo druga vrsta spajanja.

Rijetko ima smisla kategoričke podatke smatrati kontinuiranima.

@walktalky kao što @jeromy aludira na, barem u psihologiji, kategorijalne varijable kao što su odgovori na pitanja često se pretpostavlja kao predstavljanje temeljne osobine, pa se u tom smislu kategorijski podaci ponekad uzimaju kao kontinuirani.
@richiemorrisroe Netko ne bi mogao razmišljati o razlici između podataka i navodne osobine, ali naravno da ste u pravu. Neke vrlo zanimljive daljnje točke iznesene su kao odgovor na [ovo daljnje pitanje] (http://stats.stackexchange.com/questions/539/does-it-ever-make-sense-to-treat-categorical-data- kao-kontinuirano).
hvala na linku, ti su odgovori zaista vrlo zanimljivi.
> "* Potencijalno može biti beskonačan broj tih vrijednosti, ali svaka je različita i između njih nema sivog područja *" - zapravo je savršeno moguće imati diskretnu raspodjelu s različitim vrijednostima i * a istovremeno * , za bilo koje dvije različite vrijednosti koje odaberete uvijek ima više vrijednosti između njih (u neku ruku 'siva zona'). U praksi se ne smiju tako često, ali potpuno je moguće da se dosjete stvarnim stvarima; zaista se mogu sjetiti dva različita (ako su povezana) primjera koja se lako mogu pojaviti.
pa da pojasnimo, čak i da imate 10 milijardi redaka ohlc podataka za dioničko sredstvo, to bi se i dalje smatralo diskretnim?ali onda ne može cijena imovine biti između 1 i beskonačnosti, kako razmišljati u ovoj situaciji?
#2
+23
Jeromy Anglim
2010-07-20 09:19:12 UTC
view on stackexchange narkive permalink

Podaci su uvijek diskretni. S obzirom na uzorak vrijednosti n na varijabli, maksimalni broj različitih vrijednosti koje varijabla može uzeti jednak je n . Pogledajte ovaj citat

Svi stvarni uzorci su diskretni, a sve uočljive slučajne varijable imaju diskretne raspodjele. Kontinuirana raspodjela je matematička konstrukcija, prikladna za matematički tretman, ali nije praktički vidljiva. E.J.G. Pitman (1979, str. 1).

Podatci o varijabli obično se uzimaju iz slučajne varijable. Slučajna varijabla kontinuirana je u rasponu ako postoji beskonačan broj moguće vrijednosti koje varijabla može uzeti između bilo koje dvije različite točke u rasponu. Na primjer, obično se pretpostavlja da su visina, težina i vrijeme neprekidne. Naravno, svako mjerenje tih varijabli bit će krajnje točno i u nekom smislu diskretno.

Korisno je razlikovati poredane (tj. redne), neuređene (tj. nominalne),
i binarne diskretne varijable.

Neki uvodni udžbenici brkaju kontinuiranu varijablu sa numerička varijabla.Na primjer, rezultat na računalnoj igri je diskretan iako je numerički.

Neki uvodni udžbenici miješaju varijablu omjera s kontinuiranim varijablama. Varijabla brojača je varijabla omjera, ali nije kontinuirana.

U stvarnoj se praksi varijabla često tretira kao kontinuirana kada može poprimiti dovoljno velik broj različitih vrijednosti.

Reference

  • Pitman, EJG 1979. Neke osnovne teorije za statističko zaključivanje. London: Chapman i Hall. Napomena: Citat sam pronašao u uvodu 2. poglavlja knjige Murraya Aitkina Statistički zaključak: integrirani Bayesov / Pristup vjerojatnosti
Vjerojatnost je također "matematička konstrukcija", a ne "izravno uočljiva". Znači li to da vjerojatnost ne postoji? Sve u svemu, čini se da se ovaj zanimljiv odgovor temelji na neodrživoj pretpostavci da bi podaci trebali biti okarakterizirani vrijednostima koje * imaju *, a ne vrijednostima koje im matematički model omogućuje. Ovo drugo je presudna karakteristika, a ne prvo. Sve ovo sugerira da je kod kontinuirane / diskretne razlike bitno * kako mislimo na podatke * (odnosno kako ih modeliramo).
Postoji pametna mala basna koja ilustrira @whuber's point: Lord (1953), "O statističkom tretiranju nogometnih brojeva", * Američki psiholog *, ** 8 **, str. 750-51.
Hvala ti, @Scortchi. Web verzije dostupne su putem [pretraživanja Googleovih učenjaka] (https://www.google.com/search?q=On+the+statistic+treatment+of+football+numbers). Lord se obraća zabludi, o kojoj se žustro raspravljalo prije 60 godina, o mjeri u kojoj bi "teorija mjerenja" trebala utjecati (ili čak ograničiti opseg) statističke analize. Moja je poanta bila drugačija u vezi s razlikom između konstrukcija modela i promatranja.
#3
+12
Neil McGuigan
2010-07-20 09:07:11 UTC
view on stackexchange narkive permalink

Temperature su kontinuirane. Može biti 23 stupnja, 23,1 stupnja, 23,100004 stupnja.

Spol je diskretan. Možete biti samo muško ili žensko (ionako u klasičnom razmišljanju). Nešto što biste mogli predstaviti s cijelim brojem poput 1, 2 itd.

Razlika je važna jer mnogi statistički algoritmi i algoritmi za rukovanje podacima mogu obraditi jedan tip, ali ne i drugi. Na primjer, u redovitoj regresiji, Y mora biti kontinuiran. U logističkoj regresiji Y je diskretan.

Kada bilježite temperaturu s najbližim stupnjem, ona se može smatrati diskretnom - a možda * se mora * uzeti u obzir i za određene oblike analize. Također, u "redovitoj" (OLS?) Regresiji, $ Y $ ne mora biti kontinuirano: mnoga - i praktički sva njegova korisna svojstva - primjenjuju se na mnoge vrste diskretnih podataka, čak i na binarne odgovore. Ono što ove točke i kontrapunkti počinju sugerirati jest da * podaci * nisu nužno diskretni ili kontinuirani, već su * statistički postupci * diskretni ili kontinuirani.
#4
+11
Subrato Mukherjee
2012-07-03 21:28:12 UTC
view on stackexchange narkive permalink

Diskretni podaci mogu poprimiti samo određene vrijednosti.

Primjer: broj učenika u razredu (ne možete imati pola učenika).

Kontinuirani podaci podaci su koji mogu poprimiti bilo koju vrijednost (unutar raspona)

Primjeri:

  • Visina osobe: može biti bilo koja vrijednost (unutar raspona ljudskih visina), a ne samo određene fiksne visine,
  • vrijeme u utrci: mogli biste ga mjeriti i na dijelove sekunde,
  • težinu psa, / li>
  • Duljina lista,
  • težina osobe,
Možete nam reći i odakle ste kopirali odgovor zalijepili: https://www.mathsisfun.com/data/data-discrete-continuous.html
Lijepo opisano.
#5
+1
Tony
2011-05-16 07:19:18 UTC
view on stackexchange narkive permalink

U slučaju baze podataka, podatke bismo uvijek pohranili diskretno, čak i ako je priroda podataka kontinuirana. Zašto bih trebao naglasiti prirodu podataka? Trebali bismo uzeti distribuciju podataka koja bi nam mogla pomoći u analizi podataka. AKO je priroda podataka kontinuirana, predlažem da ih upotrebljavate kontinuiranom analizom.

Uzmimo primjer kontinuiranog i diskretnog: MP3. Čak je i vrsta "zvuka" analogna ako je pohranjena u digitalnom formatu. Morali bismo ga analizirati uvijek na analogan način.

#6
  0
Rafa_Mas
2017-08-30 11:01:44 UTC
view on stackexchange narkive permalink

S jedne strane, s praktičnog se gledišta slažem s odgovorom Jeromyja Anglima. Na kraju se većinu vremena bavimo diskretnim varijablama - iako su s teoretskog gledišta one kontinuirane - i to ima stvarni utjecaj, na primjer za klasifikaciju. Prisjetimo se Stroblovog rada koji ukazuje da su Slučajne šume pristrane prema varijablama s više točaka sječe (veća preciznost, ali potencijalno slična priroda). Iz mog osobnog iskustva vjerojatnosne neuronske mreže mogu predstavljati i pristranost kada varijable imaju različitu točnost, osim ako nisu iste vrste (tj. Kontinuirane). S druge strane, s teorijskog gledišta klasična klasifikacija (npr. Kontinuirana, diskretna, nominalna itd.) Je, IMHO, u pravu. U skladu s tim mislim da je izvorni naziv Quinlanovog rada koji opisuje algoritam M5, koji je 'regresor', izvrstan izbor. Dakle, definicija i implikacije kontinuiranog i diskretnog bitni su ovisno o ‘okruženju’.

Reference:

Quinlan J.R. (1992). Učenje uz kontinuiranu nastavu. U: 5. australska zajednička konferencija o AI. Sydney (Australija), 343–348.

Strobl C., Boulesteix A.-L., Zeileis A., & Hothorn T. (2007). Predrasude u slučajnim mjerama značajne varijable šuma: ilustracije, izvori i rješenje. BMC Bioinformatika, 8, 25. doi: 10.1186 / 1471-2105-8-25

#7
-1
Ahmad ibraheem
2013-11-20 21:18:25 UTC
view on stackexchange narkive permalink

Diskretni podaci uzimaju određene vrijednosti, dok kontinuirani podaci nisu ograničeni na zasebne vrijednosti.

Diskretni podaci su različiti i između njih nema sivog područja, dok kontinuirani podaci zauzimaju bilo koju vrijednost u odnosu na kontinuiranu vrijednost podataka.

#8
-3
manuella
2015-02-04 01:54:22 UTC
view on stackexchange narkive permalink

Diskretni podaciMogu poprimiti određene vrijednosti .brojni su.

Dobrodošli u životopis!Hvala na odgovoru, ali odvojite vrijeme da pogledate prethodne odgovore i razmislite dodajete li nešto korisno.
#9
-4
Graham Cookson
2010-07-23 20:18:34 UTC
view on stackexchange narkive permalink

Diskretni podaci mogu poprimiti samo cjelobrojne vrijednosti, dok kontinuirani podaci mogu poprimiti bilo koju vrijednost. Na primjer, broj pacijenata s karcinomom koje se svake godine liječe u bolnici je diskretan, ali vaša težina je kontinuirana. Neki su podaci kontinuirani, ali mjere se na diskretan način, na pr. tvoje godine. Uobičajeno je da se vaša dob prijavljuje na primjer 31. godine.

Podaci mogu biti diskretni bez ograničavanja na cijele brojeve. Ili brojevi, što se toga tiče. Uvijek je moguće * predstaviti * diskretne podatke s cijelim brojevima, ali to ne znači da podaci mogu poprimiti samo takve vrijednosti.
#10
-5
Md.Shahid
2013-08-22 06:54:48 UTC
view on stackexchange narkive permalink

Diskretni podaci posebno govore o konačnim vrijednostima, a kontinuirani podaci o beskonačnim vrijednostima .....

Želite li razraditi?


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...