Pitanje:
Analiza latentne klase naspram klaster analize - razlike u zaključcima?
Brian P
2014-10-31 22:54:37 UTC
view on stackexchange narkive permalink

Koje su razlike u zaključcima koje se mogu dobiti iz analize latentne klase (LCA) u odnosu na klaster analizu? Je li točno da LCA pretpostavlja temeljnu latentnu varijablu koja dovodi do klasa, dok je analiza klastera empirijski opis koreliranih atributa iz algoritma klasteriranja? Čini se da je LCA u društvenim znanostima stekao popularnost i smatra se metodološki superiornijim s obzirom na to da ima formalni test značajnosti hi-kvadrat, što klaster analiza nema.

Bilo bi sjajno kad bi se primjeri mogli ponuditi u obliku: "LCA bi bio prikladan za ovo (ali ne i klaster analiza), a klaster analiza bi bila prikladna za ovo (ali ne i latentna analiza klasa) .

Hvala! Brian

Što u tom kontekstu nazivate `zaključcima` i zašto vas zanimaju samo razlike u zaključivanju?
@ttnphns Pod zaključcima mislim na suštinsku interpretaciju rezultata.Nisam siguran u potonjem dijelu vašeg pitanja o mom interesu za "samo razlike u zaključcima?"Ne zanima me izvršavanje njihovih algoritama niti matematika koja je u osnovi.Zanima me kako bi se rezultati protumačili.
Tri odgovori:
Tim
2015-01-21 19:05:16 UTC
view on stackexchange narkive permalink

Analiza latentne klase zapravo je model konačne smjese (vidi ovdje). Glavna razlika između FMM-a i ostalih algoritama klasteriranja je u tome što vam FMM nude pristup "klasteriziranja temeljenog na modelu" koji izvodi klastere pomoću vjerojatnosnog modela koji opisuje distribuciju vaših podataka. Dakle, umjesto pronalaska klastera s nekom proizvoljno odabranom mjerom udaljenosti, koristite model koji opisuje distribuciju vaših podataka i na temelju tog modela procjenjujete vjerojatnosti da su određeni slučajevi članovi određenih latentnih klasa. Tako biste mogli reći da je to pristup odozgo prema dolje (započinjete s opisivanjem distribucije vaših podataka), dok su drugi algoritmi klasteriranja prilično pristupi odozdo prema gore (sličnosti između slučajeva možete pronaći).

Budući da za odabir modela podataka koristite statistički model i moguće je procijeniti dobro stanje - suprotno grupiranju. Također, ako pretpostavite da postoji neki proces ili "latentna struktura" koja leži u osnovi strukture vaših podataka, čini se da su FMM-i prikladan izbor jer vam omogućuju modeliranje latentne strukture koja stoji iza vaših podataka (umjesto da samo tražite sličnosti).

Druga je razlika što su FMM-ovi fleksibilniji od grupiranja. Algoritmi klasteriranja samo rade klasteriranje, dok postoje modeli temeljeni na FMM-u i LCA koji

  • omogućuju potvrdnu analizu između grupa,
  • kombinirajući teoriju odgovora na stavke i drugi) modeli s LCA,
  • uključuju kovarijante za predviđanje latentnog članstva u pojedincima,
  • i / ili čak unutar regresijskih modela unutar klastera u regresiji latentne klase,
  • omogućuju vam modeliranje promjena u strukturi vaših podataka itd.

Za više primjera pogledajte:

Hagenaars JA & McCutcheon, A.L. (2009). Primijenjena analiza latentne klase. Cambridge University Press.

i dokumentacija paketa flexmix i poLCA u R, uključujući sljedeće radove:

Linzer, D. A., & Lewis, J. B. (2011). poLCA: R-paket za politomnu varijabilnu analizu latentnih klasa. Journal of Statistical Software, 42 (10), 1-29.

Leisch, F. (2004). Flexmix: Opći okvir za modele konačnih smjesa i latentnu regresiju stakla u R. Časopis za statistički softver, 11 (8), 1-18.

Grün, B., & Leisch, F. (2008). FlexMix verzija 2: konačne smjese s popratnim varijablama i promjenjivim i konstantnim parametrima. Časopis za statistički softver, 28 (4), 1-35.

D L Dahly
2014-11-12 19:02:02 UTC
view on stackexchange narkive permalink

Model latentne klase (ili latentni profil, ili općenito, model konačne smjese) može se smatrati vjerojatnim modelom za grupiranje (ili nenadziranom klasifikacijom). Cilj je općenito isti - identificirati homogene skupine unutar veće populacije. Mislim da su glavne razlike između latentnih modela klasa i algoritamskih pristupa klasterizaciji u tome što se prvi očito priklanja teoretskim nagađanjima o prirodi klastera; i budući da je model latentne klase vjerojatan, on daje dodatne alternative za procjenu uklapanja modela putem statistike vjerojatnosti i bolje bilježi / zadržava nesigurnost u klasifikaciji.

Možda ćete pronaći neke korisne sitnice u ovoj niti, kao i ovaj odgovor u povezanom postu chl.

Postoje i paralele (na konceptualnoj razini) s ovim pitanjem o PCA vs faktorskom analizom, kao i ovim.

ccsv
2014-11-02 16:43:34 UTC
view on stackexchange narkive permalink

Razlika je u tome što bi analiza latentne klase koristila skrivene podatke (što je obično obrazac povezivanja u značajkama) za određivanje vjerojatnosti za značajke u klasi. Tada se mogu zaključiti koristeći maksimalnu vjerojatnost razdvajanja predmeta u klase na temelju njihovih značajki.

Analiza klastera crta značajke i koristi algoritme kao što su najbliži susjedi, gustoća ili hijerarhija kako bi se utvrdilo kojoj klasi pripada stavka. .

U osnovi se zaključivanje o LCA može smatrati "onim što je najsličniji obrazac pomoću vjerojatnosti", a klaster analiza bi bila "što je najbliže korištenju udaljenosti".

Možete li pojasniti na što se "stvar" odnosi u izjavi o klaster analizi?Je li to najbliža 'značajka' na temelju mjere udaljenosti?
stvar bi bila objekt objekt ili bilo koji drugi podatak koji unesete s parametrima značajke.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...