Pitanje:
Kako protumačiti dendrogram hijerarhijske klasterske analize
Ric
2014-01-15 17:04:32 UTC
view on stackexchange narkive permalink

Razmotrite donji primjer R:

  plot (hclust (dist (USArrests), "ave"))  
  1. Što točno znači y-os "Visina"?

  2. Gledajući Sjevernu Karolinu i Kaliforniju (radije lijevo). Je li Kalifornija "bliža" Sjevernoj Karolini od Arizone? Mogu li napraviti ovo tumačenje?

  3. Havaji (zdesna) pridružuju se grupi prilično kasno. Vidim da je to "više" od ostalih država. Općenito, kako mogu pravilno protumačiti činjenicu da su oznake na dendrogramu "više" ili "niže"?

enter image description here

Odgovori u `? Hclust`.
Položaji naljepnica nemaju nikakvo značenje. Ako ne razumijete os y, neobično je da ste pod dojmom da dobro razumijete hijerarhijsko grupiranje.
Također imajte na umu da hijerarhijsko klasteriranje općenito _ne_ daje _hierarhijsku klasifikaciju (stablo). Prosječna metoda (koju ste koristili) posebno ne. Pogledajte posljednju točku [ovdje] (http://stats.stackexchange.com/a/63549/3277).
Položaj naljepnice ipak ima malo značenja. Što je pozicija viša, objekt se kasnije povezuje s drugima, a time i kao da je vanzemaljac ili zalutali.
@StéphaneLaurent U pravu si da ovo zvuči kao kontradikcija. S te strane još uvijek mislim da sam u mogućnosti presresti dendogram podataka koje dobro poznajem. Nadalje, položaj oznaka ima malo značenja kao što ističu ttnphns i Peter Flom. Napokon, vaš komentar za mene nije bio konstruktivan.
Oprostite ako sam bio nespretan. Zapravo nisam znao za etikete. Os y daje udaljenost između nakupina, ona je bitni sastojak klasifikacije.
Tri odgovori:
Srmsbrmnm
2014-07-26 10:17:41 UTC
view on stackexchange narkive permalink

Imala sam ista pitanja kada sam pokušala naučiti hijerarhijsko grupiranje i smatrala sam da je sljedeći pdf vrlo koristan.

http://www.econ.upf.edu/~michael/stanford/maeb7.pdf

Čak i ako je Richard već načisto s postupkom , drugi koji pretražuju pitanje vjerojatno mogu koristiti pdf, njegov vrlo jednostavan i jasan esp za one koji nemaju dovoljno matematike.

Samo želim ponoviti da je povezani PDF vrlo dobar.
Referenca: Klimberg, Ronald K. i B. D. McCullough.2013. „Poglavlje 7: Hijerarhijska analiza klastera“.u _Osnovi prediktivne analitike s JMP._ Cary, NC: SAS Institute.
Peter Flom
2014-01-15 17:50:28 UTC
view on stackexchange narkive permalink

1) Os y je mjera blizine bilo pojedinih točaka podataka ili klastera.

2) Kalifornija i Arizona jednako su udaljeni od Floride jer su CA i AZ u grupi prije nego što se bilo koja pridruži FL.

3) Havaji se pridružuju prilično kasno; oko 50. To znači da je nakupina kojoj se pridružuje bliža jedna drugoj prije nego što se HI pridruži. Ali ne puno bliže. Imajte na umu da se klaster kojem se pridružuje (onaj skroz zdesna) formira tek oko 45. Činjenica da se HI pridružuje klasteru kasnije od bilo kojeg drugog stanja jednostavno znači da (koristeći bilo koju metriku koju ste odabrali) HI nije toliko blizu bilo koja određena država.

Stoga mi "visina" daje ideju o vrijednosti kriterija veze (kao [ovdje] (http://en.wikipedia.org/wiki/Hierarchical_clustering)) - u mom slučaju prosječna udaljenost klastera jednih prema drugima. Je li to točno? Hvala!
Nije li y-os mjera * dis * sličnosti između nakupina i točaka?Tj.negativna bliskost, jer je najveća kad su stvari najrazličitije, a ne obrnuto @PeterFlom
Babaasa
2019-03-16 15:13:39 UTC
view on stackexchange narkive permalink

Vodoravna os predstavlja klastere.Okomita skala na dendrogramu predstavlja udaljenost ili različitost.Svako spajanje (spajanje) dviju nakupina prikazano je na dijagramu dijeljenjem okomite crte u dvije okomite crte.Okomiti položaj rascjepa, prikazan kratkom trakom, daje udaljenost (različitost) između dva skupa.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 3.0 licenci pod kojom se distribuira.
Loading...