Pitanje:
Objasnite razliku između višestruke regresije i multivarijatne regresije, uz minimalnu upotrebu simbola / matematike
Neil McGuigan
2010-09-03 23:54:17 UTC
view on stackexchange narkive permalink

Jesu li višestruka i multivarijatna regresija zaista različite? Što je uopće varijabla?

Pet odgovori:
#1
+57
chl
2010-09-04 00:03:08 UTC
view on stackexchange narkive permalink

Vrlo brzo, rekao bih: 'višestruko' odnosi se na broj prediktora koji ulaze u model (ili ekvivalentno matrici dizajna) s jednim ishodom (odgovor Y), dok se 'multivarijacija' odnosi na matricu vektora odgovora . Ne mogu se sjetiti autora koji s tim razmatranjem započinje uvodni odjeljak o multivarijatnom modeliranju, ali mislim da je to Brian Everitt u svojoj udžbeniku R i S-Plus pratilac multivarijantne analize. Za temeljitu raspravu o tome, predložio bih pogledati njegovu najnoviju knjigu Multivarijabilno modeliranje i multivarijatna analiza za bihevioralne znanosti.

Za 'varijantu', rekao bih ovo je uobičajeni način upućivanja na bilo koju slučajnu varijablu koja slijedi poznatu ili pretpostavljenu raspodjelu, npr govorimo o gausovim varijablama $ X_i $ kao o nizu opažanja izvedenih iz normalne raspodjele (s parametrima $ \ mu $ i $ \ sigma ^ 2 $). U vjerojatnosnom smislu rekli smo da su to neke slučajne realizacije X-a, s matematičkim očekivanjem $ \ mu $, i očekuje se da će oko 95% njih ležati u rasponu $ [\ mu-2 \ sigma; \ mu + 2 \ sigma] $.

Čak i https://www.coursera.org/learn/machine-learning/home/week/2 koristi izraz multivarijatna regresija umjesto višestruke regresije ...
Mislim da ista zabuna nastaje kod ljudi koji koriste pojam GLM za Opći linearni model (npr. U studijama neuroimaginga) u odnosu na Generalizirani linearni model.Vidio sam mnogo slučajeva "multivarijantne logističke regresije" gdje postoji samo jedan ishod i mislim da to nije toliko važno sve dok je pojam jasno definiran od strane autora.
#2
+47
user28
2010-09-04 00:27:21 UTC
view on stackexchange narkive permalink

Evo dva usko povezana primjera koji ilustriraju ideje. Primjeri su donekle američki usmjereni, ali ideje se mogu ekstrapolirati u druge zemlje.

Primjer 1

Pretpostavimo da sveučilište želi usavršiti svoje kriterije za upis da prihvaćaju 'bolje' studente. Također, pretpostavimo da je studentski prosjek bodova (GPA) ono što sveučilište želi koristiti kao metriku izvedbe za studente. Imaju na umu nekoliko kriterija poput srednjoškolskog ocjenjivanja (HSGPA), SAT rezultata (SAT), spola itd. I željeli bi znati koji je od ovih kriterija bitan što se tiče GPA-a.

Rješenje: Višestruka regresija

U gore navedenom kontekstu postoji jedna ovisna varijabla (GPA) i imate više neovisnih varijabli (HSGPA, SAT, spol itd.). Želite otkriti koje su od neovisnih varijabli dobri prediktori za vašu ovisnu varijablu. Za ovu biste procjenu koristili višestruku regresiju.

Primjer 2

Umjesto gornje situacije, pretpostavimo da prijamna služba želi pratiti uspješnost učenika kroz vrijeme i želi utvrditi koji od njihovih kriterija pokreće uspjeh učenika kroz vrijeme. Drugim riječima, imaju ocjene GPA za četiri godine koliko učenik ostaje u školi (recimo, GPA1, GPA2, GPA3, GPA4) i žele znati koja od neovisnih varijabli predviđa GPA bodove bolje za svaku godinu godine osnova. Ured za prijam nada se da će otkriti da iste neovisne varijable predviđaju izvedbu tijekom sve četiri godine, tako da njihov odabir kriterija za upis osigurava da je uspjeh učenika konstantno visok tijekom sve četiri godine.

Rješenje: Multivarijatna regresija

U primjeru 2 imamo više ovisnih varijabli (tj. GPA1, GPA2, GPA3, GPA4) i više neovisnih varijabli. U takvoj biste situaciji koristili multivariatnu regresiju.

Uvijek postoji onaj koji pravilno odgovori na pitanje primjerima :)
100% najbolji odgovor koji zapravo možete razumjeti
#3
+26
stackoverflowuser2010
2016-07-18 08:29:33 UTC
view on stackexchange narkive permalink

Jednostavna regresija odnosi se na jednu ovisnu varijablu ($ y $) i jednu neovisnu varijablu ($ x $): $ y = f (x) $

Višestruka regresija (aka multivarijabilna regresija) odnosi se na jednu ovisnu varijablu i više neovisne varijable: $ y = f (x_1, x_2, ..., x_n) $

Multivarijatna regresija odnosi se na više ovisnih varijabli i više jake> neovisne varijable: $ y_1, y_2, ..., y_m = f (x_1, x_2, ..., x_n) $. Možete naići na probleme gdje su i ovisne i neovisne varijable raspoređene kao matrice varijabli (npr. $ Y_ {11}, y_ {12}, ... $ i $ x_ {11}, x_ {12}, ... $ ), tako da izraz može biti zapisan kao $ Y = f (X) $, gdje velika slova označavaju matrice.

Daljnje čitanje:

Razumijem definiciju.Ali kakav je učinak liječenja multi-varijabilne regresije kao sustava jedno-varijabilne regresije?
@LKS: Možda ćete to htjeti postaviti u potpuno odvojenom pitanju.
https://stats.stackexchange.com/questions/254254/why-do-we-need-multivariate-regression-as-opposed-to-a-bunch-of-univariate-regr
Je li se odgovor u Quori odnosio na ovu stranicu?: P
#4
+4
thecity2
2017-03-04 03:44:58 UTC
view on stackexchange narkive permalink

Mislim da je ovdje ključni uvid (i diferencijator), osim broja varijabli s obje strane jednadžbe, da je u slučaju multivarijatne regresije cilj iskoristiti činjenicu da postoji (općenito) korelacija između odgovoravarijable (ili ishodi).Primjerice, u medicinskom ispitivanju prediktori mogu biti težina, dob i rasa, a varijable ishoda su krvni tlak i kolesterol.U teoriji bismo mogli stvoriti dva modela "višestruke regresije", jedan koji regresira krvni tlak na težini, dobi i rasi, a drugi model koji regresira kolesterol na te iste čimbenike.Međutim, alternativno, mogli bismo stvoriti jedan multivarijacijski regresijski model koji istovremeno predviđa i krvni tlak i kolesterol na temelju tri varijable prediktora.Ideja je da bi multivarijacijski regresijski model mogao biti bolji (prediktivniji) utoliko što može naučiti više iz korelacije između krvnog tlaka i kolesterola u pacijenata.

Sjajna poanta.Pitao sam se može li se multivarijatna regresija napraviti s R. Koristeći Manovu, mogu napraviti multivarijantnu ANOVA, ali ne mogu dobiti koeficijente poput univarijantne regresije.
#5
+1
Bhabesh Mahanta
2019-03-04 19:56:59 UTC
view on stackexchange narkive permalink

U multivarijantnoj regresiji postoji više od jedne ovisne varijable s različitim varijancama (ili raspodjelama).Varijable prediktora mogu biti više od jedne ili višestruke.Dakle, to može biti višestruka regresija s matricom ovisnih varijabli, t.j.e.više varijacija. Ali kad kažemo višestruka regresija, mislimo samo na jednu ovisnu varijablu s jednom distribucijom ili varijancom.Varijable prediktora su više od jedne. Sažeti višestruko odnosi se na više prediktorskih varijabli, ali multivarijantno se odnosi na više ovisnih varijabli.



Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...