Pitanje:
Što je "kernel" na jednostavnom engleskom?
Neil McGuigan
2010-09-09 05:15:08 UTC
view on stackexchange narkive permalink

Postoji nekoliko različitih upotreba:

  • procjena gustoće jezgre
  • trik jezgre
  • zaglađivanje jezgre

Molimo objasnite što svojim jezicima znači "kernel" u njima, jednostavnim engleskim jezikom.

Da ne budem bezobrazan, ali nije li ovo pitanje na koje je već odgovoreno zbog mučnine na Wikipediji i slično? Google mi je dao odgovor u roku od 15 sekundi ...
Apsolutno mrzim wikipedijske odgovore na statistiku. Postoje nesretni, simbolički neredi. Tražim dragulj odgovora koji bi mogao objasniti odgovor jednostavnim engleskim jezikom, jer vjerujem da to pokazuje dublju razinu razumijevanja od matematičke jednadžbe. Ovdje ima mnogo popularnih "običnih engleskih" pitanja, i to s dobrim razlogom.
Dva odgovori:
#1
+44
Thylacoleo
2010-09-09 06:21:56 UTC
view on stackexchange narkive permalink

Čini se da postoje najmanje dva različita značenja "jezgre": jedno koje se češće koristi u statistici; drugi u strojnom učenju.

U statistici "kernel" se najčešće koristi za upućivanje na procjenu gustoće jezgre i zaglađivanje jezgre.

Može se pronaći izravno objašnjenje zrna u procjeni gustoće ( ovdje).

U strojnom učenju " kernel "obično se koristi za pozivanje na trik jezgre, metodu korištenja linearnog klasifikatora za rješavanje nelinearnog problema" preslikavanjem izvornih nelinearnih opažanja u prostor veće dimenzije ".

Jednostavna vizualizacija može biti zamišljanje da su sve klase $ 0 $ unutar radijusa $ r $ od ishodišta u ravnini x, y (klasa $ 0 $: $ x ^ 2 + y ^ 2 < r ^ 2 $); a sve su klase $ 1 $ izvan polumjera $ r $ u toj ravnini (klasa $ 1 $: $ x ^ 2 + y ^ 2 > r ^ 2 $). Nijedan linearni separator nije moguć, ali očito će krug polumjera $ r $ savršeno razdvojiti podatke. Podatke možemo transformirati u trodimenzionalni prostor izračunavanjem tri nove varijable $ x ^ 2 $, $ y ^ 2 $ i $ \ sqrt {2} xy $. Dvije će se klase sada odvojiti ravninom u ovom trodimenzionalnom prostoru. Jednadžba te optimalno razdvajajuće hiperravnine gdje je $ z_1 = x ^ 2, z_2 = y ^ 2 $ i $ z_3 = \ sqrt {2} xy $ je $ z_1 + z_2 = 1 $, a u ovom slučaju izostavlja $ z_3 $. (Ako je kružnica odmaknuta od ishodišta, optimalna razdvajajuća hiper ravnina također će varirati u $ z_3 $.) Jezgra je funkcija mapiranja koja izračunava vrijednost dvodimenzionalnih podataka u trodimenzionalnom prostoru.

U matematici postoje druge upotrebe "jezgri", ali čini se da su one glavne u statistici.

Jako lijepo! Koristit ću vaš primjer s krugom kako bih objasnio metode jezgre, jer je to najbolja vizualizacija koju sam upoznao do sada. Hvala!
Sljedeći je video anonimni potencijalni urednik predložio kao "sjajnu vizualizaciju onoga što je Thylacoleo objasnio:" http://www.youtube.com/watch?v=3liCbRZPrZA
Slijedeći Thylacoleov primjer korištenja kruga za objašnjavanje trika kernela (nemam dovoljno reputacije da dodam komentar izravno u njegov odgovor) Je li u jednadžbi za razdvajanje hiperravnine postojala jednostavna greška u kucanju? i trebao bi biti z1 + z2 = r ^ 2, umjesto z1 + z2 = 1? Ili krivo razumijem? Slažem se s lijepim jednostavnim primjerom koji ilustrira koncept. Hvala. Iako se definicija z3 i dalje čini pomalo tajnovitom, ali očito nije bitna za primjer usredotočen na ishodište.
Da, bila je pogreška u kucanju. Hvala na tome Alex. Ne korigiram uvijek :-)
Koristimo li unutarnje proizvode za preslikavanje dvodimenzionalnih podataka u trodimenzionalne?
#2
+39
ebony1
2010-09-09 11:09:24 UTC
view on stackexchange narkive permalink

I u statistici (procjena gustoće jezgre ili izravnavanje jezgre) i u literaturi o strojnom učenju (metode jezgre), jezgra se koristi kao mjera sličnosti. Konkretno, funkcija jezgre $ k (x,.) $ Definira raspodjelu sličnosti točaka oko određene točke $ x $. $ k (x, y) $ označava sličnost točke $ x $ s drugom zadanom točkom $ y $.

Ovo je lijep način. Zanima me možete li generalizirati ovaj opis da se odnosi i na jezgru 'procjene gustoće jezgre'.
Na neki način, da. Jedan od načina za razumijevanje procjene gustoće zrna je da gustoću točke približite iz neke distribucije kao ponderirani prosjek njenih sličnosti sa skupom točaka iz distribucije. Dakle, pojam sličnosti i ovdje igra ulogu.
Razumijem da se "jezgra" u statistici izvorno posuđuje iz žargona koji se koristi u raspravi o integralnim jednadžbama.


Ova pitanja su automatski prevedena s engleskog jezika.Izvorni sadržaj dostupan je na stackexchange-u, što zahvaljujemo na cc by-sa 2.0 licenci pod kojom se distribuira.
Loading...