Wangunan, Atikan sékundér jeung sakola
Metoda tatangga pangdeukeutna: conto karya
metodeu tatangga pangdeukeutna teh métrik classifier panggampangna nu dumasar kana meunteun teh kasaruaan objék béda.
obyek dianalisis milik kelas nu aranjeunna milik subjék tina sampel latihan. Hayu urang manggihan nu tatangga pangdeukeutna. Coba ngartos materi pajeulit, conto téhnik béda.
metoda hipotesa
Metoda tatangga pangdeukeutna bisa dianggap salaku algoritma paling umum dipaké pikeun klasifikasi. Obyek ngalaman klasifikasi milik y_i kelas, nu objek pangdeukeutna diajar sampel x_i.
Kaspésifikan sahiji metodeu tatanggana pangcaketna
k metoda tatangga pangdeukeutna bisa ngaronjatkeun akurasi klasifikasi. obyek dianalisis milik kelas anu sarua salaku bulk pangdeukeutna na, nyaeta, k deukeut eta objék sampel x_i dianalisis. Dina ngarengsekeun masalah sareng dua kelas di Jumlah tatanggana bakal ganjil ulah kaayaan tina ambiguitas, upami jumlah anu sarua pangdeukeutna baris milik kelas béda.
Tehnik tatanggana ditunda
Metoda PostgreSQL-dianalisis tsvector pangcaketna tatanggana anu dipaké nalika jumlah kelas sahanteuna tilu, jeung anjeun bisa make nomer ganjil. Tapi ambiguitas timbul malah dina kasus ieu. Saterusna, tatangga i-th meunang beurat w_i, nu nurun jeung tatangga rank i. Ieu nujul kana kelas obyék, nu bakal boga beurat total maksimum diantara tatanggana nutup.
Null of compactness
Di haté sadaya sahiji metodeu di luhur nyaeta hipotesa of compactness. Ieu nunjukkeun sambungan antara ukuran tina kasaruaan objék jeung maranéhna milik ka kelas anu sarua. Dina kaayaan ieu, wates antara tipena béda nyaéta formulir basajan, sarta nyieun kelas objék dina spasi aréa mobile ci. Dina wewengkon misalna dina analisis matematik dicandak ka hartosna a set bounded ditutup. hipotesa ieu teu aya hubunganana jeung persépsi sapopoé kalimah.
Rumus dasar
Hayu urang nalungtik leuwih tatangga pangdeukeutna. Mun latihan diusulkeun tipe sampel "obyek-response» X ^ m = \ {(x_1, y_1), \ titik-titik, (x_m, y_m) \}; lamun hiji pluralitas objék pikeun nangtukeun jarak fungsi \ rho (x, x '), anu digambarkeun dina bentuk hiji modél kasaruaan nyukupan objék ku cara ningkatkeun nilai fungsi nurun kasaruaan antara objék x, x'.
Pikeun obyék sagala, u baris ngawangun sampel latihan objék x_i kalayan ngaronjatna jarak ka u:
\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}),
dimana x_ {i; u} dicirikeun sampel learning obyék, nu abdi-th sumber tatangga obyék u. notasi sarta pamakéan sapertos walon i-th tatangga: y_ {i; u}. Hasilna, urang manggihan yén sagala obyek u provokes renumbering sampel sorangan.
Tekad anu jumlahna k pangdeukeutna
Metoda tatangga pangdeukeutna lamun k = 1 sanggup méré hiji klasifikasi erroneous, henteu ngan dina objék-emisi, tapi ogé pikeun kelas séjén nu deukeut.
Mun urang nyandak k = m, algoritma nu bakal jadi stabil sarta bakal degenerate kana nilai konstan. Éta pisan sababna naha reliabiliti Kadé ulah indéks ekstrim k.
Dina prakték, salaku optimal indéks k dipaké kriteria ngageser kontrol.
émisi screenings
Objék studi anu sakitu legana unequal, tapi diantara aranjeunna aya jalma anu miboga ciri tina kelas hiji sarta disebut salaku standar. Dina jarak tina subjek jeung modél idéal probability tinggi miboga milik kelas ieu.
Kumaha rezultativen metoda tatanggana pangcaketna? Hiji conto bisa ditempo dina dasar kategori periferal sarta non-informatif objék. Hal ieu dianggap lingkungan padet tina obyek wawakil sejenna kelas ieu. Sawaktos Anjeun nyabut eta tina klasifikasi sampling kualitas moal sangsara.
Meunang kana sababaraha sampel meureun noise bursts anu "dina taneuh" di kelas hiji. Nyoplokkeun dampak substansi positif dina kualitas klasifikasi nu.
Lamun sampel dicokot tina objék noise uninformative sarta ngaleungitkeun, anjeun tiasa cacah dina hasil positif sababaraha dina waktos anu sareng.
Kahiji metoda interpolasi tina klasifikasi tatangga pangdeukeutna ngamungkinkeun pikeun ngaronjatkeun kualitas nu, ngurangan jumlah data nu disimpen, ngurangan waktu klasifikasi, anu geus spent dina pilihan standar salajengna.
Pamakéan sampel ultra-badag
Metoda tatangga pangdeukeutna anu dumasar kana neundeun nyata objék learning. Pikeun nyieun pisan sampel badag skala ngagunakeun masalah teknis. Tujuan henteu ngan pikeun ngahemat jumlah signifikan inpormasi tapi ogé dina jumlah minimum waktu geus waktuna pikeun manggihan naon tujuanna u k diantara tatanggana pangdeukeutna.
Cope jeung tugas ieu, dua métode anu dipaké:
- sampel thinned via objék ngurangan non-data;
- pamakéan struktur data husus éféktif jeung Konci keur pilarian instan sahiji tatanggana pangcaketna.
Aturan padika Pilihan
Klasifikasi di luhur ieu dianggap. Metoda tatangga pangdeukeutna dipaké dina ngarengsekeun masalah praktis, anu geus dipikawanoh sateuacanna jarak fungsi \ rho (x, x '). Dina objék ngajéntrékeun vektor numerik ngagunakeun métrik Euclidean. pilihan ieu euweuh leresan husus, tapi ngalibatkeun ukur sadaya tanda "dina skala nu sami." Lamun faktor ieu henteu dibawa ka rekening, teras métrik bakal predominate fitur ngabogaan nilai numerik pangluhurna.
Mun aya jumlah badag fitur, ngitung jarak salaku jumlah ti simpangan on gejala husus némbongan dimension masalah serius.
Dina spasi dimensi tinggi jauh ti karana bakal sagala obyek. Pamustunganana, sample wae bakal gigireun obyék keur ditalungtik k tatanggana. dipilih sajumlah leutik fitur informatif pikeun ngaleungitkeun masalah ieu. Algoritma keur ngitung perkiraan ngawangun dina dasar susunan béda tanda, jeung unggal individu ngawangun fungsi deukeutna maranéhanana.
kacindekan
itungan matematik mindeng ngalibetkeun pamakéan rupa-rupa téhnik nu gaduh sorangan has ciri, kaunggulan jeung kalemahan. Ditempo metoda tatangga pangdeukeutna bisa ngajawab rada masalah serius, lantaran ciri objék matematik. Konsep eksperimen, dumasar padika dianalisis keur aktip dipake dina kecerdasan jieunan.
Dina sistem ahli perlu henteu ngan nepi ka mengklasifikasikan objék, tapi ogé némbongkeun pamaké penjelasan kana klasifikasi sual. Dina metoda ieu, penjelasan kana fenomena ieu dikedalkeun dina hubungan objek mangrupa kelas hususna ogé lokasi relatif na ka Sampel anu digunakeun. spesialis Industri légal, geolog, ahli médis, nyandak ieu "precedent" logika aktip ngagunakeun eta dina panalungtikan maranéhanana.
Dina raraga dianalisis metoda éta paling dipercaya, efisien, mere hasil nu dipikahoyong, anjeun kedah nyandak hiji inohong k minimum, bari ogé ulah émisi antara objék dianalisis. Éta pisan sababna naha pamakéan standar sarta metoda Pilihan, kitu oge sareng metrics optimasi.
Similar articles
Trending Now