Elimu:Elimu ya sekondari na shule

Njia ya jirani iliyo karibu: mfano wa kazi

Njia ya jirani ya karibu ni kiwango cha rahisi cha metric, ambacho kinategemea kutathmini kufanana kwa vitu tofauti.

Kitu kilichochambuliwa kinajulikana kwa darasa ambalo masomo ya sampuli ya mafunzo ni ya. Hebu tujue ni njia gani ya jirani aliye karibu. Hebu jaribu kuelewa suala hili ngumu, kutoa mifano ya mbinu tofauti.

Hisia ya njia

Njia ya karibu ya jirani inaweza kuchukuliwa kuwa algorithm ya kawaida inayotumiwa kwa uainishaji. Kitu ambacho kinaingia kwa uainishaji ni wa darasa hilo_i, ambalo kitu cha karibu sana cha sampuli ya mafunzo x_i ni cha.

Ufafanuzi wa mbinu za majirani ya karibu

Njia ya karibu ya majirani inaruhusu kuongeza uaminifu wa uainishaji. Kitu kilichochambuliwa ni cha darasa sawa na ukubwa kuu wa majirani zake, yaani, k vitu karibu na sampuli iliyochambuliwa x_i. Wakati wa kutatua matatizo na madarasa mawili, idadi ya majirani itakuwa isiyo ya kawaida kuwatenga hali ya usawa ikiwa namba sawa ya majirani itakuwa ya madarasa tofauti.

Njia ya majirani wenye uzito

Njia ya postgresql ya mshambuliaji wa karibu wa majirani hutumika wakati idadi ya madarasa sio chini ya tatu, na kutokuwepo hawezi kutumika. Lakini utata hutokea hata katika kesi hizi. Kisha jirani ya i-th hupata uzito w_i, ambayo inapungua kwa kiwango cha kuongeza jirani i. Kitu kinamaanisha darasa ambalo litakuwa na uzito wa kiwango cha juu kati ya majirani wa karibu.

Nadharia ya uchangamano

Katika moyo wa njia zote zilizotajwa hapo juu ni hypothesis ya uchangamano. Inahusisha uhusiano kati ya kipimo cha kufanana kwa vitu na mali yao kwenye darasa moja. Katika hali hii, mipaka kati ya maoni tofauti ina fomu rahisi, na madarasa huunda sehemu za simu za kawaida katika nafasi ya vitu. Chini ya nyanja hizo katika uchambuzi wa hisabati ni desturi ya maana seti zilizofungwa imefungwa. Hisia hii haihusiani na mtazamo wa kila siku wa neno hili.

Fomu ya msingi

Hebu tuchambue kwa undani zaidi njia ya jirani aliye karibu. Ikiwa sampuli ya mafunzo ya fomu "kitu-majibu" hutolewa X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; Ikiwa kwa seti ya vitu kazi ya umbali \ rho (x, x ') inatolewa, ambayo inaonyeshwa kama mfano wa kutosha wa vitu, kama thamani ya kazi hii inavyoongezeka, kufanana kati ya vitu x, x' inapungua.

Kwa kitu cho chote, sisi hujenga vitu vya sampuli za mafunzo x_i kama umbali unaoongezeka:

\ U (x, {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}

Ambapo x_ {i; U} hufafanua kitu cha sampuli ya mafunzo ambacho ni jirani ya i-j ya kitu cha awali. Tunatumia maelezo haya kwa jibu kwa jirani ya i-th: y_ {i; U}. Matokeo yake, tunapata kuwa kitu chochote cha uongo husababisha mabadiliko katika hesabu ya sampuli yake mwenyewe.

Uamuzi wa idadi ya majirani k

Njia ya jirani ya karibu katika k = 1 ina uwezo wa kutoa uainishaji usiosababishwa tu na vitu vya uhamisho, lakini pia kwa madarasa mengine ambayo iko karibu.

Ikiwa tunachukua k = m, algorithm itakuwa imara kwa kiwango kikubwa na hupungua kwa thamani ya mara kwa mara. Ndiyo sababu ya kuaminika ni muhimu kuturuhusu viashiria vikali k.

Katika mazoezi, kigezo cha kudhibiti sliding kinatumiwa kama kiashiria sahihi k.

Uharibifu wa uzalishaji

Vitu vya mafunzo haviko sawa, lakini miongoni mwao kuna wale ambao wana sifa za darasa na wanaitwa viwango. Kwa ukaribu wa somo la sampuli bora, uwezekano wa kuwa wake wa darasa lililopewa ni kubwa.

Je, ni njia bora ya majirani ya karibu? Mfano unaweza kutazamwa kwa kuzingatia makundi ya vitu vya pembeni na zisizo na maarifa. Mazingira magumu ya kitu kilichochukuliwa ni kudhani kuwa wawakilishi wengine wa darasa hili. Ikiwa utawaondoa kutoka kwa sampuli, ubora wa uainishaji hauathiriwa.

Kuingia kwenye sampuli hiyo inaweza kuwa idadi fulani ya upepo wa kelele ambao ni "katika nene ya" darasa lingine. Kuondolewa kimsingi kuna athari nzuri juu ya ubora wa uainishaji uliofanywa.

Ikiwa vitu visivyo na taarifa na kelele vinaondolewa kutoka kwa sampuli, matokeo kadhaa mazuri yanaweza kutarajiwa wakati huo huo.

Kwanza ya kutafsiriwa kwa njia ya jirani ya karibu inaruhusu kuboresha ubora wa uainishaji, kupunguza kiasi cha data kuhifadhiwa, kupunguza muda wa uainishaji, ambayo hutumika katika kuchagua viwango vya karibu.

Matumizi ya sampuli za ziada

Njia ya jirani ya karibu inategemea kuhifadhi halisi ya vitu vya mafunzo. Kujenga sampuli super-kubwa kutumia matatizo ya kiufundi. Kazi sio kuhifadhi tu kiasi kikubwa cha habari, lakini pia katika muda mdogo wa kusimamia kupata kitu cha kiholela kwa miongoni mwa majirani wa karibu.

Ili kukabiliana na kazi, njia mbili hutumiwa:

  • Punguza sampuli kwa kutupa vitu visilo vya habari;
  • Tumia miundo maalum na mihtasari ya data kwa utafutaji wa haraka wa majirani ya karibu.

Kanuni za uteuzi wa mbinu

Uainishaji ulizingatiwa hapo juu. Njia ya jirani ya karibu hutumiwa kutatua matatizo ya vitendo ambayo kazi ya umbali \ rho (x, x ') inajulikana kabla. Wakati wa kuelezea vitu, vectors namba hutumia metali ya Euclidean. Uchaguzi kama huo hauna haki ya haki, lakini inaashiria kipimo cha ishara zote "kwa kiwango kikubwa". Ikiwa jambo hili halijazingatiwa, basi metali itaongozwa na ishara yenye maadili makubwa ya namba.

Kwa uwepo wa idadi kubwa ya vipengele, kuhesabu umbali kama jumla ya upungufu wa sifa maalum, tatizo kubwa la dimensionality linaonekana.

Katika nafasi ya mwelekeo wa juu, vitu vyote vitakuwa mbali na kila mmoja. Katika uchambuzi wa mwisho, sampuli ya kiholela ya majirani karibu na kitu chini ya kujifunza k itakuwa kiholela. Ili kuondoa tatizo hili, idadi ndogo ya ishara za elimu huchaguliwa. Maadili ya kuhesabu makadirio yanajengwa kwa misingi ya seti tofauti za sifa, na kwa kila mtu hujenga kazi ya ukaribu wao.

Hitimisho

Mahesabu ya hisabati mara nyingi huhusisha matumizi ya mbinu mbalimbali ambazo zina sifa zao tofauti, faida na hasara. Njia iliyozingatiwa ya majirani ya karibu inaruhusu kutatua shida nyingi badala zenye uhusiano wa vitu vya hisabati. Dhana za majaribio, kulingana na mbinu iliyochambuliwa, sasa hutumiwa kikamilifu katika zana za akili za bandia.

Katika mifumo ya wataalamu, ni lazima sio tu kugawa vitu, lakini pia kuonyesha mtumiaji maelezo ya uainishaji unaohusika. Kwa njia hii, ufafanuzi wa jambo hilo huonyeshwa na uhusiano wa kitu kwa darasa fulani, na kwa eneo lake kuhusiana na sampuli iliyotumiwa. Wataalam wa sekta ya kisheria, wanaiolojia, madaktari, wanakubali hili "historia", wanaitumia kikamilifu katika masomo yao.

Ili njia ya kuchambuliwa kuwa ya kuaminika iwezekanavyo, ufanisi, kutoa matokeo yaliyotakiwa, ni muhimu kuchukua kiashiria cha chini k, na pia si kuruhusu uzalishaji kutoka kwa vitu vilivyohesabiwa. Ndiyo sababu mbinu ya kuchagua viwango hutumiwa, na ufanisi wa metric pia hufanyika.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sw.atomiyme.com. Theme powered by WordPress.