KNN әдісі жұмыс істеген кезде біздің кеңістігімізде не болады. Біздің кеңістік іс жүзінде аймақтарға бөлінеді екен
Автор: baden.zhanel19 • Ноябрь 10, 2022 • Реферат • 1,030 Слов (5 Страниц) • 268 Просмотры
2-слайд
Біз қазір ең қарапайым жіктеу алгоритмдерінің бірі - K-жақын көршілердің әдісі (KNN) туралы сөз қозғаймыз.
Бұл алгоритмнің негізгі мәні неде?
Бұл алгоритм метрикалық, яғни ол сіздің объектілеріңіз арасындағы метриканы есептеуде қолданады.
Ендігі кезекте, классификацияда(жіктеу) тапсырманы шешу үшін метриканы қалай қолдануға болатынын қарастырайық.(клик)
3-слайд
Біріншіден метрикалық әдістерде объектілер кеңістіктегі нүктелер түрінде ұсынады.
Суретте сіз жазықтықтағы нүктелер түріндегі объектілердің көрінісін көресіз, бұл әр объект екі мақсатты емес(нецелевыми) белгілермен сипатталған кезде пайда болады, сіз бір белгіні бір ось бойымен, ал екінші белгіні басқа ось бойымен бағыттайсыз. Сіз объектіні қандай да бір кеңістіктегі нүктелер түрінде елестете алдыңыз делік.
Әрі қарай не болады?
4-слайд
Әрі қарай, олардың арасындағы метриканы есептеу қажет. (Мен бұл туралы бірнеше рет айттым ) Метриканы есептемес бұрын пронормализациялау керек, яғни оларды бір масштабқа келтіру керек.
Жіктеу міндеті бойынша барлық белгілерді емес, барлық мақсатты емес белгілерді қалыпқа келтіру керек. Болжалды белгіні жалғыз қалдырыңыз, оны қалыпқа келтірудің қажеті жоқ.
Енді бұдан әрі не істеу керек?
К параметрінің мәнін таңдау керек.
К - бұл сіздің алгоритміңіздің кіріс параметрі, одан кейінгі барлық жұмыс, К-ға байланысты.
Әрі қарай не болады?
5-Келесі слайд
Сізде жаттығу үлгісі бар, енді осы жаттығу үлгісіне жаңа А объектісі түседі. Бұл жаңа А объектісі үшін, К жаттығу үлгісіндегі ең жақын көршісі болып табылады. Яғни, сіз белгілі бір метриканы қолдана отырып, A объектісінен қашықтықты есептейсіз және жаттығу үлгсіндегі барлық басқа объектілерге дейін, K ең жақын объектілерді табасыз.
Ал енді нақты жіктеу ережелері: А объектсі оның K жақын көршілерінің арасында ең көп таралған класқа жатады. Егер оның көршілерінің арасында нөл класындағы объектілер басым болса, онда А объектсі нөл класына жатқызылады. Егер көршілер арасында бірінші кластан объекттер басым болса, онда A объектісіде бірінші кластың объекті ретінде жіктеледі.
6-Келесі слайд
Бұл суретте сіз KNN алгоритмінің нәтижесін көре аласыз (К - жақын көршілер). Шындығында, оның жұмысы кіріс параметрінің K мәніне байланысты. Мұнда не болып жатқанын көрейік. Бізде екі типтегі объектілер бар, мұнда объектілер класының белгілері (0,1) түрінде емес, түс пен пішін түрінде көрсетілген. Сізде көк шаршылардан тұратын класс және қызыл үшбұрыштардан тұратын класс бар. Енді бұл үлгіге жаңа объект енеді, ол мұнда жасыл шеңберді білдіреді және сіз оның квадраттардың немесе үшбұрыштардың қай класына жататынын түсінуіңіз керек.
7-Келесі слайд
K = 3 үшін KNN әдісін іске қосайық.
Ол үшін біздің жасыл шеңбердің ең жақын үш көршісін табу керек. Суретте сіз оның ең жақын үш көршісінің арасында үшбұрыштар басым екенін көресіз, сондықтан к=3 кезінде жасыл шеңбер үшбұрыш ретінде жіктеледі. Алайда, егер сіз K=5 үшін KNN алгоритмін іске қосып, оның 5 жақын көршісін тапсаңыз, онда бес жақын көршінің арасында шаршылар басым екенін және жасыл шеңбер квадрат ретінде жіктелетінін көресіз. Сонымен қатар, егер сіз KNN-ді жұп К үшін іске қоссаңыз, онда жіктеу нәтижесі анықталмаған жағдай болуы мүмкін екенін есте ұстаған жөн. Бұл оның ең жақын K көршілерінің арасында бірінші және екінші кластың өкілдері тең болып қалған кезде пайда болады. Бұл жағдайда жіктеу нәтижесі анықталмауы мүмкін.
8-Келесі слайд
KNN әдісі жұмыс істеген кезде біздің кеңістігімізде не болады. Біздің кеңістік іс жүзінде аймақтарға бөлінеді екен.
Сонымен, сол жақтағы суретте не байқаймыз:
Біз қызыл және көк класқа жататын жаттығу үлгісінде объектілердің орналасуын көреміз, сонымен қатар k саны, яғни KNN алгоритмінің кіріс параметрі бекітілген. Сіз К санын таңдағаннан кейін, бүкіл кеңістігіңіз аймақтарға бөлінеді( қызыл және көк аймақ). Бұл аймақтар нені білдіреді? Аймақ мынаны білдіреді: егер жаңа объект қызыл аймаққа түссе, онда ол қызыл деп жіктеледі. Егер ол көк аймаққа түссе, онда ол көк нысан ретінде жіктеледі. Егер сіз K санын өзгертсеңіз, онда аймақтардың орналасуы да өзгеруі мүмкін. Әрине, сіздің үлгіңіздің шығарындылары деп аталатындығын есте ұстаған жөн. Яғни, қызыл аймаққа түскендердің көк жаттығу үлгілері мен көк аймаққа түскендердің қызыл жаттығу үлгілері болуы мүмкін.
...