Які обмеження KNN?
Алгоритм KNN має обмеження щодо масштабованість і процес навчання. Це може бути обчислювально дорогим для великих наборів даних, і вимоги до пам’яті можуть бути значними. Крім того, KNN явно не вивчає модель і припускає однакову важливість усіх функцій.7 серпня 2023 р.
Недоліком алгоритму KNN є те, що він не створює узагальненої роздільної моделі. У процесі навчання не існує підсумкових рівнянь або дерев, які можна було б швидко застосувати до нових записів. Натомість KNN просто використовує навчальні дані для виконання прогнозу.
З наведеної вище процедури класифікації KNN вказує на те, що в основному є чотири складні питання, K обчислення, вибір найближчого сусіда, пошук найближчого сусіда та правило класифікації. Може бути дуже важко встановити відповідний K для даного навчального набору даних.
Найбільш серйозним недоліком методів найближчого сусіда є те, що вони дуже чутливі до наявності нерелевантних параметрів. Додавання єдиного параметра, який має випадкове значення для всіх об’єктів (таким чином, щоб він не розділяв класи), може призвести до невдачі цих методів.
Отже, впровадження KNN на великому наборі даних не є гарним рішенням, тому що він має не лише зберігати велику кількість даних, але й постійно обчислювати та сортувати всі значення.
Алгоритм KNN погано працює з великими наборами даних. Вартість розрахунку відстані між новою точкою та кожною існуючою точкою величезна, що погіршує продуктивність. Масштабування функцій (стандартизація та нормалізація) необхідне перед застосуванням алгоритму KNN до будь-якого набору даних.