Основна ідея k-Найближчого сусіда враховує найближчих пунктів і вирішує класифікацію даних більшістю голосів. Якщо так, то у даних з більшими розмірами не повинно виникнути проблем, оскільки такі методи, як хеш-чутливість, здатні ефективно знайти найближчих сусідів.
Крім того, вибір функцій у байєсівських мережах може зменшити розмірність даних та полегшити навчання.
Однак у цьому оглядовому документі Джона Лафферті у статистичному навчанні вказується, що непараметричне навчання у просторових просторах з високими розмірами все ще залишається проблемою та невирішеною.
Що йде не так?