В елементах статистичного навчання вводиться проблема висвітлення питань з k-nn у просторах високих розмірів. Існує точок даних, які рівномірно розподілені в -вимірній кулі одиниці.р
Середня відстань від початку до найближчої точки даних задається виразом:
Коли , формула розпадається на половину радіуса кулі, і я бачу, як найближча точка наближається до кордону як , завдяки чому інтуїція за кнн розпадається у великих розмірах. Але я не можу зрозуміти, чому формула залежить від Н. Чи міг би хтось уточнити?p → ∞
Також у цій книзі далі розглядається це питання, заявляючи: "... передбачити набагато складніше біля країв навчальної вибірки. Треба екстраполювати з сусідніх точок вибірки, а не інтерполювати між ними". Це здається глибоким твердженням, але я не можу зрозуміти, що це означає. Хтось може перемовити?