Пропускна здатність ядра при оцінці щільності ядра


10

Я роблю деяку оцінку щільності ядра з встановленою зваженою точкою (тобто, кожен зразок має вагу, яка не є необхідною), у N розмірах. Крім того, ці зразки знаходяться просто в метричному просторі (тобто ми можемо визначити відстань між ними), але нічого іншого. Наприклад, ми не можемо визначити середнє значення зразків балів, ні стандартне відхилення, ні масштаб однієї змінної порівняно з іншою. На Ядро якраз впливає ця відстань і вага кожного зразка:

f(x)=1.weightsiweightihKernel(distance(x,xi)h)

У цьому контексті я намагаюся знайти надійну оцінку пропускної здатності ядра , можливо, просторово змінюється, і бажано, яка дає точну реконструкцію набору даних . При необхідності можна вважати, що функція є відносно гладкою.hxi

Я намагався використовувати відстань до першого або другого найближчого сусіда, але це дає досить погані результати. Я намагався з оптимізацією відпустки, але у мене виникають труднощі з пошуком хорошої міри для оптимізації в цьому контексті в Nd, тому він знаходить дуже погані оцінки, особливо для самих навчальних зразків. Я не можу використовувати жадібну оцінку на основі звичайного припущення, оскільки не можу обчислити стандартне відхилення. Я знайшов посилання, використовуючи коваріаційні матриці для отримання анізотропних ядер, але знову ж таки, це не було б у цьому просторі ...

Хтось має ідею чи довідку?


Якщо ви можете виміряти відстань, то ви можете виміряти середнє значення. Це так? Я можу сказати: "Я використовую косинус для відстані для слів", тому "середнє слово насправді не має великого значення", але я не розумію, чому його ще не можна було обчислити. Можна сказати, що ви перебуваєте в порядковому просторі, тому середня величина не оцінюється постійно. Чому середина не визначена?
EngrStudent

Відповіді:


3

Одне місце для початку - це оцінка найближчого сусіда Сільвермана , але якось додати ваги. (Я не впевнений, для чого саме важать ваги.) Метод найближчого сусіда, очевидно, може бути сформульований з точки зору відстані. Я вважаю, що ваш перший і другий метод найближчого сусіда - це версії методу найближчого сусіда, але без функції ядра і з малим значенням .k


2

На обміні файлів Matlab є функція kde, яка забезпечує оптимальну пропускну здатність з припущенням, що використовується ядро ​​Гаусса: Оцінювач щільності ядра .

Навіть якщо ви не використовуєте Matlab, ви можете проаналізувати цей код для його методу обчислення оптимальної пропускної здатності. Це високо оцінена функція обміну файлами, і я її багато разів використовував.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.