"Оцінка щільності ядра" - це згортання того, що?


25

Я намагаюся краще зрозуміти оцінку щільності ядра.

Використання визначення з Вікіпедії: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition

fh^(x)=1ni=1nKh(xxi)=1nhi=1nK(xxih)

Візьмемо як прямокутну функцію, яка дає якщо знаходиться в межах від до і іншому випадку, а (розмір вікна) дорівнює 1.1 x - 0,5 0,5 0 годK()1x0.50.50h

Я розумію, що щільність - це згортання двох функцій, але я не впевнений, що знаю, як визначити ці дві функції. Один з них повинен (мабуть) бути функцією даних, яка для кожної точки R повідомляє нам, скільки точок даних у нас є в цьому місці (в основному ). А інша функція, ймовірно, повинна бути деякою модифікацією функції ядра в поєднанні з розміром вікна. Але я не впевнений, як це визначити.0

Будь-які пропозиції?

Беллоу - приклад коду R, який (я підозрюю) повторює налаштування, які я визначив вище (із сумішшю двох гауссів і ), на якому я сподіваюся побачити "доказ" того, що функції, які потрібно згортати, такі, як ми підозрюємо .n=100

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

введіть тут опис зображення


3
Ваш килим внизу дає деяку грубу інтуїцію. Уявіть, що кожне значення від до - це шип з пов'язаною вагою . Тепер намазайте кожен шип, використовуючи форму та ширину вашого ядра, щоб шип перетворився на той самий форму та ширину, з такою висотою, що площа нижче . Додайте результати, і у вас є оцінка щільності ядра. i = 1 n 1 / n 1 / nxii=1n1/n1/n
Нік Кокс

Привіт Нік, дякую за коментар. Це далеко не в інтуїції, яку я вже отримав, це перетворення її формально у форму згортки, яку мені було цікаво бачити :) (Я зараз хочу пройти відповідь Вюбера!)
Тал Галілі

Відповіді:


27

Відповідна будь-якій партії даних - це її "емпірична функція щільності"X=(x1,x2,,xn)

fX(x)=1ni=1nδ(xxi).

Тут - це "узагальнена функція". Незважаючи на це ім'я, це зовсім не функція: це новий математичний об'єкт, який можна використовувати лише в межах інтегралів. Її визначальною властивістю є те, що для будь-якої функції компактної підтримки, яка є безперервною в околиці ,δg0

Rδ(x)g(x)dx=g(0).

(Назви для включають "атомну" або "точну" міру та " функцію дельти Дірака ". У наступному розрахунку ця концепція розширюється і включає функції які є безперервними лише з одного боку.)δgg

Виправданням цієї характеристики є спостереження, якеfX

xfX(y)dy=x1ni=1nδ(yxi)dy=1ni=1nxδ(yxi)dy=1ni=1nRI(yx)δ(yxi)dy=1ni=1nI(xix)=FX(x)

де - це звичайний емпіричний CDF, а - звичайна характеристична функція (дорівнює коли її аргумент є істинним, а іншому випадку). (Я пропускаю елементарний обмежуючий аргумент, необхідний для переходу від функцій компактної підтримки до функцій, визначених через ; тому що потрібно визначити лише значення в межах діапазону , який є компактним, це не проблема.)FXI10RЯХ

Згортка з будь-якої іншої функції дається, за визначенням, оскількиfХ(х)к

(fХк)(х)=RfХ(х-у)к(у)гу=R1нi=1нδ(х-у-хi)к(у)гу=1нi=1нRδ(х-у-хi)к(у)гу=1нi=1нк(хi-х).

к(х)=Кгод(-х)Кгод(х)


1
Ситуація у двох вимірах пояснюється (більш розмовно) і проілюстрована на сайті ГІС за адресою gis.stackexchange.com/questions/14374/… .
whuber

1
Шановний Вюбер, я щойно пройшов і з захопленням прочитав твою відповідь! Дуже дякую вам за пояснення та деталі, ваші відповіді (ця та взагалі ваші інші) справді надихають. Твій, Таль
Тал Галілі

1
δг,хiг(хi).

1
@whuber Дякую Речення Узагальнена функція δ зовсім не є функцією: це новий математичний об'єкт, який можна використовувати лише в межах інтегралів. зробило це зрозумілішим. як завжди. ;)
Ян Вайнер

1
@Jan Дякую за допомогу: я включив цю ідею в цю відповідь.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.