Якщо ядро ​​Epanechnikov теоретично є оптимальним при оцінці щільності ядра, чому його не застосовують частіше?


18

Я читав (наприклад, тут ), що ядро ​​Epanechnikov є оптимальним, принаймні в теоретичному сенсі, при оцінці щільності ядра. Якщо це правда, то чому Гаусс відображається так часто, як ядро ​​за замовчуванням або в багатьох випадках єдине ядро ​​в бібліотеках оцінки щільності?


2
Тут пов’язано два питання: чому не частіше застосовуватись? чому часто Гаусс ядро ​​за замовчуванням / єдине? Це може здатися тривіальним, але ім'я Епанечников може здатися важким для написання та вимови правильно, щоб люди, які не володіють цією мовою. (Я навіть не впевнений, що Е. був російським; мені не вдалося знайти жодних біографічних деталей.) Також, якщо я покажу (наприклад) велику вагу, прокоментуйте його форму дзвона, обмежену ширину та поведінку по краях, які здаються легше продати. Епанечников є типовим для Stata kdensity.
Нік Кокс

3
Я додам, що ця теоретична оптимальність має мало значення в практиці, якщо така є.
Сіань

2
Це знайоме ім’я. Якщо є сенс використовувати ядро, яке не має кінцевої підтримки, вам слід віддати перевагу. Поки мій досвід не має сенсу, тому вибір виглядає соціальним, а не технічним.
Нік Кокс

2
@NickCox, так, E був російським чуваком, це не абревіатура :) Він був загадковою людиною, це все, що ви могли коли-небудь дізнатися про нього. Я також пам’ятаю дуже корисну книгу, яку хтось з його іменем писав на програмованих калькуляторах, так, на той час це було великою справою
Аксакал

1
@amoeba Працював в Інституті радіотехніки та електроніків Російської Академії Наук ім. Котельникова, сподіваюся, він зробив класифіковані дослідження, повне ім'я Єпанечников Віктор Александрович
Аксакал

Відповіді:


7

Причина того, що ядро ​​Epanechnikov не використовується повсюдно для його теоретичної оптимальності, може бути саме в цьому що ядро ​​Epanechnikov насправді теоретично не є оптимальним . Цибаков прямо критикує аргумент того, що ядро ​​Епанечникова є "теоретично оптимальним" у сторінках 16-19 Введення в непараметричну оцінку (розділ 1.2.4).

Намагаючись узагальнити, згідно з деякими припущеннями про ядро K та фіксовану щільність p слід зазначити, що середня інтегральна квадратна помилка має вигляд

(1)1nhK2(u)du+h44SK2(p(x))2dx.

Основна критика Цибакова, здається, мінімізується над негативними ядрами, оскільки часто можна отримати більш ефективні оцінки, які є навіть негативними, не обмежуючись негативними ядрами.

Перший крок аргументу для ядра Epanechnikov починається з мінімізації (1) над h та всіх негативних ядер (а не всіх ядер ширшого класу), щоб отримати "оптимальну" пропускну здатність для K

hMISE(K)=(K2nSK2(p)2)1/5

і "оптимальне" ядро ​​(Епанечников)

K(u)=34(1u2)+

середня інтегральна квадратна помилка якої:

hMISE(K)=(15n(p)2)1/5.

Це, однак, не є можливим вибором, оскільки вони залежать від знань (через p ) невідомої щільності p - тому вони є "оракул" величинами.

З твердження Цибакова випливає, що асимптотичним MISE для оракула Епанечникова є:

(2)limnn4/5Ep(pnE(x)p(x))2dx=34/551/54((p(x))2dx)1/5.

Цибаков каже, що (2) часто стверджується, що є найкращим досяжним MISE, але потім показує, що можна використовувати ядра порядку 2 (для яких SK=0 ) для побудови оцінювачів ядра для кожного ε>0 , так що

lim supnn4/5Ep(p^n(x)p(x))2dxε.

Навіть якщо р п не обов'язково невід'ємне, все ще має один і той же результат для позитивної частини оцінки, р + п : = тах ( 0 , р п ) (який гарантовано бути невід'ємним , навіть якщо К немає):p^npn+:=max(0,p^n)K

lim supnn4/5Ep(pn+(x)p(x))2dxε.

Тому для ε досить малих існують справжні оцінки, які мають менший асимптотичний MISE , ніж оракул Епанечников , навіть використовуючи ті самі припущення щодо невідомої щільності p .

Зокрема, у результаті виходить, що мінімальна кількість асимптотичного MISE для фіксованого p над усіма оцінками ядра (або додатними частинами оцінювачів ядра) дорівнює 0 . Тож оракул Epanechnikov навіть не є оптимальним навіть у порівнянні з справжніми оцінками.

Причина, чому люди висунули аргумент для оракула Епанечникова в першу чергу, полягає в тому, що часто можна стверджувати, що саме ядро ​​повинно бути негативним, оскільки сама щільність не негативна. Але, як зазначає Цибаков, не потрібно вважати, що ядро ​​є негативним, щоб отримати оцінки негативної щільності, а дозволяючи іншим ядрам, можна оцінити негативні щільності, які (1) не є оракулами. і (2) виконувати довільно краще, ніж оракул Епанечников для фіксованого p . Цибаков використовує цю невідповідність, стверджуючи, що не має сенсу сперечатися за оптимальність з точки зору фіксованого p , а лише для властивостей оптимальності, які є рівномірними щодо класу густини. Він також вказує, що аргумент все ще працює, коли використовується MSE замість MISE.

EDIT: Див. Також Дослідження 1.1. на с.25, де ядро ​​Epanechnikov показано неприпустимим на основі іншого критерію. Цибакову справді не подобається ядро ​​Епанечникова.


4
+1 для цікавого прочитання, але це не дає відповіді, чому ядро ​​Гаусса використовується частіше, ніж ядро ​​Епанечникова: вони обоє невід’ємні.
амеба каже, що повернеться до Моніки

@amoeba Це правда. Принаймні це відповідає на запитання в заголовку, яке стосується лише ядра Епанечникова. (Тобто він звертається до передумови для запитання і показує, що це помилково.)
Chill2Macht

3
(+1) One thing to beware with Tsybakov's scheme of taking the positive part of a possibly-negative kernel estimate – which is at least my memory of his suggestion – is that although the resulting density estimator might give better MSE convergence to the true density, the density estimate will in general not be a valid density (since you're cutting off mass, and it no longer integrates to 1). If you actually only care about MSE, it doesn't matter, but sometimes this will be a significant problem.
Dougal

2

The Gaussian kernel is used for example in density estimation through derivatives:

difdxi(x)1bandwidthj=1Ndikdxi(Xj,x)

This is because the Epanechnikov kernel has 3 derivatives before it's identically zero, unlike the Gaussian which has infinitely many (nonzero) derivatives. See section 2.10 in your link for more examples.


2
The first derivative of the Epanechnikov (note the second n, by the way) kernel is not continuous where the function crosses the kernel's own bounds; that might be more of an issue.
Glen_b -Reinstate Monica

@Glen_b: You're probably right, although having 0 derivatives after some i would be silly too.
Alex R.

1
@AlexR. While what you say is true, I don't understand how it explains why the Gaussian is so common in ordinary density estimation (as opposed to estimating the derivative of the density). And even when estimating derivatives, section 2.10 suggests that the Gaussian is never the preferred kernel.
John Rauser

@JohnRauser: Keep in mind that you need to use higher order Epanechnikov kernels for optimality. Usually people use a Gaussian because it's just easier to work with and has nicer properties.
Alex R.

1
@AlexR I'd quibble on "[u]sually people use a Gaussian"; do you have any systematic data on frequency of use or this is just an impression based on work you see? I see biweights often, but I wouldn't claim more than that.
Nick Cox
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.