Я використовую Байєса для вирішення проблеми кластеризації. Після деяких обчислень я закінчую необхідність отримати співвідношення двох ймовірностей:
мати можливість отримати . Ці ймовірності отримуються шляхом інтеграції двох різних двовимірних KDE, як пояснено у цій відповіді :
P ( B ) = ∬ х Керівництво , Y : G ( X , Y ) < г ( R B , сек б ) г ( х , у )
де і - KDE, і інтеграція виконується для всіх точок нижче порогів та . Обидва KDE використовують ядро Гаусса . Репрезентативне зображення KDE, подібне до тих, з якими я працюю, можна побачити тут: Інтеграція оцінювача щільності ядра в 2D .
Я обчислюю KDE за допомогою python
функції stats.gaussian_kde , тому припускаю наступну загальну форму для неї:
де n
довжина мого масиву точок і h
чи використовується пропускна здатність.
Інтеграли, наведені вище, обчислюються за допомогою процесу Монте-Карло, який досить обчислювально дорогий. Я десь читав (забув, де, вибачте), що у подібних випадках можна замінити відношення ймовірностей відношенням PDF-файлів (KDE), оцінених у порогових точках, щоб отримати однаково достовірні результати. Мене це цікавить, оскільки обчислення коефіцієнта KDE на порядок швидше, ніж обчислення відношення інтегралів з MC.
Тож питання зводиться до обгрунтованості цього виразу:
За яких обставин, якщо такі є, чи можу я сказати, що це відношення вірно?
[фіксована помилка (EDIT)]
Додати :
Ось в основному те саме питання, але зроблене в більш математичній формі.
P(X)
якого я намагаюся уникати обчислення. Чи можете ви трохи розширити відповідність цього параметра?