Те саме чи інше? Байєсівський шлях


10

Скажіть, у мене є така модель:

Poisson(λ){λ1if t<τλ2if tτ

І я можу зробити для та показані нижче, зі своїх даних. Чи є байесовский спосіб сказати (або кількісної оцінки) , якщо і є однаковими або різними ?λ 2 λ 1 λ 2λ1λ2λ1λ2

Можливо, вимірювання ймовірності того, що відрізняється відλ 2λ1λ2 ? Або, можливо, використовуючи розбіжності KL?

Наприклад, як я можу виміряти або, принаймні, ?p ( λ 2 > λ 1 )p(λ2λ1)p(λ2>λ1)

Взагалі, коли у вас є афіші, показані нижче (припускайте ненульові значення PDF скрізь для обох), який хороший спосіб відповісти на це питання?

введіть тут опис зображення

Оновлення

Схоже, на це питання можна відповісти двома способами:

  1. Якщо у нас є зразки плакатів, ми можемо подивитися на частку зразків, де (або еквівалентно ). @ Cam.Davidson.Pilon включив відповідь, яка вирішить цю проблему за допомогою таких зразків.λ 2 > λ 1λ1λ2λ2>λ1

  2. Інтегруючи якусь різницю плакатів. І це важлива частина мого питання. Як виглядатиме ця інтеграція? Імовірно, підхід вибірки наближав би цей інтеграл, але я хотів би знати формулювання цього інтеграла.

Примітка. Наведені сюжети виходять з цього матеріалу .


Ви можете просто обчислити дисперсію обох розподілів і додати їх. Ось це дисперсія різниці в засобах. Потім обчисліть різницю в засобах і подивіться, скільки це стандартних відхилень. Ви можете наблизити обидва розподіли до звичайних, щоб почати і використовувати звичайні довірчі інтервали для нормального розподілу. Вони явно різні засоби.
Dave31415


3
Всі необхідні розрахунки наведені в моїй роботі, але я не вивчав випадок ( - відношення двох ставок Пуассона)H0:{ϕ=1}ϕ
Стефан Лоран,

Спасибі @ StéphaneLaurent Ваш документ є чудовим покажчиком, але він, здається, специфічний для процесів Пуассона. Яке порівняння на високому рівні може зробити щоб оцінити, чи однаковий чи відрізняється від ? Чи повинен аналіз бути специфічним для розподілу? λ2λ1
Амеліо Васкес-Рейна

2
Вибачте @ user023472 У мене немає енергії в ці дні. Дивіться цитовані в моєму документі статті Бернардо. "Внутрішній" означає, що метод походить із моделі та лише з неї.
Стефан Лоран

Відповіді:


7

Я думаю, що краще питання, чи вони суттєво відрізняються?

Щоб відповісти на це, нам потрібно обчислити . Назвіть цю кількість . Якщо , то однаковий шанс у одного більший, ніж у іншого. З іншого боку, якщо дійсно близький до 1, то ми можемо бути впевнені, що так більше (читати: різне), ніж .P(λ2>λ1)pp0.50pλ2λ1

Як ми обчислимо ? Це банально в байєсівській системі MCMC. У нас є зразки з задньої частини, тому давайте просто обчислити долю, що зразки з більше, ніж :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Прошу вибачення за те, що не включив це до книги, я напевно додаю це, оскільки вважаю, що це одна з найкорисніших ідей у ​​байєсівському висновку


5
Ймовірність 1,0 вони різні, оскільки вони обидві безперервні випадкові величини. Поміркуйте: як ви що ? Ви справді думаєте, що вони насправді рівні? (Ігноруйте тестування гіпотез: ми живемо в реальному світі, де змінні ніколи насправді не є рівними). Дивіться цей пост мого героя, Гельмана. Обчислювально, ви можете перевірити це шляхом обчислення . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon

1
Ви могли б визначити, як має значення "не рівний". Наприклад, якщо у вашому прикладі будь-яка різниця менша від однієї практично не має сенсу, ви можете подивитися на і це дасть вам значущу статистику дляP(|λ1λ2|>1)P(λ1λ2)
Сем Діксон

3
Щоб додати до свого попереднього коментаря, якщо змінні та були дискретні, то є ймовірність, що = . λ1λ2λ2λ1
Cam.Davidson.Pilon

1
о боже, я б ненавиджу опинитися в такій ситуації! Він передбачає неприємні інтеграли. Для більшості моделей насправді не можна отримати афіші. Навіть якби ви могли, можливо, все-таки краще використовувати комп’ютер, просто заради отримання зразків. Підводячи підсумок, вибірки> формули для таких обчислень.
Cam.Davidson.Pilon

2
Ви не вимірюєте "достатньо великих розмірів". Розгляньте розподіл з піком у нуль, а інший з рівними масами на піках -10, 10. Ваша статистика - очікуване значення показника того, що один зразок більший за інший - дає 0,5, але розподіли явно абсолютно різні.
Ніл Г

5

Як зазначалося, це питання є тривіальним. Якщо і є безперервними випадковими змінними, .λ1λ2Pr(λ1=λ2)=0

Я підозрюю, що вас цікавить ймовірність того, що та знаходяться в межах одного один одного. У цьому випадку область різниці двох задніх густин на проміжку - це ваша відповідь. Більш великі значення перекриття вказують на те, що два плакати більше схожі.λ 2 ϵ [ - ϵ / 2 , ϵ / 2 ]λ1λ2ϵ[ϵ/2,ϵ/2]

Якщо ви хочете працювати з імітованими результатами (і для більшості проблем у нас немає розкоші вибору), просто візьміть пропорцію результатів, де як приблизну.λ2>λ1


Дякую. Як ваша відповідь стосується деяких ідей, обговорених у коментарях до ОП?
Амеліо Васкес-Рейна

Вибачте, але я не знайомий ні з одним із цих методів, тому не можу змістовно коментувати. @ Stéphane_Laurent, однак, досить розумний, тому рекомендую хоча б переглянути посилання.
Sycorax каже, що повернеться до Моніки

1
@ user023472 Вибачте, у мене сьогодні немає сил на те, щоб відповісти про невідповідний підхід. Він заснований на розбіжності Куллбека-Лейблера.
Стефан Лоран

@ user777 Для цього потрібно виправити . Що робити, якщо я просто хочу побачити ймовірність або ? p ( λ 2 > λ 1 ) p ( λ 2λ 1 )ϵp(λ2>λ1)p(λ2λ1)
Амеліо Васкес-Рейна

Дякуємо @ user777 Мене цікавить випадок, коли ми не маємо доступу до зразків. У вас був інтеграл у вашій публікації раніше, але ви, здається, його видалили. Як би виглядав цей інтеграл?
Амеліо Васкес-Рейна
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.