Те саме чи інше? Байєсівський шлях

Скажіть, у мене є така модель:

Poisson (λ) \sim {\begin{cases} λ_{1} & if t < τ \\ λ_{2} & if t \geq τ \end{cases}

$\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases}$

І я можу зробити для та показані нижче, зі своїх даних. Чи є байесовский спосіб сказати (або кількісної оцінки) , якщо і є однаковими або різними ? $\lambda_1$ $\lambda_2$ $\lambda_1$ $\lambda_2$

Можливо, вимірювання ймовірності того, що відрізняється від $\lambda_1$ $\lambda_2$ ? Або, можливо, використовуючи розбіжності KL?

Наприклад, як я можу виміряти або, принаймні, ? $p(\lambda_2 \neq \lambda_1)$ $p(\lambda_2 \gt \lambda_1)$

Взагалі, коли у вас є афіші, показані нижче (припускайте ненульові значення PDF скрізь для обох), який хороший спосіб відповісти на це питання?

введіть тут опис зображення

Оновлення

Схоже, на це питання можна відповісти двома способами:

Якщо у нас є зразки плакатів, ми можемо подивитися на частку зразків, де (або еквівалентно ). @ Cam.Davidson.Pilon включив відповідь, яка вирішить цю проблему за допомогою таких зразків. $\lambda_1 \neq \lambda_2$ $\lambda_2 > \lambda_1$
Інтегруючи якусь різницю плакатів. І це важлива частина мого питання. Як виглядатиме ця інтеграція? Імовірно, підхід вибірки наближав би цей інтеграл, але я хотів би знати формулювання цього інтеграла.

Примітка. Наведені сюжети виходять з цього матеріалу .

distributions bayesian poisson-distribution

— Амеліо Васкес-Рейна
джерело

Ви можете просто обчислити дисперсію обох розподілів і додати їх. Ось це дисперсія різниці в засобах. Потім обчисліть різницю в засобах і подивіться, скільки це стандартних відхилень. Ви можете наблизити обидва розподіли до звичайних, щоб почати і використовувати звичайні довірчі інтервали для нормального розподілу. Вони явно різні засоби.

— Dave31415

Внутрішнє тестування гіпотез - відповідь

— Стефан Лоран

Всі необхідні розрахунки наведені в моїй роботі, але я не вивчав випадок ( - відношення двох ставок Пуассона)

H_{0} : {ϕ = 1}

$H_0:\{\phi=1\}$

ϕ

$\phi$

— Стефан Лоран,

Спасибі @ StéphaneLaurent Ваш документ є чудовим покажчиком, але він, здається, специфічний для процесів Пуассона. Яке порівняння на високому рівні може зробити щоб оцінити, чи однаковий чи відрізняється від ? Чи повинен аналіз бути специфічним для розподілу?

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Амеліо Васкес-Рейна

Вибачте @ user023472 У мене немає енергії в ці дні. Дивіться цитовані в моєму документі статті Бернардо. "Внутрішній" означає, що метод походить із моделі та лише з неї.

— Стефан Лоран

Відповіді:

Я думаю, що краще питання, чи вони суттєво відрізняються?

Щоб відповісти на це, нам потрібно обчислити . Назвіть цю кількість . Якщо , то однаковий шанс у одного більший, ніж у іншого. З іншого боку, якщо дійсно близький до 1, то ми можемо бути впевнені, що так більше (читати: різне), ніж . $P(\lambda_2 > \lambda_1)$ $p$ $p \approx 0.50$ $p$ $\lambda_2$ $\lambda_1$

Як ми обчислимо ? Це банально в байєсівській системі MCMC. У нас є зразки з задньої частини, тому давайте просто обчислити долю, що зразки з більше, ніж : $p$ $\lambda_2$ $\lambda_1$

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Прошу вибачення за те, що не включив це до книги, я напевно додаю це, оскільки вважаю, що це одна з найкорисніших ідей у байєсівському висновку

— Cam.Davidson.Pilon
джерело

Ймовірність 1,0 вони різні, оскільки вони обидві безперервні випадкові величини. Поміркуйте: як ви що ? Ви справді думаєте, що вони насправді рівні? (Ігноруйте тестування гіпотез: ми живемо в реальному світі, де змінні ніколи насправді не є рівними). Дивіться цей пост мого героя, Гельмана. Обчислювально, ви можете перевірити це шляхом обчислення .

λ_{1} = λ_{2}

$\lambda_1 = \lambda_2$ np.mean( lambda_2_samples != lambda_1_samples)

— Cam.Davidson.Pilon

Ви могли б визначити, як має значення "не рівний". Наприклад, якщо у вашому прикладі будь-яка різниця менша від однієї практично не має сенсу, ви можете подивитися на і це дасть вам значущу статистику для

P (| λ_{1} - λ_{2} | > 1)

$P(|\lambda_1-\lambda_2| > 1)$

P (λ_{1} \neq λ_{2})

$P(\lambda_1 \ne \lambda_2)$

— Сем Діксон

Щоб додати до свого попереднього коментаря, якщо змінні та були дискретні, то є ймовірність, що = .

λ_{1}

$\lambda_1$

λ_{2}

$\lambda_2$

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Cam.Davidson.Pilon

о боже, я б ненавиджу опинитися в такій ситуації! Він передбачає неприємні інтеграли. Для більшості моделей насправді не можна отримати афіші. Навіть якби ви могли, можливо, все-таки краще використовувати комп’ютер, просто заради отримання зразків. Підводячи підсумок, вибірки> формули для таких обчислень.

— Cam.Davidson.Pilon

Ви не вимірюєте "достатньо великих розмірів". Розгляньте розподіл з піком у нуль, а інший з рівними масами на піках -10, 10. Ваша статистика - очікуване значення показника того, що один зразок більший за інший - дає 0,5, але розподіли явно абсолютно різні.

— Ніл Г

Як зазначалося, це питання є тривіальним. Якщо і є безперервними випадковими змінними, . $\lambda_1$ $\lambda_2$ $\Pr(\lambda_1=\lambda_2)=0$

Я підозрюю, що вас цікавить ймовірність того, що та знаходяться в межах одного один одного. У цьому випадку область різниці двох задніх густин на проміжку - це ваша відповідь. Більш великі значення перекриття вказують на те, що два плакати більше схожі. $\lambda_1$ $\lambda_2$ $\epsilon$ $[-\epsilon/2, \epsilon/2]$

Якщо ви хочете працювати з імітованими результатами (і для більшості проблем у нас немає розкоші вибору), просто візьміть пропорцію результатів, де як приблизну. $\lambda_2>\lambda_1$

— Sycorax каже, що відновіть Моніку
джерело

Дякую. Як ваша відповідь стосується деяких ідей, обговорених у коментарях до ОП?

— Амеліо Васкес-Рейна

Вибачте, але я не знайомий ні з одним із цих методів, тому не можу змістовно коментувати. @ Stéphane_Laurent, однак, досить розумний, тому рекомендую хоча б переглянути посилання.

— Sycorax каже, що повернеться до Моніки

@ user023472 Вибачте, у мене сьогодні немає сил на те, щоб відповісти про невідповідний підхід. Він заснований на розбіжності Куллбека-Лейблера.

— Стефан Лоран

@ user777 Для цього потрібно виправити . Що робити, якщо я просто хочу побачити ймовірність або ?

ϵ

$\epsilon$

p (λ_{2} > λ_{1})

$p(\lambda_2 \gt \lambda_1)$

p (λ_{2} \neq λ_{1})

$p(\lambda_2 \neq \lambda_1)$

— Амеліо Васкес-Рейна

Дякуємо @ user777 Мене цікавить випадок, коли ми не маємо доступу до зразків. У вас був інтеграл у вашій публікації раніше, але ви, здається, його видалили. Як би виглядав цей інтеграл?

— Амеліо Васкес-Рейна