Хтось вирішив вправу PTLOS 4.1?


19

Ця вправа дається в теорії ймовірностей: Логіка науки Едвін Джейнс, 2003. Існує часткове рішення тут . Я розробив більш загальне часткове рішення і цікавився, чи хтось ще його вирішив. Я трохи зачекаю, перш ніж опублікувати свою відповідь, щоб дати зрозуміти іншим.

Добре, тож припустимо, що у нас є n взаємно виключаючих і вичерпних гіпотез, позначених Hi(i=1,,n) . Далі припустимощо ми маємоm наборів даних, які охоплюютьDj(j=1,,m) . Коефіцієнт ймовірності для i-ї гіпотези задається:

LR(Hi)=P(D1D2,Dm|Hi)P(D1D2,Dm|H¯i)

Зауважимо, що це умовні ймовірності. Тепер припустимо , що , з огляду на Ith гіпотезу набори даних є незалежними, так що ми маємо:Him

P(D1D2,Dm|Hi)=j=1mP(Dj|Hi)(i=1,,n)Condition 1

Тепер було б досить зручно, якби в цьому випадку знаменник також врахував, щоб ми мали:

P(D1D2,Dm|H¯i)=j=1mP(Dj|H¯i)(i=1,,n)Condition 2

Тому що в цьому випадку коефіцієнт ймовірності розділиться на добуток менших факторів для кожного набору даних, так що ми маємо:

LR(Hi)=j=1mP(Dj|Hi)P(Dj|H¯i)

Отже, у цьому випадку кожен набір даних буде "голосувати за " або "голосувати проти " незалежно від будь-якого іншого набору даних.HiHi

Вправа полягає в тому, щоб довести, що якщо (більше ніж дві гіпотези), не існує такого нетривіального способу, в якому може відбутися цей факторинг. Тобто, якщо припустити, що умова 1 та умова 2 виконані, то максимум один із факторів: відрізняється від 1, тому лише 1 набір даних буде сприяти співвідношенню ймовірності.P ( D 1 | H i )n>2

P(D1|Hi)P(D1|H¯i)P(D2|Hi)P(D2|H¯i)P(Dm|Hi)P(Dm|H¯i)

Я особисто вважав цей результат досить захоплюючим, оскільки він в основному показує, що тестування множинних гіпотез - це не що інше, як ряд тестів бінарних гіпотез.


Мене трохи бентежить індекс на H¯i ; є ? Або це ? Здається, це повинно бути останнім, але тоді я не впевнений, чому саме цей індекс. Або, можливо, я цілком щось не вистачаю :)H¯i=argmaxhHiP(D1,Dm|h)H¯i=argmaxh{H1,,Hn}P(D1,Dm|h)
JMS

@JMS - означає логічне твердження " є помилковим", або що одна з інших гіпотез є істинною. Отже, у "булевій алгебрі" у нас є (тому що гіпотеза є ексклюзивними та вичерпними)H¯iHiH¯iH1+H2++Hi1+Hi+1++Hn
ймовірністьлогічний

Я відчуваю, що має бути інтуїтивніше рішення, ніж алгебра, наведена в частковому рішенні Сандерса. Якщо дані незалежні з урахуванням кожної з гіпотез, то це продовжує діяти, коли пріори гіпотези змінюються. І якимось чином, результат полягає в тому, що те саме потрібно подати для висновку ...
charles.y.zheng

@charles - Я точно знаю, як ви себе почуваєте. Я думав, що можу отримати це, використовуючи якісну непослідовність (Reductio ad absurdum), але не зміг цього зробити. Я не міг би продовжити математику Сандера. І саме Умова 2 є "хитрою" з точки зору того, що означає результат.
ймовірністьлогічний

@probabilityislogic "це в основному показує, що тестування множинних гіпотез - це не що інше, як серія тестів бінарних гіпотез". Будь ласка, можете розширити це речення? Читаючи сторінку 98 із книги Джейнеса, я розумію, що ви можете зменшити тестування до тестування на одній з інших гіпотез, а потім якось нормалізуватися, щоб отримати задню частину для , але я не розумію, чому це слід за цим за результатами вправи 4.1. H1,,HnH1H1
Мартін Дроздик

Відповіді:


7

Причина, яку ми прийняли екв. 4.28 (у книзі, ваша умова 1) було те, що ми припустили, що ймовірність даних, що даються певною гіпотезою а довідкова інформація X є незалежною, іншими словами, для будь-яких D i і D j з i j :HaXDiDjij

Отже, нерозширюваність поза бінарним випадком може бути обговорена так: Якщо вважати, що рівняння 1 є істинним, чи справедливо також рівняння 2?

P(Di|DjHaX)=P(Di|HaX)(1)

Спочатку давайте розглянемо ліву частину рівняння 2, використовуючи правило множення:

P(Di|DjHa¯X)=?P(Di|Ha¯X)(2)

Оскільки n гіпотез { H 1H n } приймаються взаємно виключаючими та вичерпними, ми можемо записати: ¯ H a = b a H b Тож eq.3 стає: P ( D i | D j ¯ H a X ) = b a P ( D i | D j H b X ) P

P(Di|DjHa¯X)=P(DiDjHa¯|X)P(DjHa¯|X)(3)
n{H1Hn}
Ha¯=baHb
У випадку, коли у нас є лише дві гіпотези, підсумки видаляються (оскільки існує лише однаba), рівних доданків у номінаторі та знаменникуP(DjHb|X), відмінимо і рівняння 2 доведено правильним, оскількиHb=¯ H a . Тому рівняння 4.29 можна отримати з рівняння 4.28 у книзі. Але коли у нас більше двох гіпотез, цього не відбувається, наприклад, якщо у нас є три гіпотези:
P(Di|DjHa¯X)=baP(Di|DjHbX)P(DjHb|X)baP(DjHb|X)=baP(Di|HbX)P(DjHb|X)baP(DjHb|X)
baP(DjHb|XHb=Ha¯ рівняння вище стає: P ( D i | D j ¯ H 1 X ) = P ( D i | H 2 X ) P ( D j H 2 | X ) + P ( D i | H 3 X ) P ( D j H 3 |{H1,H2,H3} Іншими словами: P(Di|Dj ¯ H 1 X)=P(Di|H2X)
P(Di|DjH1¯X)=P(Di|H2X)P(DjH2|X)+P(Di|H3X)P(DjH3|X)P(DjH2|X)+P(DjH3|X)
Єдиний спосіб, коли це рівняння може отримати рівняння 2, - це те, що обидва знаменники дорівнюють 1, тобто обидва дроби в знаменниках повинні дорівнювати нулю. Але це неможливо.
P(Di|DjH1¯X)=P(Di|H2X)1+P(DjH3|X)P(DjH2|X)+P(Di|H3X)1+P(DjH2|X)P(DjH3|X)

1
P(DiDjHb|X)=P(DiHB|X)P(Dj|HbX)

Дякую вам дуже ймовірно, що я зміг виправити рішення. Що ти думаєш зараз?
астробой

Я просто не розумію, як говорить Джейнес: "Ті, хто не може розрізнити логічну незалежність від причинної незалежності, вважають, що (4.29) завжди діє".
астробой

DiDj

DiDj

1

Гаразд, тож замість того, щоб піти і вивести рівняння Саундэра (5), я просто зазначу це тут. Умови 1 і 2 означають таку рівність:

j=1m(kihkdjk)=(kihk)m1(kihkj=1mdjk)
where
djk=P(Dj|Hk,I)hk=P(Hk|I)

Now we can specialise to the case m=2 (two data sets) by taking D1(1)D1 and relabeling D2(1)D2D3Dm. Note that these two data sets still satisfy conditions 1 and 2, so the result above applies to them as well. Now expanding in the case m=2 we get:

(kihkd1k)(lihld2l)=(kihk)(lihld1ld2l)

kilihkhld1kd2l=kilihkhld1ld2l

kilihkhld2l(d1kd1l)=0(i=1,,n)

The term (d1ad1b) occurs twice in the above double summation, once when k=a and l=b, and once again when k=b and l=a. This will occur as long as a,bi. The coefficient of each term is given by d2b and d2a. Now because there are i of these equations, we can actually remove i from these equations. To illustrate, take i=1, now this means we have all conditions except where a=1,b=2 and b=1,a=2. Now take i=3, and we now can have these two conditions (note this assumes at least three hypothesis). So the equation can be re-written as:

l>khkhl(d2ld2k)(d1kd1l)=0

Now each of the hi terms must be greater than zero, for otherwise we are dealing with n1<n hypothesis, and the answer can be reformulated in terms of n1. So these can be removed from the above set of conditions:

l>k(d2ld2k)(d1kd1l)=0

Thus, there are n(n1)2 conditions that must be satisfied, and each conditions implies one of two "sub-conditions": that djk=djl for either j=1 or j=2 (but not necessarily both). Now we have a set of all of the unique pairs (k,l) for djk=djl. If we were to take n1 of these pairs for one of the j, then we would have all the numbers 1,,n in the set, and dj1=dj2==dj,n1=dj,n. This is because the first pair has 2 elements, and each additional pair brings at least one additional element to the set*

But note that because there are n(n1)2 conditions, we must choose at least the smallest integer greater than or equal to 12×n(n1)2=n(n1)4 for one of the j=1 or j=2. If n>4 then the number of terms chosen is greater than n1. If n=4 or n=3 then we must choose exactly n1 terms. This implies that dj1=dj2==dj,n1=dj,n. Only with two hypothesis (n=2) is where this does not occur. But from the last equation in Saunder's article this equality condition implies:

P(Dj|H¯i)=kidjkhkkihk=djikihkkihk=dji=P(Dj|Hi)

Thus, in the likelihood ratio we have:

P(D1(1)|Hi)P(D1(1)|H¯i)=P(D1|Hi)P(D1|H¯i)=1 ORP(D2(1)|Hi)P(D2(1)|H¯i)=P(D2D3,Dm|Hi)P(D2D3,Dm|H¯i)=1

To complete the proof, note that if the second condition holds, the result is already proved, and only one ratio can be different from 1. If the first condition holds, then we can repeat the above analysis by relabeling D1(2)D2 and D2(2)D3,Dm. Then we would have D1,D2 not contributing, or D2 being the only contributor. We would then have a third relabeling when D1D2 not contributing holds, and so on. Thus, only one data set can contribute to the likelihood ratio when condition 1 and condition 2 hold, and there are more than two hypothesis.

*NOTE: An additional pair might bring no new terms, but this would be offset by a pair which brought 2 new terms. e.g. take dj1=dj2 as first[+2], dj1=dj3 [+1] and dj2=dj3 [+0], but next term must have djk=djl for both k,l(1,2,3). This will add two terms [+2]. If n=4 then we don't need to choose any more, but for the "other" j we must choose the 3 pairs which are not (1,2),(2,3),(1,3). These are (1,4),(2,4),(3,4) and thus the equality holds, because all numbers (1,2,3,4) are in the set.


I am beginning to doubt the accuracy of this proof. The result in Saunders maths implies only n non linear constraints on the djk. This makes djk only have n degrees of freedom instead of 2n. However to get to the n(n1)2 conditions a different argument is required.
probabilityislogic

0

For the record, here is a somewhat more extensive proof. It also contains some background information. Maybe this is helpful for others studying the topic.

The main idea of the proof is to show that Jaynes' conditions 1 and 2 imply that

P(Dmk|HiX)=P(Dmk|X),
for all but one data set mk=1,,m. It then shows that for all these data sets, we also have
P(Dmk|H¯iX)=P(Dmk|X).
Thus we have for all but one data set,
P(Dmk|HiX)P(Dmk|H¯iX)=P(Dmk|X)P(Dmk|X)=1.
The reason that I wanted to include the proof here is that some of the steps involved are not at all obvious, and one needs to take care not to use anything else than conditions 1 and 2 and the product rule (as many of the other proofs implicitly do). The link above includes all these steps in detail. It is on my Google Drive and I will make sure it stays accessible.


Welcome to Cross Validated. Thank you for your answer. Can you please edit you answer to expand it, in order to include the main points of the link you provide? It will be more helpful both for people searching in this site and in case the link breaks. By the way, take the opportunity to take the Tour, if you haven't done it already. See also some tips on How to Answer, on formatting help and on writing down equations using LaTeX / MathJax.
Ertxiem - reinstate Monica

Thanks for your comment. I edited the post and sketched the main steps of the proof.
dennis
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.