Максимальна оцінка вірогідності спільного розподілу з урахуванням лише граничних підрахунків


12

Нехай - спільний розподіл двох категоріальних змінних , з . Скажімо, вибірок було взято з цього розподілу, але нам дано лише граничні підрахунки, а саме для : X , Y x , y { 1 , , K } n j = 1 , , Kpx,yX,Yx,y{1,,K}nj=1,,K

Sj=i=1nδ(Xi=l),Tj=i=1nδ(Yi=j),

Який максимальний показник ймовірності для даними ? Це відомо? Обчислювально доцільно? Чи є інші розумні підходи до цієї проблеми, крім ML? S j , T jpx,ySj,Tj


2
Поля насправді не містить інформації * про спільний розподіл (дійсно, це справа копул). * або, принаймні, навряд чи будь-яка - очевидно, що поля містять хоча б деяку інформацію, оскільки інтер'єр не може перевищувати межі, в яких вони зустрічаються. Чи маєте ви на увазі конкретний спільний розподіл? Чому ви використовували тег? Ви після рішення максимальної ентропії? maximum-entropy
Glen_b -Встановіть Моніку

Я не дуже знайомий з копулами. Чи дотримуються вони і категоричної справи? Що це означатиме - що кожен спільний розподіл з однаковими полями матиме однакову ймовірність? (Я позначив максимальну ентропію, тому що вважав, що це може бути доречно.)
RS

У нас навіть немає визначеної моделі розподілу, тому ми насправді не в змозі обчислити . Тут є численні можливості. Копули існують для упорядкованого категоричного випадку (якщо не унікального), але моєю метою в тому, щоб зробити це, було дати мотивацію, чому маргінали взагалі були не дуже інформативними. Стосовно випадку категоричного підрахунку, Фішер розглядав поля як неінформативні щодо суглоба, звідки точний тест Фішера-Ірвіна. Якщо ви хочете максимальної ентропії, ви, ймовірно, можете отримати рішення щодо максимальної ентропії, але я не знаю, що це буде дуже інформативно про ...P(x|θ)
Glen_b -Встановити Моніку

(ctd) ... структура. У будь-якому випадку ME чи ML, я думаю, що вам спочатку знадобиться якась модель, будь то багатоваріантна багаточленна, двоваріантна гіпергеометрична чи щось із більшою структурою. Дивіться це запитання , де автор ставить посилання на відповідь. Це може допомогти.
Glen_b -Встановити Моніку

1
Я мав на увазі загальний біваріантний багаточленний розподіл. Питання говорить про випадок, коли наведено суми розподілу, і ми бачимо зразки спільного розподілу. Тут ми маємо суми вибірки. Я думаю, що проблема чітко визначена у випадку ML (рішення може бути не унікальним, але я не знаю).
RS

Відповіді:


4

Така проблема була вивчена в роботі "Збільшення даних у багатосторонніх таблицях на випадок із фіксованою граничною сукупністю" Dobra et al (2006). Нехай позначає параметри моделі, нехай позначає непомічену цілу таблицю підрахунків для кожної пари , а - набір цілих таблиць, граничне число яких дорівнює . Тоді ймовірність спостереження граничних підрахунків дорівнює: деn ( x , y ) C ( S , T ) ( S , T ) ( S , T ) p ( S , T | θ ) = nC ( S , T ) p ( n | θ ) p ( n | θ ) n θ θθn(x,y)C(S,T)(S,T)(S,T)

p(S,T|θ)=nC(S,T)p(n|θ)
p(n|θ)- розподіл багаточленної вибірки. Це визначає ймовірність функціонування ML, але пряма оцінка неможлива, за винятком невеликих проблем. Підхід, який вони рекомендують, - це MCMC, де ви по черзі оновлюєте та шляхом вибірки з розповсюдження пропозиції та приймаючи зміни відповідно до коефіцієнта прийняття Metropolis-Hastings. Це можна адаптувати, щоб знайти приблизний максимум над використовуючи Монте-Карло ЕМ. nθθ

Інший підхід використовує варіативні методи для наближення суми до . Граничні обмеження можуть бути кодовані як факторний графік, а висновок над можна здійснити за допомогою розповсюдження очікування. θnθ

Щоб зрозуміти, чому ця проблема є складною і не допускає тривіального рішення, розглянемо випадок . Приймаючи як суму рядків і як підсумок стовпця, є дві можливі таблиці підрахунків: Тому функція правдоподібності MLE для цієї проблеми - що відповідає припущенню таблиці зліва. Навпаки, оцінка, яку ви отримаєте, здобувши незалежність, це S=(1,2),T=(2,1)ST

[0120][1011]
p(S,T|θ)=3p12p212+6p11p21p22
p^x,y=[01/32/30]
qx,y=[1/32/3][2/31/3]=[2/91/94/92/9]
яка має меншу величину ймовірності.

Чи не можливо отримати аналітичний розв’язок?
Бен Кун

Дякую! Документ здається актуальним, хоча він, здається, байєсівський. Як щодо конкретного випадку, коли насправді є самим розподілом, а саме для всіх пар? Підозрюєте, чи буде в цьому випадку аналітичне рішення? θθ={θx,y}(x,y)
РС

Я б не підозрював, що існує аналітичне рішення. Я додав приклад, щоб проілюструвати це.
Том Мінька

Дякую. Можливо, це правда асимптотично? Тоді кондиціонування підсумків маржі - це те саме, що обумовлення розподілу маржі (після нормалізації), і ймовірність журналу для кожної незабезпеченої цілочислової таблиці пропорційна його ентропії. Може, щось із AEP тоді?
РС

1

Як зазначав @Glen_b, це недостатньо уточнено. Я не думаю, що ви можете використовувати максимальну ймовірність, якщо не зможете повністю вказати ймовірність.

Якби ви були готові взяти на себе незалежність, тоді проблема досить проста (до речі, я думаю, що рішення було б запропонованим максимальним рішенням ентропії). Якщо ви не бажаєте і не можете нав’язати додатковій структурі у своїй проблемі, і ви все ще хочете певного наближення до значень комірок, можливо, ви можете скористатися межами копули Фреше-Гоффдінга . Без додаткових припущень я не думаю, що ви можете піти далі.


Ймовірність цього може бути багаточленною. Чому це недостатньо?
RS

Як я розумію, ймовірність є функцією параметрів, що задаються даними. Тут у вас немає значень для кожної комірки, лише маргінали, отже, ви не маєте жодної функції параметрів, які можна обчислити, не кажучи вже про максимізацію. Загалом, існує безліч конфігурацій комірок, сумісних із полями, і кожна з них дає різну ймовірність.
Ф. Тузелл

1
Так, але це нормально. Параметри , дані - граничні. Я все ще можу обчислити ймовірність маргіналів, заданих - це сума над усіма ймовірностями конфігурацій комірок, які дають маргінали. Це єдина функція, яку я можу максимально використати. pp
RS

1

Редагувати: Ця відповідь заснована на неправильному припущенні, що ймовірність граничних підрахунків, заданих є лише функцією граничних ймовірностей і . Я все ще думаю про це.px,ypx=ypx,ypy=xpx,y

Наступні помилки:

Як згадується в коментарі, проблема з пошуку "максимальної оцінки ймовірності для полягає в тому, що він не є унікальним. Наприклад, розглянемо випадок із двійковими та маргіналами . Два оцінкиpx,yX,YS1=S2=T1=T2=10

p=(120012),p=(14141414)

мають однакові граничні ймовірності та у всіх випадках, а отже, мають однакові ймовірності (обидва вони максимізують функцію ймовірності, як ви можете перевірити).pxpy


Дійсно, незалежно від того, якими є маргінали (поки два з них не мають нуля в кожному вимірі), рішення максимальної вірогідності не є єдиним. Я докажу це для двійкової справи. Нехай є рішенням максимальної ймовірності. Не втрачаючи загальності, припустимо, . Тоді має однакові маргінали і, таким чином, також є рішенням максимальної ймовірності.p=(abcd)0<adp=(0b+ac+ada)


Якщо ви хочете додатково застосувати обмеження максимальної ентропії, тоді ви отримаєте унікальне рішення, яке, як заявив Ф. Тюсселл, є рішенням, в якому незалежні. Ви можете побачити це так:X,Y

Ентропія розподілу ; максимізація з урахуванням і (рівнозначно, де і ) за допомогою множників Лагранжа дає рівняння:H(p)=x,ypx,ylogpx,yxpx,y=pyypx,y=pxg(p)=0gx(p)=ypx,ypxgy(p)=xpx,ypy

H(p)=kXYλkgk(p)

Усі градієнти кожного дорівнюють 1, тому для координації це працюєgk

1logpx,y=λx+λypx,y=e1λxλy

плюс початкові обмеження і . Ви можете переконатися, що це задоволено, коли та , даючиxpx,y=pyypx,y=pxe1/2λx=pxe1/2λy=py

px,y=pxpy.

Перший приклад: наведені граничні підрахунки , а не граничні ймовірності. У випадку, який ви описали, ймовірність для лівого - це ймовірність яка дорівнює . Для правого це , що дорівнює . Навіть якщо немає унікального рішення, це не означає, що ми не можемо вказати на якесь рішення. Максимальна ентропія дає унікальне рішення, але це може бути не максимальною ймовірністю. p [ [ 10 , 0 ] , [ 0 , 10 ] ] 2 - 20 p 0 a 10 P r [ [ a , 10 - a ] , [ 10 - a , a ] ] 10 4 -S1=S2=T1=T2=10p[[10,0],[0,10]]220p0a10Pr[[a,10a],[10a,a]]10420
RS

Ви неправильно обчислили ймовірності; наприклад, ви забули включити двочленні коефіцієнти. Але ви маєте рацію в тому, що дві матриці дають різні спільні розподіли граничних підрахунків, хоча вони дають однаковий граничний розподіл граничних підрахунків. (Так!) Я подумаю про це більше.
Бен Кун
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.