Оцінка параметра рівномірного розподілу: неправильне попереднє?


10

У нас є N зразків, Xi, від рівномірного розподілу [0,θ] де θневідомо. Оцінітьθ з даних.

Отже, правило Байєса ...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

і ймовірність така:

f(Xi|θ)=i=1N1θ (редагувати: коли для всіх , а 0 в іншому випадку - дякую блуд)0Xiθi

але не маючи іншої інформації про , здається, що попередній повинен бути пропорційним (тобто рівномірному) або (Jeffreys раніше?) на але тоді мої інтеграли не Я не зближуюся, і я не знаю, як діяти далі. Будь-які ідеї?θ11L[0,]


2
Ваша ймовірність неправильна: вона буде нульовою, коли менше, ніж найбільший . θXi
whuber

Чи можете ви показати, які інтеграли ви приймаєте?

Так, так, я думаю, я просто не знаю, як боротися з неналежним попереднім. Наприклад, я хочу написатиf[Xi]=Θf(Xi|θ)f(θ)dθ
Will

1
Для неналежного до цього = = і для попереднього ви аналогічно отримуєтеОскільки майже напевно, певне, інтеграли будуть сходитися. f[Xi]=Θf(Xi|θ)f(θ)dθmax(Xi)θNdθmax(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
whuber

1
Посилання заднього Бернардо - Парето - дивіться каталог неінформативних пріорів .
Стефан Лоран

Відповіді:


4

Це породило цікаву дискусію, але зауважте, що це насправді не має великого значення для питання, що цікавить. Особисто я вважаю, що оскільки є параметром масштабу, аргумент групи перетворень є відповідним, що призводить до пріоритетуθ

p(θ|I)=θ1log(UL)θ1L<θ<U

Цей розподіл має ту саму форму при перегляді проблеми (ймовірність також залишається "інваріантною" при переосмисленні). Ядро цього попереднього, можна отримати, розв'язуючи функціональне рівняння . Значення залежать від проблеми, і вони мають значення лише в тому випадку, якщо розмір вибірки дуже малий (наприклад, 1 або 2). Задня частина - це усічений парето, що дається:f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
Де - N-й статистика замовлення або максимальне значення вибірки. Одержимо середнє заднє значення Якщо ми встановивши і отримаємо простіший експресію .X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

Але тепер припустимо, що ми використовуємо більш загальний пріоритет, заданий (зауважимо, що ми дотримуємось меж щоб забезпечити все належним чином - жодної сингулярної математики тоді ). Задня частина є такою ж, як вище, але з замінена на - за умови, що . Повторюючи наведені вище обчислення, ми спростили середнє заднє значенняp(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

Тож рівномірний попередній ( ) дасть оцінку умови, що (середнє значення для нескінченно ). Це показує , що дебати тут трохи схоже не використовувати або в якості подільника в оцінці дисперсії.c=1N1N2X(N)N2N=2NN1

Одним із аргументів проти використання неправильної рівномірної форми в цьому випадку є те, що заднє є неправильним, коли , оскільки воно пропорційне . Але це має значення лише якщо або дуже мало.N=1θ1N=1


1

Оскільки, мабуть, метою є отримання деякої вагомої та корисної оцінки , попередній розподіл повинен відповідати специфікації розподілу населення, з якого походить вибірка. Це жодним чином не означає, що ми «обчислимо» попереднє використання самого зразка - це зведе нанівець дійсність усієї процедури. Ми знаємо, що популяція, з якої походить вибірка, - це сукупність iid однорідних випадкових величин, кожна з яких становить . Це виправдане припущення і є частиною попередньої інформації, якою ми володіємо (і вона не має нічого спільного з вибіркою , тобто з конкретною реалізацією підмножини цих випадкових змінних).θ[0,θ]

Тепер припустимо, що ця сукупність складається з випадкових величин (в той час як наш зразок складається з реалізацій випадкових величин). Витримане припущення говорить нам, що mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

Позначимо для компактності . Тоді у нас є який також можна записати maxi=1,...,n{Xi}XθX

θ=cXc1

Функція щільності з iid Уніфікованого rv в є maxN[0,θ]

fX(x)=N(x)N1θN

для підтримки та нуля в інших місцях. Тоді, використовуючи та застосовуючи формулу змінної змінної, ми отримуємо попередній розподіл для що відповідає дотриманому припущенню: [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

що може бути неправильним, якщо ми не визначимо константу відповідним чином. Але наш інтерес полягає у тому, щоб мати належну задню для , а також, ми не хочемо обмежувати можливі значення (виходячи з обмеження, що має на увазі збережене припущення). Таким чином, ми залишаємо невизначеним. Тоді пишемо заднійcθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

для деякої нормалізуючої константи A. Ми хочемо

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

Вставлення в задній

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

Зауважте, що невизначена константа попереднього розподілу зручно скасовувати.c

Задня частина підсумовує всю інформацію, яку може дати нам конкретний зразок щодо значення . Якщо ми хочемо отримати конкретне значення для ми можемо легко обчислити очікуване значення заднього, θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

Чи є в цьому результат інтуїція? Що ж, при збільшенні кількості 's більше шансів на те, що максимальна реалізація серед них буде ближче і ближче до їх верхньої межі, - саме це відображає заднє середнє значення : якщо, скажімо , , але якщо . Це свідчить про те, що наша тактика щодо вибору попереднього була розумною і відповідала проблемі, яка існує, але не обов'язково в деякому сенсі "оптимальна".XθθN=2E(θX)=2xN=10E(θX)=109x


1
Виходячи з попередніх даних для мене звучить риба. Як ви виправдовуєте такий підхід?
whuber

2
Я не маю нічого проти того, що твій пріоритет не "найкращий". Де я щось таке сказав? Я просто намагаюся зрозуміти ваш підхід. Я ще не розумію цієї рівності. Якщо є постійною в рівності , чи означає це, що і і є невипадковими? До речі, ви не використовуєте те, що у виведенні попереднього, чи не так? (cc @whuber)cθ=cXXθc1
Стефан Лоран

1
А підтримка вашого попереднього залежить від даних? ( )θ[x,[
Стефан Лоран

3
Попередній залежність (навіть якщо це відбувається лише через підтримку) від даних звучить неправильно: ви не можете знати максимум вибірки до того, як зразок був сформований . Більше того, ви стверджуєте, що - це майже впевнена рівність з випадковими і і (таким чином, існує кореляція ). Але це означає, що задній розподіл (який є умовним розподілом даним зразком) є масою Дірака при . І це суперечить вашому виведенню заднього розподілу. ... (жодних символів не залишилося ...)θ=cXθX1θθcx
Stéphane Laurent

1
Задній розподіл є Діраком при означає, що є . Теорема Байєса не є причиною. Ви знищуєте все, припускаючи . Звідси випливає, що , таким чином, умовний розподіл заданого є масою Дірака при , тоді як початкове припущення полягає в тому, що цей розподіл є рівномірним розподілом на . θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
Стефан Лоран

0

Єдина теорема попереднього розподілу (інтервал):

"Якщо сукупність Вашої інформації про межами даних , фіксується одним пропозицією Тоді ваш єдиний можливий логічно-внутрішньо узгоджений попередній специфікація - θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

Таким чином, ваша попередня специфікація повинна відповідати попередній Джефрі, якщо ви справді вірите у вищезгадану теорему ".

Не входить до Уніфікованої теорії попереднього розподілу:

Крім того, ви можете вказати свій попередній розподіл як розподіл Парето, який є кон'югованим розподілом для рівномірного, знаючи, що задній розподіл повинен бути іншим рівномірним розподілом за сукупністю. Однак якщо ви використовуєте розподіл Pareto, вам знадобиться певним чином вказати параметри розподілу Pareto.f(θ)


4
Спочатку ви говорите, що відповідь "єдино можливий логічно внутрішньо" - це рівномірний розподіл, а потім ви переходите до пропозиції альтернативи. Це для мене звучить нелогічно і непослідовно :-).
whuber

2
Я не можу погодитися. Наприклад, - також множинаКоли PDF дорівнює для . Але згідно з "теоремою", чий pdf дорівнює в цьому інтервалі. Коротше кажучи, хоча судження не залежить від того, як задається параметризація задачі, висновок "теореми" залежить від параметризації, звідки це неоднозначно. B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
whuber

2
БабакП: Як можна сказати, що це теорема ? Теорема - математична довідка з математичним доказом. Цю «теорему» було б більш доцільно назвати «принципом», але це не є розумним, оскільки є суперечливим, як показав @whuber.
Стефан Лоран

2
Дякуємо за довідку BabakP. Я хотів би зазначити, що "ескіз доказу" - хибний. Дрейпер ділить інтервал на скінченну кількість однаково розташованих значень і "переходить до межі". Будь-хто може розділити інтервал на значення, розміщені для наближення будь-якої щільності, яка їм подобається, і аналогічно переходить до межі, створюючи абсолютно довільну "лише можливі логічно-внутрішньо узгоджені попередні характеристики". Такий матеріал, а саме, використовуючи погану математику, намагаючись довести, що не-байєси нелогічні - дає байєсівському аналізу (незаслужено) погану назву. (cc @ Stéphane.)
whuber

1
@ Stéphane Вибачте, будь ласка, про мою нечутливість ( insensibilité ) - я захоплююсь вашою майстерністю взаємодії тут другою мовою і свідомо не використовую незрозумілі терміни! Богус - прикметник, що походить від 200-річного терміну сленгу в США, що стосується машини для підробки грошей. У цьому випадку це математична машина для підробки теореми :-).
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.