Інтервал довіри для відхилення за одним спостереженням


25

Це проблема із "7-ї студентської олімпіади ім. Колмогорова з теорії ймовірностей":

Враховуючи одне спостереження від розподілу з обома параметрами невідомими, дайте довірчий інтервал для з рівнем довіри принаймні 99%.Нормальна ( μ , σ 2 ) σ 2XNormal(μ,σ2)σ2

Мені здається, що це має бути неможливим. У мене є рішення, але я його ще не прочитав. Будь-які думки?

Я опублікую рішення через пару днів.

[Подальше редагування: Офіційне рішення розміщено нижче. Рішення кардинала довше, але дає кращий довірчий інтервал. Дякую також Максу та Glen_b за їхній внесок.]


1
Мені здається і неможливим; Чекаю відповіді
Пітер Флом - Відновіть Моніку


3
Ось папір з кращим форматуванням: папір .
припускаєтьсянормальне

Хе. Я пам'ятаю, як багато років тому читав документ про цей матеріал (один інтервал спостереження). Можливо, це був цей .
Glen_b -Встановити Моніку

1
@Max, дякую за посилання! Я ще не встиг придивитись уважно до цього, але буду. "Офіційну" відповідь я розмістив нижче.
Джонатан Крістенсен

Відповіді:


17

Якщо розглядати об'єктив нерівностей ймовірностей та зв’язок із випадком багаторазового спостереження, цей результат може здатися не таким вже неможливим, або, принаймні, може здатися більш правдоподібним.

Нехай з і невідомо. Ми можемо записати для .μ σ 2 X = σ Z + μ Z N ( 0 , 1 )XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Основна претензія : - інтервал довіри для де - рівня рівня розподілу chi-квадратом з одним ступенем свобода. Крім того, так як цей інтервал має рівно охоплення , коли , це самий вузький можливий інтервал виду для деякого .( 1 - α ) σ 2 q α α[0,X2/qα)(1α)σ2qαα μ = 0 [ 0 , b X 2 ) b R(1α)μ=0[0,bX2)bR

Причина для оптимізму

Нагадаємо, що у випадку , при , типовим довірчим інтервалом для є де є рівневий квантиль хі-квадрат з ступенями свободи. Це, звичайно, стосується будь-якого . Хоча це найпопулярніший інтервал ( з очевидних причин називається інтервалом з рівними хвостами ), він не є єдиним, навіть не найменшою шириною! Як очевидно, інший правильний вибір є T = n i = 1 ( X i - ˉ X ) 2n2T=i=1n(XiX¯)2 σ 2 ( T(1α)σ2

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Оскільки, , то також має покриття щонайменше .Ti=1nXi2

(0,i=1nXi2qn1,α),
(1α)

Якщо дивитися в такому світлі, то ми можемо бути оптимістичними щодо того, що інтервал в основній заявці відповідає дійсності . Основна відмінність полягає в тому, що не існує чі-квадратного розподілу нуля ступеня свободи для випадку єдиного спостереження, тому ми маємо сподіватися, що використання квантиля ступеня свободи спрацює.n=1

На півкроку до нашого пункту призначення ( експлуатування правого хвоста )

Перш ніж зануритися в доказ основної претензії, давайте спочатку розглянемо попередню претензію, яка не є настільки сильною або статистично задовольняє, але, можливо, дає деяке додаткове розуміння того, що відбувається. Ви можете пропустити до доказу основної претензії нижче, без великих (якщо такі є) збитків. У цьому розділі і далі наступні докази, хоча і трохи тонкі, базуються лише на елементарних фактах: монотонність ймовірностей, симетричність та неоднорідність нормального розподілу.

Допоміжна претензія : - інтервал довіри для тих пір, як . Тут є рівневий квантиль стандартного нормального.[0,X2/zα2)(1α)σ2α>1/2zαα

Доказ . іпо симетрії, тож у подальшому ми можемо приймати без втрати загальності. Тепер для і , і так з , ми бачимо, що Це працює лише для , оскільки це те, що потрібно для .|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασ
P(0σ2<X2/zα2)1α.
α>1/2zα>0

Це доводить допоміжну вимогу. Незважаючи на те, що вона є показовою з статистичної точки зору, оскільки вимагає нерозумно великої для роботи.α

Доведення основної претензії

Уточнення вищезгаданого аргументу призводить до результату, який буде працювати для довільного рівня довіри. Спочатку зауважимо, що Встановіть і . Тоді Якщо ми можемо показати, що права частина збільшується на для кожного фіксованого , тоді ми можемо використовувати аналогічний аргумент, як у попередньому аргументі. Це принаймні правдоподібно, оскільки ми хочемо вірити, що якщо середня величина зростає, то стає більш ймовірним, що ми бачимо значення з модулем, що перевищує

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb. (Однак ми повинні стежити за тим, як швидко маса зменшується в лівому хвості!)

Встановіть . Тоді Зверніть увагу , що і для позитивного , зменшується в . Тепер для легко побачити, що . Ці факти, взяті разом, легко означають, що для всіх і будь-яких фіксованих .fb(a)=Φ(ab)+Φ(ab)

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

Отже, ми показали, що для і , a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Розв’язавши все це, якщо взяти , отримаємо що встановлює основну претензію.θ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

Заключне зауваження : уважне читання наведеного аргументу показує, що він використовує лише симетричні та унімодальні властивості нормального розподілу. Отже, підхід працює аналогічно для отримання довірчих інтервалів від одного спостереження з будь-якої симетричної унімодальної сімейства масштабування, наприклад, розподілу Коші або Лапласа.


Оце Так! а від студентів очікується, що вони стикаються з таким типом аргументів за короткий час іспиту на олімпіаду?
Діліп Сарват

1
@Dilip: Я поняття не маю! Мені незнайомий формат цієї олімпіади або те, що очікується з точки зору рішення. З буквального читання я вважаю, що відповідь Скортчі буде прийнятною. Мені було більше цікаво намагатися розібратися, як далеко можна дійти з нетривіальним рішенням. Моє власне (досить мінімальне) дослідження пішло за тим самим рухом думки, який описано у відповіді (з одним об’їздом). Цілком ймовірно, що існує краще рішення. :-)
кардинал

Це значно довше, ніж "офіційне" рішення, але воно краще обмежує дисперсію, тому я відзначаю це як "правильну" відповідь. Я розмістив "офіційну" відповідь нижче, а також деякі результати моделювання та обговорення. Дякую, @cardinal!
Джонатан Крістенсен

2
@Jonathan: Дякую Так, я міг би зробити доказ зовсім трохи коротше. Завдяки широкому колу тут учасників, я часто схильний балуватися додатковими (або, можливо, надмірними) деталями. :-)
кардинал

12

Час слідкувати! Ось таке рішення мені було надано:

Побудуємо довірчий інтервал форми , де T ( ) є деякою статистикою. За визначенням це буде довірчий інтервал з рівнем довіри принаймні 99%, якщо ( μ R ) ( σ > 0 )[0,T(X))T() Зауважимо, що щільність розподілу N (μ, σ 2 )не перевищує1 / σ

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
N(μ,σ2) . ТомуP(|X|a)a/σдля кожногоa0. Звідси випливає, що tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2). Підключення1/σ2πP(|X|a)a/σa0
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
отримуємо, що відповідною статистикою є T ( X ) = 10000 X 2 .t=0.01T(X)=10000X2.

Інтервал довіри (який дуже широкий) є дещо консервативним у моделюванні, без емпіричного висвітлення (у 100 000 моделювання) нижче 99,15%, оскільки я змінював резюме на багато порядків.

Для порівняння я також імітував інтервал довіри кардинала. Слід зазначити, що інтервал кардинала є дещо вужчим - у 99% випадку його кінець дорівнює приблизно , на відміну від 10000 X 2 у наданому рішенні. Емпіричне висвітлення є правильним на номінальному рівні, знову ж таки, на багато порядків для резюме. Тож його інтервал точно виграє.6300X210000X2

Я не встиг уважно подивитися на опублікований Максом документ, але я все-таки планую розглянути це і можу пізніше додати коментарі щодо цього (тобто не раніше ніж за тиждень). Цей документ вимагає 99% довірчого інтервалу , який має емпіричне покриття трохи нижче (приблизно 98,85%), ніж номінальне покриття для великих резюме в моїх коротких моделюваннях.(0,4900X2)


1
(+1) Це приємне рішення. Якщо ви маєте замість t у рівнянні дисплея? tt
кардинал

2
Ще кілька моментів: ваше рішення може бути зроблено дуже близьким до мого, не змінюючи аргументу. Зауважте, що ви можете стверджувати, що . Тоді інтервал стає(0,2X2/πα2)для будь-якогоα. Використовуючиα=0,01,виходитьT(X)6366,198X2проти1/q 0,016365,864у моїй відповіді. Чим вище рівень довіри (тобто, чим меншеα), тим ближче ваш метод порівнюється з моїм (хоча ваш інтервал завжди буде ширшим). P(|X|a)2a/σ2π(0,2X2/πα2)αα=0.01T(X)6366.198X21/q0.016365.864α
кардинальний

1
По-друге, я не дивився на цей папір, але я сумніваюся, що може бути дійсним 99% довірчим інтервалом. Дійсно, врахуйте всі довірчі інтервали форми ( 0 , b X 2 ) для деякого b . Тоді, коли μ = 0 , маємо, що X 2 / σ 2 точно чі-квадрат з одним ступенем свободи, і тому найменший b, який ми могли б вибрати в цьому випадку, є b = 1 / q α(0,4900X2)(0,bX2)bμ=0X2/σ2bb=1/qα. Іншими словами, інтервал, вказаний у моїй відповіді, є найбільш вузьким із заявленої форми.
кардинал

1
Я зробив (підозрюваний) виправлення друку. Крім того, pchisq(1/4900,1,lower.tail=F)у Rвіддачі 0.9886, досить близьких до ваших результатів моделювання за інтервал . (0,4900X2)
кардинал

1
Дякую за всі коментарі, @cardinal. Я думаю, що ваша зміна є правильною, хоч я вводив її так, як це було в оригінальних рішеннях - помилка друку там.
Джонатан Крістенсен

5

Конфігураційний імовірно.(0,)


1
Я думаю, вам було б корисно сказати, чому ви не можете отримати інтервал довіри з обмеженою довжиною.
припускаєтьсянормальне

1
@Max Я недостатньо розумний - але питання не задавав його.
Scortchi

4
+1 для цього. Питання не говорить про те, що CI має мінімальне охоплення, і насправді має на увазі, що це може бути прийнятним через його цікаве формулювання, "інтервал довіри з рівнем довіри не менше 99%".
Арі Б. Фрідман
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.