Чи однаково вірогідні всі значення в межах 95% довірчого інтервалу?


56

Я виявив невідповідну інформацію щодо запитання: " Якщо можна побудувати 95% довірчий інтервал (CI) різниці в засобах або різницю в пропорціях, чи всі значення в межах CI однаково вірогідні? Або, чи точкова оцінка є найбільш вірогідною , зі значеннями біля "хвостів" CI менш ймовірними, ніж у середині CI?

Наприклад, якщо у рандомізованому звіті про клінічне випробування зазначено, що відносний ризик смертності при конкретному лікуванні становить 1,06 (95% ДІ 0,96 до 1,18), чи є ймовірність того, що 0,96 буде правильним значенням, таким же, як 1,06?

В Інтернеті я знайшов багато посилань на цю концепцію, але наступні два приклади відображають невизначеність у ній:

  1. Модуль Лізи Салліван про Intervals Intervals стверджує:

    інтервали для різниці в засобах забезпечують діапазон ймовірних значень для ( ). Важливо зазначити, що всі значення в довірчому інтервалі є однаково вірогідними оцінками справжнього значення ( μ_1-μ_2 ).μ1μ2μ1μ2

  2. У цьому блозі, озаглавленому в межах помилки , зазначено:

    Я маю на увазі нерозуміння щодо "похибки", яка розглядає всі точки в інтервалі довіри як однаково вірогідні, як ніби центральна межа теореми передбачає обмежений рівномірний розподіл замість розподілу t . [...]
    Те, що говорять про "похибку", пропускає, це те, що можливості, близькі до точкової оцінки, набагато частіше, ніж можливості, що знаходяться на межі поля ".

Вони здаються суперечливими, тож що правильно?


7
Цікаво, чи є дещо плутанина з пов’язаною концепцією, що р-значення розподіляються рівномірно під нульовою гіпотезою ..
Майкл МакГоуан

4
Перша пропозиція - це аберрантне ковзання в іншому випадку точно враховуючи довірчі інтервали. Друга цитата - з викладу, який, красиво кажучи, є неохайним безладом: він повний тверджень, які є невиразними, невірними або можуть бути інтерпретовані лише в байєсівському розумінні. Але обидві цитати помилкові !
whuber

@whuber Я б не називав другого безладом ... Я би назвав це байєсівською інтерпретацією частотистської інтерпретації :)
Майкл МакГоуан

1
@ Michael Одним із прикладів неохайності є солеризм, як, наприклад, твердження CLT, передбачає, що "нескінченна кількість повторних оцінок [популяції] означає все ще буде нормальним розподілом". Не потрібно помилятися , щоб просто донести ідеї до нетехнічної аудиторії.
whuber

2
@whuber, я вважаю речення, яке ви цитуєте, лише незначним гріхом. Основна помилка полягає в тому, що CLT не передбачає розподілу t.
склоподібний

Відповіді:


23

Одне питання, на яке потрібно відповісти, - що означає "ймовірно" в цьому контексті?

Якщо це означає ймовірність (як це іноді використовується як синонім), і ми використовуємо суворі частолістські визначення, то справжнє значення параметра - це єдине значення, яке не змінюється, тому ймовірність (ймовірність) цієї точки становить 100% і все інші значення - 0%. Так що майже всі однаково ймовірні на рівні 0%, але якщо інтервал містить справжнє значення, то воно відрізняється від інших.

Якщо ми використовуємо байєсівський підхід, то CI (достовірний інтервал) походить від заднього розподілу, і ви можете порівняти ймовірність у різних точках протягом інтервалу. Якщо задня частина не є абсолютно рівномірною в інтервалі (я думаю, теоретично це можливо, але це було б дивним випадком), то значення мають різні ймовірності.

Якщо ми використовуємо ймовірність подібності до впевненості, тоді подумайте про це так: Обчисліть 95% довірчий інтервал, 90% довірчий інтервал та 85% довірчий інтервал. Ми були б на 5% впевнені, що справжня цінність лежить в області всередині інтервалу 95%, але поза інтервалом 90%, ми можемо сказати, що справжня величина, ймовірно, впаде в цей регіон. Те саме стосується області, яка знаходиться в інтервалі 90%, але поза інтервалом 85%. Отже, якщо кожне значення однаково вірогідне, то розмір вищезгаданих двох регіонів повинен бути точно однаковим і таким же буде справедливим для регіону всередині 10% довірчого інтервалу, але поза межами довірчого інтервалу 5%. Жоден із стандартних розподілів, які побудовані за допомогою інтервалів, не має цієї властивості (за винятком спеціальних випадків з 1 виводом з рівномірного).

Ви можете далі довести це собі, моделюючи велику кількість наборів даних із відомих груп, обчислюючи довірчий інтервал, що цікавить, а потім порівнювати, наскільки часто справжній параметр ближче до оцінки балів, ніж до кожної з кінцевих точок.


3
Ймовірність - це те, що на це запитання потребує відповіді, а не ймовірність, ні частолістського, ні байєсівського. Ймовірність дає саме таку відповідь, інші можуть зробити це лише з деяким скручуванням і розтягуванням.
Майкл Лев

1
@Greg Мені подобається ваше пояснення. Щоб було зрозуміло, ваш аргумент підтримує думку про те, що значення на "хвости" 95% ДІ є менш імовірними (менш вірогідними), ніж ті, що наближаються до точкової оцінки, правильно? Дякую за Вашу відповідь.
pmgjones

1
@pmgjones менш вірогідний, НІ, див. другий абзац. Менш вірогідний у контексті 4-го абзацу. Так.
Грег Сног

2
@GregSnow Ваш другий абзац майже точно говорить про те, що ймовірність того, що справжній параметр є істинним параметром, становить 100%. Ви справді вірите, що ця тавтологія - це те, що можуть запропонувати "суворі частофілістські визначення"?
rolando2

2
@ rolando2, я думаю, що статистика часто має багато чого запропонувати, я просто усував поширені хибні твердження, які передбачають зміну справжнього значення, а іноді поза інтервалом, а іноді всередині інтервалу (а іноді ближче до меж, а іноді ближче до центр). Пізніші абзаци потім отримують більш істинне почуття до ідей.
Грег Сніг

19

Це чудове запитання! Існує математичне поняття, яке називається вірогідність, яке допоможе вам зрозуміти проблеми. Фішер винайшов ймовірність, але вважав її дещо менш бажаною, ніж ймовірність, але ймовірність виявляється більш «примітивною», ніж ймовірність, і Ян Хакінг (1965) вважав її аксіоматичною, оскільки вона не є доказовою. Ймовірність підпирає ймовірність, а не зворотну.

Хакер, 1965. Логіка статистичних висновків .

Ймовірності не приділяється уваги, яку вона повинна мати в стандартних підручниках статистики, без поважних причин. Він відрізняється від ймовірності тим, що має майже такі властивості, яких можна було б очікувати, а ймовірнісні функції та інтервали дуже корисні для висновку. Можливо, деякі статистики ймовірність не подобається, оскільки іноді не існує «належного» способу отримання відповідних функцій вірогідності. Однак у багатьох випадках функції ймовірності очевидні та чітко визначені. Дослідження вірогідності висновку, мабуть, повинно починатися з невеликої та зрозумілої книги Річарда Ройала під назвою Статистичні докази: парадигма вірогідності .

Відповідь на ваше запитання полягає в тому, що ні, пункти протягом будь-якого інтервалу не мають однакової ймовірності. Ті, що знаходяться на краях довірчого інтервалу, зазвичай мають меншу ймовірність, ніж інші, до центру інтервалу. Звичайно, звичайний інтервал довіри нічого не говорить про параметр, що стосується конкретного експерименту. Інтервали довіри Неймана є "глобальними", оскільки вони розроблені так, щоб вони мали довгострокові властивості, а не "локальні" властивості, що стосуються експерименту. (На щастя, хороші довгострокові показники можна інтерпретувати на місцевому рівні, але це швидше інтелектуальний ярлик, а не математична реальність.) Вірогідні інтервали вірогідності - у тих випадках, коли вони можуть бути побудовані - безпосередньо відображають ймовірність пов'язаного експерименту.


1
@suncoolsu Не обов'язково, щоб даний інтервал був вірогідним інтервалом, щоб твердження було правдивим. Інтервал повинен охоплювати лише найбільш ймовірну оцінку, щоб межі інтервалу були менш імовірними, ніж точка в інтервалі. Будь-який звичайний інтервал довіри задовольнить цю вимогу.
Майкл Лев

2
@pmjones 95% CI НЕ ВКАЗУЄТЬ, чи значення в межах CI ближче до істини, ніж значення в середині. КІ роблять заяви про неодноразовий вибірки у населення. У довгостроковій перспективі (тобто після повторного відбору проб) 95% таких КІ, побудованих для кожного зразка, покриють справжнє значення. Отже, є два ключові спостереження: 1) Не можна нічого сказати про справжнє значення для даної ІР 2) КІ нічого не розповідають про спостережувані дані, що є звичайною байєсівською критикою.
suncoolsu

1
@MichaelLew Принцип ймовірності корисний, але я говорив, що (цитуючи LW) "Дійсно, всі частолістські умовиводи порушують LP, тому, якщо ми дотримуємось LP, нам доведеться відмовитися від частого виводу". Оскільки CI є частою ідеєю, вона порушує LP (який, на вашу думку, є фундаментальним).
suncoolsu

1
@suncollsu Питання полягає не в тому, чи сам інтервал довіри та без будь-яких інших статистичних міркувань щось говорить про ймовірність значень параметрів всередині себе. Йдеться про ймовірність значень параметрів в інтервалі. Функція ймовірності відповідає на питання, і ця відповідь є правильною, навіть якщо довірчий інтервал порушує принцип ймовірності. (Ще раз прочитайте мій попередній коментар. Ви, здається, повністю проігнорували його вміст.)
Майкл Лев

2
@ rolando2 95% довірчі інтервали Неймана розроблені так, що метод містить справжній параметр у 95% випадків, коли метод використовується. Строго кажучи, впевненість стосується методу, а не будь-якого окремого інтервалу, і тому індивідуальний інтервал нічого не розповідає про стан світу в конкретному експерименті. Дивіться мою відповідь на це питання для більш детальної інформації: stats.stackexchange.com/questions/8844/…
Michael Lew

18

Припустимо, хтось сказав мені, що я повинен довіряти всім цінностям в межах CI95 як потенційних показників цінності населення. (Я навмисно уникаю термінів "вірогідний" та "ймовірний".) Що особливого у 95? Нічого: щоб бути послідовним, я також повинен був би довіряти всім цінностям в межах CI96, CI97, ... і CI99.9999999. У міру того, як охоплення КІ наблизилось до межі, практично всі реальні цифри повинні були бути включені. Нерозумність цього висновку змусила мене відкинути початкову вимогу.


4
Це чудова відповідь! Я мав би подумати про ефект наближення крайнощів можливих ІС. Дякуємо, що написали це!
pmgjones

2

Почнемо з визначення інтервалу довіри. Якщо я скажу, що 95% інтервал довіри переходить від цього до цього, я маю на увазі, що твердження такого характеру будуть правдивими приблизно в 95% часу і хибними приблизно в 5% часу. Я не обов'язково маю на увазі, що я на 95% впевнений у цьому конкретному твердженні. Інтервал довіри на 90% буде вужчим, а 80% вужчим. Тому, коли мені цікаво, що таке справжня цінність, я менше довіряю цінностям, коли вони наближаються і наближаються до краю будь-якого конкретного інтервалу довіри.

Зауважимо, що все вищесказане є якісним, особливо "довіра". (Я уникав терміна "впевненість" або "ймовірність" у цій заяві, оскільки вони несуть математичний багаж, який може відрізнятися від нашого інтуїтивного багажу.) Байєсівські підходи переформулюють ваше запитання у щось, що має кількісну відповідь, але я не хочу відкривати що може тут глистів.

Класичний текст Box, Hunter & Hunter ("Статистика для експериментаторів", Wiley, 1978) також може допомогти. Див. "Набори інтервалів довіри" на стор. 113, ff.


Оскільки ми маємо справу частково в поняттях, а частково в семантиці, я зазначу, що у своєму другому реченні ви сказали "... твердження такого характеру будуть правдивими ...", не вказуючи, які твердження були б істинними.
rolando2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.