Пояснення інтерпретації довірчих інтервалів?


47

Моє нинішнє розуміння поняття «довірчий інтервал з рівнем довіри » є те , що якщо б ми спробували вирахувати довірчий інтервал багато разів (кожен раз з новим зразком), він буде містити правильний параметр з час.1 - α1α1α

Хоча я усвідомлюю, що це не те саме, що "ймовірність того, що справжній параметр лежить у цьому інтервалі", я хочу щось уточнити.

[Основне оновлення]

Перш ніж обчислити довірчий інтервал 95%, існує 95% ймовірність, що обчислений нами інтервал покриє справжній параметр. Після того, як ми обчислили довірчий інтервал і отримали певний інтервал , ми вже не можемо цього сказати. Ми навіть не можемо зробити якийсь нечастістський аргумент, що ми на 95% впевнені, що справжній параметр буде лежати в ; бо, якби ми могли, це суперечило б контрприкладам, таким, як цей: Що таке інтервал довіри?[ a , b ][a,b][a,b]

Я не хочу робити це дискусією щодо філософії ймовірності; натомість я шукаю точне, математичне пояснення того, як і чому бачення конкретного інтервалу змінюється (або не змінюється) 95% -ною ймовірністю, яку ми мали до того, як побачили цей інтервал. Якщо ви стверджуєте, що "після перегляду інтервалу поняття ймовірності більше не має сенсу", тоді добре, давайте попрацюємо над інтерпретацією ймовірності, в якій це має сенс.[a,b]

Точніше:

Припустимо, ми запрограмуємо комп'ютер для обчислення довірчого інтервалу 95%. Комп'ютер робить певну кількість хрускоту, обчислює інтервал і відмовляється показувати мені інтервал, поки я не введу пароль. Перш ніж я ввів пароль і побачив інтервал (але після того, як комп'ютер його вже обчислив), яка ймовірність, що інтервал буде містити справжній параметр? Це 95%, і ця частина не готується до дискусій : це тлумачення ймовірності, яке мене цікавить саме для цього питання (я розумію, що існують основні філософські питання, які я пригнічую, і це навмисно).

Але як тільки я введіть пароль і змушую комп'ютер показати мені обчислений інтервал, ймовірність (що інтервал містить справжній параметр) може змінитися. Будь-яке твердження про те, що ця ймовірність ніколи не змінюється, суперечить протилежному прикладу, наведеному вище. У цьому контрприкладі ймовірність може змінитися від 50% до 100%, але ...

  • Чи є приклади, коли ймовірність змінюється на щось інше, ніж 100% або 0% (EDIT: і якщо так, то які вони)?

  • Чи є приклади, коли ймовірність не змінюється після побачення певного інтервалу (тобто ймовірність того, що справжній параметр лежить у , все ще становить 95%)?[ a , b ][a,b][a,b]

  • Як (і чому) взагалі змінюється ймовірність після того, як комп'ютер виплюнув ?[a,b]

[Редагувати]

Дякуємо за всі чудові відповіді та корисні дискусії!


1
Це може навести кілька цікавих моментів: en.wikipedia.org/wiki/Credible_interval
nico

Ваші припущення, що P (E | C) = 1 і P (E | C ') = 0, невиправдані. Чому ви заявляєте, що якщо фактичний інтервал не містить справжнього значення параметра, цей останній, безумовно, знаходиться поза ним?
склоподібний

Я не впевнений, що ви маєте на увазі під "фактичним інтервалом" або "останнім". Ви можете, будь ласка, уточнити?
Елліотт

@nico Дякую за посилання. Наміром мого первісного питання було "моє міркування свідчить про те, що інтервал довіри можна інтерпретувати як достовірний байєсівський інтервал, але це не так, і що з моїми міркуваннями не так". Але я мушу визнати, що я не задоволений поняттям "ймовірність того, що інтервал містить [невідомий] істинний параметр, або 0, або 1". Для мене це як би сказати "ймовірність того, що монета приземлилася головами після того, як я її перевернув, але перед тим, як я її подивився, або 0, або 1"; Я не бачу, чому це не 1/2.
Елліотт

@Elliot: Кот Шредінгера приходить на розум :) Я недостатньо досвідчений, щоб дати тобі пояснення, але я хотів би побачити відповідь на це. PS: і не будемо забувати, що монета також може потрапити на край!
nico

Відповіді:


28

Я думаю, що основна проблема полягає в тому, що частоталістична статистика може присвоїти ймовірність лише тому, що може мати тривалу частоту. Незалежно від того, чи справжнє значення параметра лежить у певному інтервалі, чи не має тривалої тривалості виконання, тому що ми можемо виконати експеримент лише один раз, тому ви не можете призначити йому частоточну ймовірність. Проблема виникає з визначення ймовірності. Якщо ви зміните визначення ймовірності на байєсівське, то проблема миттєво зникає, оскільки ви більше не прив’язані до обговорення довгострокових частот.

Дивіться мою (скоріше язик у щоках) відповідь на пов’язане запитання тут :

" Частоліст - це той, хто вважає, що ймовірності представляють довгострокові частоти, з якими відбуваються події; якщо потрібно, він вигадає вигадане населення, з якого ваша конкретна ситуація може вважатися випадковою вибіркою, щоб він змістовно міг говорити про довгострокові частоти. Якщо ви ставите йому запитання щодо певної ситуації, він не дасть прямої відповіді, а натомість зробить заяву про це (можливо, уявне) населення ».

Що стосується довірчого інтервалу, питання, яке ми зазвичай хотіли б задати (якщо, наприклад, у нас немає проблеми з контролем якості), "враховуючи цей зразок даних, поверніть найменший інтервал, що містить справжнє значення параметра з вірогідністю X ". Однак частофіліст не може цього зробити, оскільки експеримент виконується лише один раз, тому немає довгострокових частот, які можна використовувати для призначення ймовірності. Тож натомість частоліст повинен вигадати сукупність експериментів (які ви не виконували), з яких експеримент, який ви виконували, можна вважати випадковою вибіркою. Тоді частофіліст дає вам опосередковану відповідь про цю вигадану сукупність експериментів, а не пряму відповідь на питання, яке ви насправді хотіли задати щодо конкретного експерименту.

По суті це проблема мови, частофілістичне визначення сукупності просто не дозволяє обговорювати ймовірність справжнього значення параметра, що лежить у певному інтервалі. Це не означає, що частота статистика є поганою або не корисною, але важливо знати обмеження.

Щодо основного оновлення

Я не впевнений, що ми можемо сказати, що "Перш ніж обчислити 95% довірчий інтервал, існує 95% ймовірність, що обчислений інтервал покриє справжній параметр". в рамках частістських рам. Тут є неявний висновок про те, що довгострокова частота, з якою справжнє значення параметра лежить в довірчих інтервалах, побудованих певним певним методом, також є ймовірністю того, що справжнє значення параметра буде лежати в довірчому інтервалі для конкретного зразка даних, які ми будемо використовувати. Це абсолютно розумний висновок, але це байєсівський висновок, а не частофілістський, оскільки ймовірність того, що справжнє значення параметра лежить у довірчому інтервалі, який ми побудуємо для певної вибірки даних, не має довгострокової частоти, як у нас є лише один зразок даних.

Однак ми можемо "зробити якийсь нечастістський аргумент, що ми на 95% впевнені, що справжній параметр буде лежати в [a, b]", саме таким є достовірний інтервал Байєса, і для багатьох проблем байєсівський достовірний інтервал точно збігається з періодичним довірчим інтервалом.

"Я не хочу робити це дискусією щодо філософії ймовірності", на жаль, це неминуче. Причина, яку ви не можете призначити частопеціалістичною ймовірністю того, чи справжнє значення статистики лежить в інтервалі довіри, є прямим наслідком частолістської філософії ймовірності. Часто відвідувачі можуть присвоювати ймовірності лише тим, що можуть мати тривалі частоти, оскільки саме так визначають вірогідність у своїй філософії. Це не робить неправильну філософію частолістів, але важливо зрозуміти межі, встановлені визначенням ймовірності.

"Перш ніж я ввів пароль і побачив інтервал (але після того, як комп'ютер його вже обчислив), яка ймовірність, що інтервал буде містити істинний параметр? Це 95%, і ця частина не підходить для дебатів:" Це невірно, або, принаймні, висловлюючи таку заяву, ви відійшли від рамки частотистської статистики і зробили байєсівський висновок, що передбачає ступінь правдоподібності правдивості твердження, а не частоти довгого запуску. Однак, як я вже говорив раніше, це абсолютно розумний і природний умовивід.

Нічого не змінилося до або після введення пароля, тому що ніщо подія може бути присвоєна частою ймовірністю. Статистика частотологів може бути досить протиінтуїтивно зрозумілою, оскільки ми часто хочемо задавати питання про ступінь правдоподібності висловлювань щодо конкретних подій, але це лежить поза сферою частотистської статистики, і це походження більшості неправильних тлумачень частістських процедур.


2
Так, це дуже суть, яку я зазначаю, друге твердження насправді не є твердженням про цю конкретну монету. Це твердження про уявну сукупність монет, яку більшість людей неправильно трактують як твердження про нашу конкретну монету. Однак, роблячи цей стрибок, ми застосовуємо байєсівську інтуїцію щодо ймовірності та ігноруючи, що насправді є довірчим інтервалом. Немає проблем із віднесенням ймовірності до стану монети, за умови, що ми відходимо від частолістського визначення ймовірності.
Дікран Марсупіал

2
Щоб уточнити, сказати, що «уявіть собі багато окремих випадків початку часу; ви очікуєте, що приблизно половина тих, хто виробляє голови», є цілком правильним частістським міркуванням. Однак переходити звідти до "отже, ймовірність того, що ця монета з окремими коштами також становить 0,5", це не так, як ймовірність застосовується до чогось, що не має довгої частоти, оскільки це може статися лише один раз і лише один раз. Це чудово обгрунтоване байєсівське міркування, хоча, як байєсівська ймовірність, є твердженням про правдоподібність пропозиції (яка може базуватися на довгостроковій частоті в межах популяції).
Дікран Марсупіал

1
Його відповідь на обидва запитання насправді була б твердженням про частку уявної сукупності монет, яка висадила б голови. Але цілком ймовірно, що це не стане явним, оскільки люди, як правило, люблять бути корисними (непрямі відповіді, як правило, не є корисними), а також частофілістська статистика є досить протиінтуїтивно зрозумілою, і частолюдист, швидше за все, обходиться навколо цієї точки, щоб уникнути плутанина. Якщо покласти на ноги, щоб скласти імовірнісну позицію про певний фліп, хороший частофіліст просто відмовився би відповісти - він лежить поза межами частотистської статистики.
Дікран Марсупіал

1
По суті, частофіліст насправді не відповів би на ваше запитання, він зробить заяву про популяцію монет, яка перевертає, і дозволить зробити висновок про те, що ймовірність голови на цьому конкретному перевороті була такою ж, як і частка в неявній популяції . Але це був би ваш байєсівський висновок, а не його.
Дікран Марсупіал

1
@Aaron Sure, ви можете сказати, що "ймовірність або 0, або 1" для багатьох речей, але ця відповідь не купує нам абсолютно нічого (наприклад, якщо ми хочемо відповісти на конкретний запитання про те, на скільки ми повинні робити ставку на гру чи чи чи ні, ми повинні запустити космічний човник). Крім того, те, що "могло статися", це: (1) монетка висадила голови, і ви її прикрили, (2) монети висадили хвости, і ви її накрили; у "уявній сукупності" багатьох випробувань "перегортання та прикриття" приблизно 50% призводять до того, що ви бачите голови.
Елліотт

14

Основне оновлення, нова нова відповідь. Дозвольте спробувати чітко вирішити цю проблему, бо саме тут криється проблема:

"Якщо ви стверджуєте, що" після перегляду інтервалу поняття ймовірності вже не має сенсу ", тоді добре, давайте попрацюємо над інтерпретацією ймовірності, в якій це має сенс".

Правила ймовірності не змінюються, але ваша модель для Всесвіту. Чи готові ви оцінити свої попередні переконання щодо параметра, використовуючи розподіл ймовірностей? Чи є оновлення розподілу ймовірностей після бачення даних розумною справою? Якщо ви так вважаєте, то ви можете робити такі твердження, як . Мій попередній розподіл може представляти мою невизначеність щодо справжнього стану природи , а не просто випадковість, як це прийнято розуміти - тобто, якщо я призначу попередній розподіл кількості червоних кульок урни, це не означає, що я думаю, що число червоних кульок є випадковим. Це виправлено, але я не впевнений у цьому.P(θ[L(X),U(X)]|X=x)

Кілька людей, включаючи мене, я це сказав, але якщо ви не бажаєте називати випадковою змінною, тоді вислів не є змістовне. Якщо я частолюдист, я розглядаю як фіксовану величину І я не можу приписувати розподілу ймовірності. Чому? Тому що це виправлено, і моя інтерпретація ймовірності стосується довгострокових частот. Кількість червоних кульок в урні ніколи не змінюється. - це те, що є. Якщо я витягну кілька куль, то у мене є випадковий зразок. Я можу запитати, що буде, якби я взяв купу випадкових вибірок - тобто я можу поговорити проP ( θ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ [ L ( X ) , U ( X ) ] )θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) тому що інтервал залежить від вибірки, який є (чекайте!) випадковим.

Але ти цього не хочеш. Ви хочете, щоб - яка ймовірність, що цей інтервал, який я побудував із моїм спостережуваним (і тепер фіксованим) зразком, містить параметр. Однак, як тільки ви зумовили то для мене, частоліста, нічого не залишається випадковим, і вислів не ' не має сенсу в будь-який змістовний спосіб.X = x P ( θ [ L ( X ) , U ( X ) ] | X = x )P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

Єдиний принциповий спосіб (IMO) зробити заяву про - це кількісно визначити нашу невизначеність щодо параметра з (попереднім) розподілом ймовірностей і оновіть це розповсюдження новою інформацією через теорію Bayes. Кожен інший підхід, який я бачив, - це невміле наближення до Байєса. Ви, звичайно, не можете це зробити з точки зору частолістської діяльності.P(θ[L(X),U(X)]|X=x)

Це не означає, що ви не можете оцінювати традиційні процедури часто-періодизму з байєсівської точки зору (часто довірчі інтервали - це просто достовірні інтервали під рівномірними пріорами), або що оцінювання байесівських оцінювачів / достовірних інтервалів з точки зору частолістської форми не є цінним (Я думаю, що це може бути). Не можна сказати, що класична / частотистська статистика марна, бо це не так. Це те, що воно є, і ми не повинні намагатися зробити його більше.

Як ви вважаєте, доцільно надати параметру попередній розподіл, щоб представити свої переконання щодо Всесвіту? Це звучить як з ваших коментарів; з мого досвіду більшість людей погодиться (це маленький напівжарт, який я висловив у коментарі до відповіді @G. Джея Кернса). Якщо так, байєсівська парадигма забезпечує логічний, узгоджений спосіб робити висловлювання про . Частістський підхід просто ні.P(θ[L(X),U(X)]|X=x)


1
(+1) знову дуже добре зроблено, і помітити на мертвому центрі.

+1 Той самий коментар, що і вище (див. Відповідь Г. Джея Кернса); це було дуже корисно.
Елліотт

Bounty schmounty :) Я радий, що Ви вважаєте це корисним.
JMS

11

Гаразд, зараз ти говориш! Я проголосував за видалення попередньої відповіді, оскільки це не має сенсу в цьому великому оновленому питанні.

У цьому новому оновленому запитанні з комп’ютером, який обчислює 95% довірчі інтервали, згідно з православною частолістською інтерпретацією, ось відповіді на ваші запитання:

  1. Немає.
  2. Немає.
  3. Після дотримання інтервалу він більше не є випадковим і не змінюється. (Можливо, інтервал був .) Але також не змінюється і ніколи не змінюється. (Можливо, це ) Ймовірність змінюється від 95% до 0%, оскільки 95% інтервалів, які комп'ютер обчислює, охоплюють 7, але 100% інтервалів НЕ охоплюють 7.θ θ = 7 [ 1 , 3 ][1,3]θθ=7[1,3]

(До речі, в реальному світі експериментатор ніколи не знає, що , що означає, що експериментатор ніколи не може знати, чи справжня ймовірність охоплює дорівнює нулю чи одиниці. (S) він може тільки скажіть, що це повинно бути те чи інше.) Це, плюс експериментатор, може сказати, що 95% інтервалів комп'ютера охоплюють , але ми це вже знали.[ 1 , 3 ] θ θθ=7[1,3]θθ

Дух вашого запитання постійно натякає на знання спостерігача , і як це стосується того, де лежить . Саме тому (імовірно) ви говорили про пароль, про комп'ютер, що обчислює інтервал, не бачачи його ще тощо . Я бачив у ваших коментарях відповідей, що здається незадовільним / неприйнятним зобов’язати взяти на себе значення 0 або 1, зрештою, чому ми не могли повірити, що це 87%, або , або навіть 99% ?? ? Але саме ця сила - і одночасно ахіллесова п’ята - частолістських рамок: суб’єктивне знання / віра спостерігача не має значення. Важливо лише відносна частота на тривалий час. Нічого більше, нічого менше.15 / 16θ15/16

Як остаточний BTW: якщо ви зміните своє тлумачення ймовірності (яке ви навмисно вирішили не робити з цього питання), то нові відповіді:

  1. Так.
  2. Так.
  3. Ймовірність змінюється, тому що ймовірність = суб'єктивне знання, або ступінь переконання, і знання спостерігача змінилися. Ми представляємо знання за допомогою попереднього / заднього розподілу, і коли з’являється нова інформація, колишні перетворюються на останні (через Правило Байєса).

(Але для повного розкриття опису описана вами настройка не дуже добре відповідає суб'єктивній інтерпретації. Наприклад, зазвичай у нас є 95% попередній інтервал перед тим, як навіть увімкнути комп'ютер, тоді ми запустимо його та задіяємо комп'ютер для надання нам 95% задній достовірний інтервал, який, як правило, значно тонший, ніж попередній.)


Знову! :) Молодці.
JMS

3
Мені слід лише зазначити, що байєсівська інтерпретація ймовірності не обов'язково є суб'єктивною, так що насправді не є силою частістського підходу. У випадку об'єктивного байєсівського підходу до "ймовірності виникнення проблеми з посадкою монети вгору", використання неінформативного попередження зовсім не передбачає суб'єктивності. Справжня сила частістського підходу полягає в таких проблемах, як контроль якості, де природно говорити про повторні випробування та довгострокові частоти. У вас виникають труднощі лише тоді, коли ви ставите питання щодо конкретних подій.
Дікран Марсупіал

@JMS, спасибі @Dikran, важко говорити про це з 544 символами у маленькому полі на екрані комп’ютера. Коротко: я погоджуюсь з вами, що слово "байєсівський" не є синонімом "суб'єктивного". І немає сенсу намагатися придивитися, де справді лежить справжня сила будь-якого підходу. Підсумок: ми всі можемо погодитись щодо відносної частоти на тривалий час, але частіше за все ваша задня частина буде відрізнятися від моєї.

2
@Dikran Marsupial Ви добре зазначаєте. Я лише додам, що як тільки ми переходимо з минулими проблемами з іграшками в реальне прикладне моделювання, часто трапляється так, що справді важлива суб'єктивність виникає через те, як ми визначаємо ймовірність, не обов'язково попередні розподіли (Чи справді ці спостереження обмінні? Гауссові? тощо). У такий спосіб суб'єктивність вбудовується у величезну частину статистики, заснованої на моделях, байєсівських і частолістських.
JMS

+1 Дякую за прекрасну відповідь. Це, безумовно, заслуговує на винагороду, але, щоб не бути політичним, я врешті-решт проходив протистояння.
Елліотт

6

Я кину два мої центи (можливо, перенаправляю деякі з колишніх відповідей). Для частолюбиця сам інтервал довіри по суті є двовимірною випадковою змінною: якби ви повторили експеримент у газильйона разів, довірчий інтервал, який би ви оцінили (тобто: щоразу обчислюйте щойно знайдені дані), буде відрізнятися щоразу . Таким чином, дві межі інтервалу є випадковими змінними.

Таким чином, 95% ІС означає не що інше, як впевненість (враховуючи всі ваші припущення, що ведуть до цієї ІП, є правильними), що цей набір випадкових змінних буде містити справжнє значення (дуже часте вираз) у 95% випадків.

Ви можете легко обчислити довірчий інтервал для середнього значення 100 креслень від стандартного нормального розподілу. Тоді, якщо ви отримаєте 10000 разів 100 значень із цього стандартного нормального розподілу, і кожен раз обчислюєте довірчий інтервал для середнього, ви дійсно побачите, що 0 знаходиться там приблизно в 9500 разів.

Той факт , що ви вже створили довірчий інтервал тільки один раз (від фактичних даних) дійсно зменшити ймовірність істинного значення , що знаходиться в цьому інтервалі 0 або 1, але це не змінює ймовірність довірчого інтервалу в якості випадкова змінна, щоб містити справжнє значення.

Отже, підсумок: ймовірність будь-якого (тобто в середньому) 95% довірчого інтервалу, що містить справжнє значення (95%), не змінюється, і також не змінюється ймовірність певного інтервалу (CI або будь-якого іншого), що містить справжнє значення (0 або 1). Ймовірність інтервалу, який комп'ютер знає, але ви насправді не дорівнює 0 або 1 (тому що це певний інтервал), але оскільки ви цього не знаєте (і, часто, не в змозі перерахувати цей самий інтервал нескінченно багато разів знову з одних і тих же даних), все, на що вам потрібно звернутися, - це ймовірність будь-якого інтервалу.


Кумедна сторона: перевірка правопису цього сайту вважає, що слово частоліст є гідним фігурного підкреслення. Чи цей сайт таємно освоюється байєсами? О, я думаю, це не так, оскільки у байесів є свої фігурні підкреслення :-)
Нік Саббе

4

Причина того, що довірчий інтервал не визначає "ймовірність того, що справжній параметр лежить в інтервалі", полягає в тому, що як тільки інтервал заданий, параметр або лежить в ньому, або він не робить. Однак, наприклад, для 95% довірчого інтервалу, у вас є 95% шансів створити довірчий інтервал, який містить значення. Це досить складна концепція для розуміння, тому я, можливо, не сформулюю це добре. Див. Http://frank.itlab.us/datamodel/node39.html для подальшого роз'яснення.


2
Припустимо, ви запрограмуєте комп'ютер для обчислення довірчого інтервалу, але ви не дивитесь на вихід. Перш ніж ви побачили вихід, ви знаєте, що є 95% шансів, що інтервал містив правильний параметр (так само, як і раніше, ніж ви бачили результат перевертання монети, ви знаєте, що є 50% шансів на голову). Яким чином згодом, дивлячись на вихід, змінюється ця ймовірність, враховуючи, що ви не знаєте в першу чергу потрібного параметра (я згоден, що дивлячись на результат перевертання монети, зміна ймовірності головки з 50% на будь-яку 1 або 0)?
Елліотт

Крім того, хоча я погоджуюся, що існує різниця, мені цікаво, що не так у моєму вище "аргументі", який показує, що вони те саме.
Елліотт

2
@Elliott Ваші запитання, схоже, аналогічні цій аналогії: ви перегортаєте чесну монету. Ерго, ймовірність голови 50%. Тепер ви дивитесь на монету, і це голови. Яким чином це змінює ймовірність головок? Відповідь полягає в тому, що це не так, тому що ймовірність стосується процедури гортання монети, а не результату. Мені здається, що зразок контрприкладу, на який ви посилаєтесь, працює аналогічно: процедура може мати 50% шансів охопити параметр, але після того , як можна було перевірити, чи дійсно параметр охоплений. І що?
whuber

Я не говорю про зміну ймовірності того, що справедлива монета буде головою; натомість я говорю про зміну ймовірності того, що саме ця монета стане головою. Після того, як я перевернув його і перед тим, як переглядати це, я б заперечував, що ймовірність, про яку йдеться, становить 50%, оскільки приблизно половина таких випадків передбачає монету з головою вгору. З іншого боку, після того, як я подивився на це і побачив голови, у 100% таких випадків пов'язана монета з головами вгору (випадки з хвостиками вгору були усунені, коли я дивився на монету і не бачив голови).
Елліотт

Я погоджуюся, що після цього факту можливо переконатися, що параметр був охоплений. Моя відповідь "так що?" це "тому мій вище аргумент (в оригінальному запитанні) повинен бути помилковим, і мені цікаво, що з цим не так".
Елліотт

4

Я не думаю, що частоліст може сказати, що існує ймовірність справжнього (популяційного) значення статистики, що лежить у довірчому інтервалі для конкретного зразка. Це або є, або це не так, але для певної події не існує довгострокової частоти, а лише кількість подій, яку ви отримаєте при повторному виконанні статистичної процедури. Ось чому ми повинні дотримуватися таких тверджень, як "95% побудованих інтервалів довіри міститимуть справжнє значення статистики", але не "існує ap% ймовірність того, що справжнє значення лежить у довірчому інтервалі, обчисленому саме для цього зразок ». Це справедливо для будь-якого значення р, воно просто неможливо, не визначаючи частофілістського визначення того, що насправді є ймовірністю. Баєсів може зробити таку заяву, використовуючи правдивий інтервал, хоча.


3

E[a,b]

E~(L(X),U(X))

Редагувати: @G. Джей Кернс робить аргумент кращим, ніж я, і набирає швидше, тому, ймовірно, просто рухайтесь уздовж :)


[a,b]

2
|

Я не знаю, у вас на місці. :-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


Враховуючи, що я визначив C таким випадком, коли цей конкретний інтервал, [a, b], містить справжній параметр, я не впевнений, що я згоден, що E і C / C 'є незалежними: знаючи, що C сталося гарантією того, що E сталося .
Елліотт

Але C - випадкова величина! Ви ніби змінюєте визначення всіх цих подій після того, як усе вже відбулося. По-іншому, якщо ви визначаєте C саме для цієї події, тоді C більше не є довірчим інтервалом.
raegtin

2
Проблема полягає в тому, що якщо C - це подія, що інтервал містить істинний параметр у цьому конкретному виконанні експерименту, він не має довгої частоти виконання (цей конкретний запуск може відбутися лише один раз), і таким чином ви не можете призначити частістська ймовірність до цього. Ось чому визначення частотистського інтервалу довіри відбувається з урахуванням сукупності повторених експериментів. Ви, здається, застосовуєте байєсівські міркування до частофілістської обстановки, і є невідповідність визначення ймовірності.
Дікран Марсупіал

Ось ще один спосіб поглянути на це. Здається, ви робите наступне: проведіть обчислення, щоб отримати довірчий інтервал [a, b]. Визначте С як випадок, коли цей конкретний довірчий інтервал [a, b] містить істинний параметр. Також визначте E як випадок, коли цей конкретний інтервал [a, b] містить істинний параметр. Таким чином, E і C - це одна і та ж подія!
raegtin

Це те, що ти насправді робиш. Схоже, ви думаєте, що ви робите наступне (чого ви не є): запустіть обчислення №1, щоб отримати інтервал [a, b]. Визначте E як випадок, коли цей конкретний інтервал [a, b] містить істинний параметр. Далі забудьте про обчислення №1 і визначте C як випадок, коли будь-який інший обчислений інтервал [a ', b'] містить справжній параметр. У цьому випадку E і C є незалежними.
raegtin

2

Тут так багато довгих пояснень, що я не маю часу їх прочитати. Але я думаю, що відповідь на основне питання може бути коротким і солодким. Саме різниця між ймовірністю є безумовною для даних. Ймовірність 1-альфа перед збиранням дат - це ймовірність того, що чітко визначена процедура буде включати параметр. Після того як ви зібрали дані і дізнаєтеся, який конкретний інтервал, який ви створили, інтервал фіксується, і, оскільки параметр є постійним, ця умовна ймовірність дорівнює 0 або 1. Але оскільки ми навіть не знаємо фактичного значення параметра після збору даних ми не знаємо, яке це значення.

Розширення допису Майкла Черника скопійовано у коментарях до форми:

Є патологічний виняток із цього, який можна назвати досконалою оцінкою. Припустимо, у нас є авторегресивний процес першого порядку, заданий X (n) = pX (n-1) + en. Він є стаціонарним, тому ми знаємо, що р не дорівнює 1 або становить -1 і в абсолютній величині <1. Тепер en незалежно однаково розподілено зі змішаним розподілом, є додатна ймовірність q, що en = 0

Є патологічний виняток із цього, який можна назвати досконалою оцінкою. Припустимо, у нас є авторегресивний процес першого порядку, заданий X (n) = pX (n-1) + en. Він є стаціонарним, тому ми знаємо, що р не дорівнює 1 або становить -1 і в абсолютній величині <1.

Тепер en є незалежними однаково розподіленими зі змішаним розподілом, є позитивна ймовірність q, що en = 0, а при ймовірності 1-q вона має абсолютно безперервний розподіл (скажімо, що щільність не дорівнює нулю в інтервалі, обмеженому від 0. Тоді збирають дані з часового ряду послідовно і для кожної послідовної пари значень оцінюють p за X (i) / X (i-1). Тепер, коли ei = 0, відношення дорівнює p точно.

Оскільки q більше 0, в кінцевому рахунку відношення повторить значення, і це значення повинно бути точним значенням параметра p, тому що якщо це не значення ei, яке не дорівнює 0, повториться з ймовірністю 0 і ei / x (i -1) не повториться.

Таким чином, правило послідовного зупинки полягає в вибірці, поки співвідношення точно не повториться, а потім використовувати повторне значення в якості оцінки р. Оскільки це точно будь-який інтервал, який ви будуєте, по центру якого є оцінка, має ймовірність 1 включення істинного параметра. Хоча це патологічний приклад, який не є практичним, існують стаціонарні стохастичні процеси із властивостями, які нам потрібні для розподілу помилок.


2
Чи розглядали ви, замість того, щоб додати відповідь, описаний під час цих кількох коментарів, до своєї відповіді?
Макрос

@Michael Я другого коментаря Макроса. Зауважте, що коментарі, як правило, розглядаються як спосіб взаємодії з іншими користувачами (наприклад, при запиті роз'яснень тощо), і в будь-якому випадку іноді розглядаються як " громадяни третього класу в біржі стеків ". Однак, після нашого останнього обміну, я дозволю вам вирішити, як діяти до цієї серії коментарів. Це зауваження стосується іншої серії коментарів, знайдених тут .
chl

Я не ставлю коментарів у відповіді, тому що, здається, існує політика, яка вимагає відповідей, що мають багато дискусій в них, зокрема, коли хтось судить, що відповідь насправді не відповідає на питання. Тож відповіді - це відповіді, а коментарі - під коментарями. Мої коментарі, як правило, перевищують обмеження кількості персонажів, тому я використовую декілька.
Майкл Черник

@MichaelChernick Не існує такої політики, тому я включив ваші коментарі до публікації.

1
@MichaelChernick, я майже рік регулярно публікую цей сайт, і я ніколи не чув, щоб хтось припускав, що модератори пригнічують чи що правила веб-сайту бентежать. Проблеми, з якими ви стикаєтесь: ваші публікації - це речі, які чітко обговорюються в FAQ.
Макрос

1

Два спостереження щодо багатьох запитань та відповідей, які можуть допомогти ще.

Частина плутанини пов'язана з прогляданням якоїсь більш глибокої математики теорії ймовірностей, яка, до речі, була не на міцній математичній основі приблизно до 40-х років. Він потрапляє в те, що становить пробні простори, простори ймовірностей тощо.

По-перше, ви заявляли, що після перекидання монети ми знаємо, що існує 0% ймовірності, що він не з’явиться хвостиків, якщо він підійде до голови. У той момент говорити про ймовірність немає сенсу; що сталося, ми знаємо це. Ймовірність стосується невідомого в майбутньому, а не відомого в теперішньому.

В якості невеликого висновку щодо того, що насправді означає нульова ймовірність, ми врахуємо це: ми припускаємо, що справедливий підрахунок має ймовірність 0,5 підняття голови та 0,5 підняття хвостів. Це означає, що він має 100% шанс підійти або до голови, або до хвостів, оскільки ці результати є MECE (взаємовиключні та повністю вичерпні). Однак, це має нульовий відсоток зміни щодо складання голів та хвостів : наше поняття "голови" та "хвости" полягає в тому, що вони взаємовиключні. Таким чином, це шанси на нульовий відсоток, тому що неможливо в тому, як ми думаємо (або визначаємо) "підкидання монети". І неможливо до і після жеребкування.

В якості додаткового слідства до цього, все , що не є, за визначенням, неможливо це можливо. У реальному світі я ненавиджу, коли адвокати запитують "чи не можливо ви підписали цей документ і забули про нього?" оскільки відповідь завжди "так" за характером питання. З цього приводу відповідь також "так" на питання "чи не можливо вас перевезли через дематеріалізацію на планету Ремулак 4 і змусили щось зробити, а потім перевезти назад, не пам'ятаючи про це?". Ймовірність може бути дуже низькою - але те, що неможливо, неможливо. У нашій звичайній концепції ймовірності, коли ми говоримо про гортання монети, вона може підійти до голови; це можуть підійти хвости; і навіть він може стояти в кінці або (якось, наприклад, якби нас занурили в космічний корабель, поки наркотики і вивезли на орбіту) вічно плавати в повітрі. Але перед чи після кидання, водночас: вони є взаємовиключними результатами у вибірковому просторі експерименту (шукайте «пробні проби ймовірності» та «сигма-алгебри»).

По-друге, з усієї цієї баєсової / частотистської філософії щодо довірчих інтервалів, правда, вона стосується частот, якщо людина виступає в ролі частоліста. Отже, коли ми кажемо, що інтервал довіри для вибіркової та оціночної середньої величини становить 95%, ми не кажемо, що ми на 95% впевнені, що "реальне" значення лежить між межами. Ми говоримо, що, якби ми могли повторити цей експеримент все більше і більше, у 95% часу ми виявили б, що середня величина перебуває між межами. Однак, коли ми робимо це за один запуск, ми беремо розумовий ярлик і кажемо: «ми на 95% впевнені, що ми праві».

По-перше, не забувайте про те, що стандартна установка знаходиться на тесті гіпотез на основі експерименту. Якщо ми хочемо знати, чи змушує гормон росту рослин рости швидше, можливо, спочатку визначимо середній розмір помідора після 6 місяців росту. Потім повторюємо, але з гормоном, і отримуємо середній розмір. Наша нульова гіпотеза «гормон не працює», і ми перевіряємо , що . Але, якщо випробувані рослини в середньому більше, з 99% впевненістю, це означає, що "завжди будуть випадкові зміни за рахунок рослин і наскільки точно ми зважимо, але кількість випадковостей, які пояснювали б це, траплялося б менше одного час у сотню ».


1

Питання можна охарактеризувати як плутанину попередньої та задньої вірогідності або, можливо, як незадоволення невідомого спільного розподілу певних випадкових величин.

Кондиціонування

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

Не обумовлюватися доказами означає ігнорувати докази. Однак ми можемо лише умовити те, що виражається в імовірнісній моделі. У нашому прикладі з двома кулями від урни ми не можемо спричинити погоду чи те, як ми почуваємось сьогодні. Якщо у нас є підстави вважати, що це є доказом, що стосується експерименту, ми повинні спершу змінити нашу модель, щоб ми могли висловити це свідчення як формальні події.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

Довірчий інтервал

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ, означало б визнання цього доказу та водночас ігнорування його.

Дізнайтесь більше, знаючи менше

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

Якщо я скажу, що ймовірність забиття Knicks між xbar - 2sd (x) та xbar + 2sd (x) становить приблизно 95 в даній грі в минулому, це є обґрунтованим твердженням з огляду на певне розподільне припущення щодо розподілу баскетбольних балів . Якщо я зберу дані про бали за даними зразком ігор і обчислюю цей інтервал, ймовірність того, що вони забили в цьому інтервалі в якийсь день минулого, явно дорівнює нулю або одиниці, і ви можете дізнатися результат гри в Google, щоб дізнатися. Єдине уявлення про збереження ненульової або однієї ймовірності для частолістів походить від повторного відбору проб, а реалізація інтервальної оцінки конкретного зразка є магічною точкою, де вона сталася, або вона не дала інтервальної оцінки цього зразка. . Це не той момент, коли ви вводите пароль,

Про це Дікран стверджує вище, і я проголосував за його відповідь. Справа, коли неодноразові зразки не враховуються, - це точка частотистської парадигми, коли недискретна ймовірність стає недосяжною , а не тоді, коли ви вводите пароль, як у вашому прикладі вище, або коли ви переглядаєте результат в моєму прикладі Гра Knicks, але момент, коли ваша кількість зразків = 1.


0

Моделювання

S=(Ω,Σ,P)EΣP(E)ESS

Крок (1) може дозволити деяку свободу дії. Доречність моделювання іноді можна перевірити, порівнявши ймовірність певних подій з тим, що ми очікували б інтуїтивно. Зокрема, перегляд певних граничних чи умовних ймовірностей може допомогти зрозуміти, наскільки правильне моделювання.

X1,,XnDist(θ)θR

Інтервальний оцінювач

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

Переваги

γ1γ2γ1<γ2більша ймовірність бути виграшним квитком, ніж перший, коли їх було зроблено. Перевага щодо різних спостережень (два квитки в цьому прикладі), засновані на ймовірнісних властивостях випадкових процесів, що породили спостереження, є чудовим. Зауважте, що ми не кажемо, що будь-який з квитків має більшу ймовірність бути виграшним квитком. Якщо ми колись так говоримо, то з "ймовірністю" у розмовному значенні, що могло б означати що завгодно, тому найкраще тут уникати.

0.95

Приклад із простим пріоритетом

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

Якби ми могли сказати "ймовірність того, що справжній параметр лежить у цьому довірчому інтервалі", ми б не враховували розмір вибірки. Незалежно від того, наскільки велика є вибірка, якщо середнє значення однакове, то довірчий інтервал був би однаково широким. Але коли ми говоримо "якщо я повторю це 100 разів, то я б очікував, що в 95 випадках справжній параметр буде лежати в інтервалі", ми враховуємо розмір вибіркової вибірки і наскільки впевнений наш прогноз . Чим більший розмір вибірки, тим менше дисперсія буде мати середню оцінку. Отже, це не так сильно відрізняється, і коли ми повторюємо процедуру 100 разів, нам не потрібен великий інтервал, щоб переконатися, що в 95 випадках справжній параметр знаходиться в інтервалі.


Майте на увазі, що інтервал довіри - це концепція часто.
Майкл Черник
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.