Який саме інтервал довіри?


86

Я приблизно і неофіційно знаю, що таке інтервал довіри. Однак я, здається, не можу обернути голову навколо однієї досить важливої ​​деталі: Згідно Вікіпедії:

Інтервал довіри не передбачає, що справжнє значення параметра має особливу ймовірність опинитися в довірчому інтервалі з урахуванням фактично отриманих даних.

Я також бачив подібні моменти, зроблені в декількох місцях на цьому сайті. Більш правильне визначення, також з Вікіпедії:

якщо довірчі інтервали будуються через безліч окремих аналізів даних повторних (і, можливо, різних) експериментів, частка таких інтервалів, що містять справжнє значення параметра, буде приблизно відповідати рівню довіри

Знову я бачив подібні моменти, зроблені в декількох місцях на цьому сайті. Я не розумію. Якщо під час повторних експериментів частка обчислених довірчих інтервалів, що містять справжній параметр є , то як можлива ймовірність того, що знаходиться в довірчому інтервалі, обчислений для фактичного експерименту, будь-що інше ? Я шукаю у відповіді таке:( 1 - α ) θ ( 1 - α )θ(1α)θ(1α)

  1. Уточнення відмінності між неправильними та правильними визначеннями вище.

  2. Формальне, точне визначення інтервалу довіри, яке чітко показує, чому перше визначення неправильне.

  3. Конкретний приклад випадку, коли перше визначення явно неправильно, навіть якщо основна модель є правильною.


4
У цій публікації є хороше обговорення питання про довірчі інтервали stats.stackexchange.com/questions/2356/… . Стаття, про яку йдеться у публікації, я думаю, допомагає прояснити певне саме те, чому наведені вище визначення є правильними для довірчих інтервалів. Часто під час перегляду того, як розбиваються КІ, можна зрозуміти їх краще.
ймовірністьлогічний

2
Частина мене аплодує цьому питанню (+1). Конкуруюча частина хоче вказати на те, що 1. Переважна більшість споживачів статистики, люди, які використовують статистику прагматично, але не філософськи для того, щоб зробити свою точку зору в хімії чи маркетингових дослідженнях, ніколи не зрозуміють приємності питань, і ми часто бути в збитку пояснити результати. 2. Навіть деякі пуристичні статистики можуть потрапити в пастку робити нібито ймовірнісні твердження, як ті, що включають довірчі інтервали, коли вони не працюють із випадковими вибірками. Набагато більше питання.
rolando2

3
@Mario Ваше припущення не вірно! Зі 100 повторень експерименту ми очікуємо, що 95 із ІС (не є засобами) містять справжнє (але невідоме) значення. ІС є випадковим, але справжнє значення серед населення - ні.
whuber

6
Є чудовий документ Cumming & Maillardet (2006), який показує, що не 95% засобів реплікації потраплять у вихідний ІС, а лише 83,4% (вони називають це значення «відсотком захоплення»). Причина полягає в тому, що існують два джерела мінливості: A) мінливість вихідного середнього значення навколо mu, і, B) мінливість засобів реплікації навколо mu. Більшість людей забуває A: оригінальний ІС не необхідний навколо mu!
Фелікс S

2
Зацікавлені читачі також можуть побачити цю тему: Чому 95% ІС не передбачає 95% шансу містити середнє?
gung

Відповіді:


26

Я вважав цей мислительний експеримент корисним, коли думав про довірчі інтервали. Він також відповідає на ваше запитання 3.

Нехай і . Розглянемо два спостереження з значеннями та відповідають спостереженням та з , і нехай і . Тоді - це 50% довірчий інтервал для (оскільки інтервал включає якщо або , кожен з яких має ймовірність ).Y = X + a - 1XU(0,1)Y=X+a12Yy1y2x1x2Xy u = max ( y 1 , y 2 ) [ y l , y u ] a a x 1 < 1yl=min(y1,y2)yu=max(y1,y2)[yl,yu]aax1>1x1<12<x21x1>12>x214

Однак, якщо то ми знаємо, що ймовірність того, що інтервал містить дорівнює , а не . Тонкість полягає в тому, що довірчий інтервал для параметра означає, що кінцеві точки інтервалу (які є випадковими змінними) лежать на будь-якій стороні параметра з ймовірністю перед тим, як обчислити інтервал , не те, що ймовірність параметра лежачи в інтервалі - після того, як ви обчислили інтервал . a11yuyl>12a1 z%z%z%12z%z% z%


3
Зауважимо, що майже точно, отже, інтервал містить параметр з вірогідністю нуля. Насправді ваш аргумент працює, якщо те, що ви оцінюєте, є . [ y l , y u ] a θ = a + 1Y>a[yl,yu]aθ=a+12
Чи

4
Я не думаю, що цей приклад лічильника є дійсним, тому що ви знаєте лише ймовірність того, що інтервал містить це один після того, як побачите, що . Цілком розумно, що ймовірність повинна змінитися після отримання додаткової інформації. Якби все, що ви знали, це те, що інтервал - 50% довірчий інтервал, то ймовірність все одно буде 1/2 (хоча це була б байєсівська ймовірність, а не частість, як це стосується певної події, яка не має тривалої тривалості)у у - у л > 1 / 2θyuyl>1/2
Дікран Марсупіал

1
Це справді хороший приклад, але я категорично не згоден з вашими твердженнями про ймовірності, які якимось чином змінюються до та після розрахунку інтервалу довіри. Це не має сенсу, і створюється враження, що математика якось піклується про те, що ви знаєте, а що - ні. Це не так !! У вас завжди є, що є . Ви також завжди маєте, що дорівнює . Це не суперечність, одна - просто безумовна ймовірність, а інша - умовна ймовірність. 1P(a[yl,yu]) P(a[yl,yu]121P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp, так, можливо, це неправильне формулювання з боку Тейлора, що говорить про те, що ймовірності змінюються. Жодні ймовірності не змінюються. Аргумент показує, як легко виникати ситуації, демонструючи помилкове розуміння КІ, що призводять до логічних проблем. Якщо ви вважаєте, що спостережуваний ІС має 50-відсоткову ймовірність коректності, але це не може бути правильним, тоді ви розумієте, що CI є неправильним.
Іван

36

Є багато питань, що стосуються довірчих інтервалів, але зупинимось на цитатах. Проблема полягає в можливих неправильних тлумаченнях, а не в правильності. Коли люди кажуть, що "параметр має певну ймовірність" чогось, вони думають про параметр як про випадкову змінну. Це не точка зору (класичної) довірчої інтервальної процедури, для якої випадковою змінною є сам інтервал і параметр визначається, а не випадковою, поки невідомою. Ось чому такі заяви часто нападають.

Математично, якщо ми дозволимо бути будь-яка процедура , яка відображає дані для підмножин простору параметрів , і якщо (незалежно від того , яке значення параметра може бути) твердження визначає подію , то - за визначенням, вона має ймовірність для будь-якого можливого значення . Коли - процедура довірчого інтервалу з довірою тоді ця ймовірність повинна мати мінімальний (за всіма значеннями параметрів)x = ( x i ) θ θ t ( x ) A ( x ) Pr θ ( A ( x ) ) θ t 1 - α 1 - αtx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α. (З урахуванням цього критерію, ми зазвичай вибираємо процедури, які оптимізують деяку додаткову властивість, наприклад, створення коротких довірчих інтервалів або симетричних, але це окрема справа.) Слабкий закон великих чисел потім виправдовує другу пропозицію. Це, однак, не є визначенням довірчих інтервалів: це лише властивість, яку вони мають.

Я думаю, що цей аналіз відповів на питання 1, показує, що передумова питання 2 є неправильною, і робить запитання 3 суперечливим.


3
Дякуємо, що надали відповідь на відмінне запитання. Чи можу я запропонувати наступну аналогію для подальшого обговорення? Припустимо, я перекидаю чесну монету знову і знову. Тоді . Зараз я один раз перевертаю монету, але не показую, що я перевернув, і запитую: "Яка ймовірність того, що голови підняті?". Як би ви відповіли на це запитання? P(Head)=.50
Вольфганг

3
Ще один спосіб її висловити: для не-байесівців єдині "речі", які можуть мати ймовірність, - це можливі події - у сенсі майбутніх результатів випадкового експерименту. З огляду на те, що параметр має фіксоване справжнє значення, щойно ви маєте інтервал із конкретними значеннями, вже не можлива подія, включена чи ні параметр в інтервал. Як результат, ви можете мати впевненість у процесі, який генерує інтервал, але не у двох конкретних числах.
каракал

1
@caracal - лише якась їжа для роздумів, це "монетка" кожен справді "випадковий"? Якщо ви скажете "так", то ви відкинете думку про те, що монета підіймає голови - це детермінована (але складна) функція багатьох речей (скажімо - вітер, висота, сила і кут перевороту, вага монети тощо) .). Я думаю, що це показує подвійний стандарт "випадковості", який застосовується до мислення, заснованого на CI. Дані виправлені, але ми не впевнені в його значенні ( дані ergo випадкові ), тоді як параметри фіксовані, але ми не впевнені в його значенні ( Параметри ergo не випадкові ).
ймовірністьлогічний

4
@Wolfgang Я не бачу, як ваш приклад стосується довірчих інтервалів. Ви не вимагаєте нічого, пов'язаного з параметром розподілу. Ваша ситуація найбільш тісно пов'язана з інтервалами прогнозування. Я думаю, що вся ця дискусія може зацікавити цей контекст, але вона не належить до теми інтервалів довіри.
whuber

2
@whuber Питання про те, чи можна зробити імовірність твердження щодо конкретного 95% ІС, що фіксує справжній невідомий параметр, дуже схожий на питання, чи можна скласти заяву про ймовірність щодо конкретного перевертання, коли результат ще невідомий. Зрештою, 95% CI будуть захоплювати параметр. Зрештою, 50% сальто - це голови. Чи можемо ми сказати, що є 95% шансів, що певний CI захопить параметр? Чи можемо ми сказати, що є 50% шансів, що голови перед тим, як подивитися? Я б сказав так "так". Але деякі люди можуть не погодитися.
Вольфганг

19

Я б не назвав визначення CI неправильним, але їх легко трактувати неправильно, оскільки існує більше одного визначення ймовірності. CI засновані на наступному визначенні ймовірності (частота або онтологічна)

(1) ймовірність пропозиції = велика частка часу, коли пропозиція спостерігається як істинна, що залежить від процесу формування даних

Таким чином, щоб бути концептуально справедливим при використанні ІС, ви повинні прийняти це визначення ймовірності. Якщо ви цього не зробите, то з теоретичної точки зору ваш інтервал не є КІ.

Ось чому для визначення було використано слово пропорція, а НЕ слово ймовірність , щоб зрозуміти, що застосовується визначення ймовірності "довгого періоду".

Основним альтернативним визначенням ймовірності (гносеологічне чи ймовірність як розширення дедуктивної логіки чи байєсів) є

(2) ймовірність пропозиції = раціональна ступінь переконання, що судження є істинним, обумовленим станом знань

Люди часто інтуїтивно змішують обидва ці визначення, і використовують те, що трактується, щоб звернутися до їх інтуїції. Це може ввести вас у всілякі заплутані ситуації (особливо, коли ви переходите від однієї парадигми до іншої).

Те, що два підходи часто призводять до одного результату, означає, що в деяких випадках ми маємо:

раціональний ступінь переконання, що судження є правдивим, що залежить від стану знань = довгострокова частка пропорцій, коли ця пропозиція спостерігається як істинна, що залежить від процесу генерації даних

Справа в тому, що вона не є загальною , тому ми не можемо очікувати, що два різних визначення завжди приведуть до однакових результатів. Отже, якщо ви фактично не виробите байєсівське рішення, а потім виявите, що це той самий інтервал, ви не можете дати інтервал, заданий CI інтерпретацією, як ймовірність містити справжнє значення. І якщо ви це зробите, то інтервал - це не довірчий інтервал, а достовірний інтервал.


2
Я не бачу, чому ймовірність пропозиції відповідно до визначення 1 повинна бути раціональним числом. Довгострокова пропорція, мабуть, посилається на межу пропорцій, таких, що судження вважається істинним. Кожна пропорція є раціональним числом, але їх обмеження може бути. (На щастя, ця ваша дужка в кращому випадку здається дотичною до решти вашої відповіді.)
Чи

3
@ probability Ця відповідь, здається, відводить нас від дотичної не надто конструктивно. Рівняння ймовірності та пропорції - це форма онтологічної плутанини, подібна до рівняння температури з рівнем ртуті в термометрі: один - теоретична конструкція, а інший - фізичне явище, яке використовується для її вимірювання. Про це є певна дискусія на сайті stats.stackexchange.com/questions/1525/… .
whuber

@Didier - ти маєш рацію, насправді послідовність , що є раціональними термінами з ірраціональним обмеженням. Я зняв це зауваження. Дякуємо, що підняли це. xn=r2xn1+xn12r
ймовірністьлогічний

6
@whuber - Справа доречна, тому що саме це непорозуміння змушує людей трактувати CI неправильно. Плутати ймовірність з "раціональним ступенем переконання" не узгоджується з частою парадигмою. Це те, що відбувається, коли ви вважаєте, що CI означають "ймовірність того, що справжнє значення знаходиться в інтервалі", це те, що робить @dsimcha у питанні.
ймовірністьлогічний

1
@probability Дякую за пояснення. Я зрозумів, що ваша відповідь відповідає визначенню "ймовірність = пропорція". Насправді, ретельне перечитання все ще говорить про те, що ви говорите в третьому абзаці, навіть якщо ваш коментар зараз характеризує це як непорозуміння. Ви можете уточнити цей момент.
whuber

6

Р. Фішер мав критерій корисності довірчих інтервалів: КІ не повинен допускати "ідентифікованих підмножин", які передбачають інший рівень довіри. У більшості (якщо не у всіх) контрприкладів є випадки, коли є ідентифіковані підмножини, які мають різні ймовірності покриття.

У цих випадках ви можете використовувати байєсівські інтервали кредитів, щоб вказати суб'єктивне відчуття того, де знаходиться параметр, або ви можете сформулювати інтервал ймовірності для відображення відносної невизначеності параметра, враховуючи дані.

Наприклад, один випадок, який здається відносно непротилежним, - це двосторонній нормальний інтервал довіри для середньої сукупності. Якщо припустити вибірку з нормальної сукупності з даними std., 95% CI допускає відсутність ідентифікованих підмножин, які б надавали більше інформації про параметр. Це можна побачити за тим фактом, що середнє значення вибірки є достатньою статистикою в функції ймовірності, тобто функція ймовірності не залежить від окремих значень вибірки, коли ми знаємо, що означає вибірку.

Причина, по якій ми маємо будь-яку суб’єктивну впевненість у 95% симетричному ІС для нормальної середньої величини, випливає менше із заявленої ймовірності покриття і більше від того, що симетричний 95% ІС для нормальної середньої величини є інтервалом "найвищої ймовірності", тобто Значення параметрів в інтервалі мають більшу ймовірність, ніж будь-яке значення параметра поза інтервалом. Однак, оскільки ймовірність не є ймовірністю (у сенсі довгострокової точності), вона є скоріше суб'єктивним критерієм (як баєсівське використання попереднього та ймовірного). Підсумовуючи, існує нескінченно багато інтервалів для нормальної середньої величини, які мають 95% вірогідність покриття, але тільки симетричний CI має інтуїтивно зрозумілий прогноз, який ми очікуємо від оцінки інтервалу.

Отже, критерій Р. Фішера передбачає, що ймовірність покриття повинна прирівнюватися до суб'єктивної впевненості лише у тому випадку, якщо він допускає жодне з цих підрозділів, що не можна визначити. Якщо підмножини є, то ймовірність покриття буде залежати від істинних значень параметра (ив), що описують підмножину. Щоб отримати інтервал з інтуїтивно зрозумілим рівнем довіри, вам потрібно буде обумовити інтервал оцінки відповідної додаткової статистики, яка допоможе визначити підмножину. АБО, ви можете вдатися до дисперсійних / сумішальних моделей, що, природно, призводить до інтерпретації параметрів як випадкових змінних (ака-бейсівська статистика) або ви можете обчислити профільну / умовну / граничну ймовірність у рамках вірогідності. Так чи інакше, ви відмовилися від будь-якої надії створити об'єктивно перевірену ймовірність правильності,

Сподіваюся, це допомагає.


1
(+1) Одним із способів виправдати симетричний нормальний CI є те, що він мінімізує очікувану довжину. Зрештою, це просто відштовхує суб'єктивність до вибору тривалості як функції втрати в процедурі прийняття рішення: але це, мабуть, "хороший" вид суб'єктивності (тому що це розкриває роль наших аналітичних цілей у виборі статистичної процедури), а не "погана" суб'єктивність, яка звучить просто як пейоративний епітет.
whuber

5

З теоретичної точки зору питання 2 і 3 ґрунтуються на неправильному припущенні, що визначення неправильні. Тож я згоден з відповіддю @ whuber у цьому відношенні, і відповідь @ whuber на питання 1 не потребує від мене додаткового введення.

Однак з більш практичної точки зору інтервалу довіри може бути дано його інтуїтивне визначення (ймовірність містити справжнє значення), коли воно чисельно ідентичне байєсівському достовірному інтервалу на основі тієї самої інформації (тобто неінформативного попереднього).

Але це дещо огидно для важкого анти-байесівського, оскільки для того, щоб перевірити умови для того, щоб дати йому інтерпретацію CI, яку він / вона хочуть дати, вони повинні розробити байєсівське рішення, яке автоматично інтуїтивно зрозуміло!

Найпростіший приклад - довірчий інтервал для нормальної середньої величини з відомою дисперсією і задній достовірний інтервал .¯ x ± σ Z α / 2 1 - α ¯ x ± σ Z α / 21αx¯±σZα/21αx¯±σZα/2

Я не точно впевнений в таких умовах, але знаю, що для інтуїтивного тлумачення КІ важливо наступне:

1) існує зведена статистика, розподіл якої не залежить від параметрів (чи існують точні повороти поза нормальним та чі-квадратним розподілами?)

2) немає ніяких неприємних параметрів (за винятком випадків "Основна статистика", що є одним з небагатьох точних способів обробляти параметри неприємностей під час створення КІ)

3) існує достатня статистика для параметра, що цікавить, і довірчий інтервал використовує достатню статистику

4) розподіл вибірки достатньої статистики та задній розподіл мають певну симетрію між достатньою статистикою та параметром. У звичайному випадку розподіл вибірки симетрія знаходиться у while .(μ|¯x,σ)N(¯x,σ(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

Ці умови зазвичай важко знайти, і зазвичай швидше опрацювати байєсівський інтервал і порівняти його. Цікавою вправою може бути також спробувати відповісти на питання "для чого попередній мій ІП також є достовірним інтервалом?" Ви можете виявити деякі приховані припущення щодо вашої процедури ІС, переглянувши це попередньо.


1
(+1) Чи є насправді така людина, як "анти-баєсієць"? :-)
whuber

6
@whuber Ось один . А ось економіст, який співпрацює з нею на стипендії з філософії статистики.
Циан

1
Дякую! Це надзвичайно цікава нитка у філософії ймовірності та статистики, про яку я не знав.
whuber

1
Ви неправильно написали як відсутні ? x¯±zα/2σnn
qazwsx

3

Це може бути важко зрозуміти:

  • якщо в середньому 95% усіх довірчих інтервалів буде містити параметр
  • і у мене є один певний інтервал довіри
  • чому ймовірність того, що цей інтервал містить параметр, також становить 95%?

Довірчий інтервал стосується процедури вибірки. Якщо ви взяли б багато зразків і обчислили 95% довірчий інтервал для кожного зразка, ви виявите, що 95% цих інтервалів містять середню сукупність.

Це корисно, наприклад, для виробничих відділів якості. Ці хлопці беруть багато зразків, і тепер вони впевнені, що більшість їхніх оцінок буде досить близькими до реальності. Вони знають, що 95% їх оцінок досить хороші, але не можуть цього сказати про кожну конкретну оцінку.

Порівняйте це з котами, що котяться: якщо ви б кинули 600 (справедливих) кісток, скільки 6 ви б кинули? Ваша найкраща здогадка - * 600 = 100.16

Однак якщо ти кинув ОДНУ смерть, марно говорити: "Є 1/6 або 16,6% ймовірність, що я зараз кинув 6". Чому? Тому що матриця показує або 6, або якусь іншу фігуру. Ви кинули 6, чи ні. Отже, ймовірність дорівнює 1, або 0. Ймовірність не може бути .16

На запитання перед кидком, якою буде ймовірність кинути 6 з ОДНЕю смертю, байєс відповів би " " (виходячи з попередньої інформації: всі знають, що штамп має 6 сторін і рівний шанс потрапляння на будь-який з них), але частоменіст сказав би "Не маю ідеї", оскільки частоталізм базується виключно на даних, а не на пріорах чи будь-якій зовнішній інформації.16

Так само, якщо у вас є лише 1 зразок (таким чином, 1 довірчий інтервал), ви не можете сказати, наскільки ймовірно, що середній показник сукупності знаходиться в цьому інтервалі. Середнє значення (або будь-який параметр) є в ньому, чи ні. Ймовірність або 1, або 0.

Крім того, невірно, що значення в інтервалі довіри є більш імовірними, ніж значення, що знаходяться поза цим. Я зробив невелику ілюстрацію; все вимірюється в ° C. Пам'ятайте, вода замерзає при 0 ° C і кипить при 100 ° C.

Випадок: у холодному озері ми хотіли б оцінити температуру води, яка тече нижче льоду. Ми вимірюємо температуру в 100 місцях. Ось мої дані:

  • 0,1 ° C (вимірюється в 49 місцях);
  • 0,2 ° C (також у 49 місцях);
  • 0 ° C (в 1 місці. Це була вода, яка майже замерзала);
  • 95 ° C (в одному місці є завод, який незаконно скидає в озеро дуже гарячу воду).
  • Середня температура: 1,1 ° C;
  • Стандартне відхилення: 1,5 ° C;
  • 95% -CI: (-0,8 ° C ...... + 3,0 ° C).

Температури всередині цього довірчого інтервалу, безумовно, НЕ частіше, ніж температури поза ним. Середня температура води в цьому озері НЕ МОЖЕ бути холоднішою за 0 ° C, інакше це буде не вода, а лід. Частина цього довірчого інтервалу (а саме, розділ від -0,8 до 0) насправді має 0% вірогідність містити справжній параметр.

На закінчення: довірчі інтервали є частою концепцією, а тому ґрунтуються на ідеї повторних зразків. Якщо багато дослідників брали б зразки з цього озера і якщо всі ці дослідники обчислили б довірчі інтервали, то 95% цих інтервалів міститимуть справжній параметр. Але за один єдиний довірчий інтервал неможливо сказати, наскільки ймовірно, що він містить справжній параметр.


1
Не плутайте той факт, що частоталістична статистика не вимірює віру з тією, хто часто зазначає, що має попередні переконання та оновлює їх. Різниця полягає не в тому, чи є частоліст ідіот, який не має знань поза даними, а чи статистика частолістів передбачає прямі заходи стану віросповідання. Частоліст повинен оновлювати свої переконання на основі тестів, ІП тощо. Інакше вся їх система не працює, оскільки все залежить від прийнятих рішень.
Іван

2

Гаразд, я усвідомлюю, що коли ви обчислюєте 95% довірчий інтервал для параметра, використовуючи класичні частістські методи, це не означає, що існує 95% ймовірність того, що параметр лежить у межах цього інтервалу. І все ж ... коли ви підходите до проблеми з байєсівської точки зору і обчислюєте 95% достовірний інтервал для параметра, ви отримуєте (припускаючи неінформативний попередній) точно той же інтервал, який ви отримуєте, використовуючи класичний підхід. Отже, якщо я використовую класичну статистику для обчислення 95% довірчого інтервалу для (скажімо) середнього набору даних, то , правда, існує 95% ймовірність, що параметр лежить у цьому інтервалі.


5
Чи отримаєте ви однаковий результат, використовуючи часті інтервали довіри та достовірні інтервали Байєса, залежить від проблеми та, зокрема, від попереднього розподілу, використовуваного в байєсівському підході. Також в математиці та науці важливо, що коли ти маєш рацію, ти маєш рацію з правильної причини!
Дікран Марсупіал

4
Якщо ви "використовуєте класичну статистику для обчислення 95% довірчого інтервалу для [параметра]", то, якщо ви міркуєте послідовно, безглуздо посилатися на "ймовірність того, що параметр лежить у цьому інтервалі". Щойно ви згадуєте про цю ймовірність, ви змінили свою статистичну модель ситуації. У новій моделі, де параметр є випадковим, невірно обчислювати ІП за допомогою частотистських методів. Отримати правильну відповідь таким чином в деяких ситуаціях цікаво, але не виправдовує концептуальної плутанини, що лежить в основі.
whuber

4
@whuber - твоя передумова "... якщо ти міркуєш послідовно ..." має наслідком стару добру теорему Кокса. Це говорить про те, що якщо ви міркуєте послідовно, то ваше рішення має бути математично еквівалентним байєсівському. Отже, враховуючи цю передумову, CI обов'язково буде еквівалентним достовірному інтервалу, а його тлумачення як ймовірність є дійсним. А в Байеса не той параметр, який має розподіл, це непевність щодо того параметра, який має розподіл.
ймовірністьлогічний

2
... продовжував ... Отже, можна грати в дурну гру Я Байєса "Проб, що параметр знаходиться в інтервалі", я частофілістський "Проблема, що інтервал охоплює параметр", я Байєс ..., я частіст, ..., я байєсист ..., я частофіліст, ..... весь час цифри фактичного обчислення ніколи не змінюються
ймовірністьлогічний

2

Ви запитуєте про інтервал довіри часто . Визначення (зауважте, що жодне з 2 ваших цитат не є визначенням! Просто твердження, які обидва є правильними):

Якби я повторював цей експеримент велику кількість разів, враховуючи цю пристосовану модель із значеннями цього параметра , у 95% експериментів оцінене значення параметра потрапляло б у цей інтервал.

Отже, у вас є модель (побудована з використанням спостережуваних даних) та її орієнтовні параметри. Тоді, якщо ви створили деякі гіпотетичні набори даних відповідно до цієї моделі та параметрів, оцінені параметри потраплять у довірчий інтервал.

Тож насправді цей частістський підхід приймає модель та оціночні параметри як фіксовану, як задану, та розглядає ваші дані як невизначені - як випадкову вибірку багатьох інших можливих даних.

Це насправді важко інтерпретувати, і це часто використовується як аргумент для байєсівської статистики ( що, на мою думку, іноді може бути мало спірним . Байєсівська статистика, з іншого боку, сприймає ваші дані як фіксовану і трактує параметри як невизначені. Байєсівські достовірні інтервали - це тоді насправді інтуїтивно зрозуміло, як можна було очікувати: достовірні інтервали байесів - це інтервали, де на 95% лежить реальне значення параметра.

Але на практиці багато людей трактують частотистські інтервали довіри так само, як достовірні інтервали Байєса, і багато статистиків не вважають це великим питанням, - хоча всі вони знають, це не на 100% правильно. Також на практиці частотні та баєсові інтервали довіри / достовірності не сильно відрізнятимуться при використанні байєсівських неінформативних пріорів .


-1 Здається, що ваше "визначення" є невірним, принаймні в одному його читанні. - ДІ сконструйована так, щоб покрити істинний параметр з імовірністю . Це не є умовним для конкретної моделі чи способу пристосування параметрів. Можливо, я неправильно читаю це визначення: я беру "цю пристосовану модель із цим значенням параметра", щоб посилатися на вашу поточну оцінку параметра. Якщо це не так, як ви задумали, можливо, ви могли б прояснити цей момент? 1 - α1α1α
whuber

@whuber, гаразд, я вважаю, але якщо ти кажеш, що мій дефінітон неправильний, будь ласка, опублікуй своє повне визначення того, що таке CI.
Цікаво

Я уточнив свій коментар, Томаш, тому що мені здається, я можу прочитати ваше визначення так, як ви не мали наміру. Кіфер, Вступ до статистичних висновків , пише: "[T] Результат експерименту ... [S] застосовують процедуру використовується для оцінки та справжнього значення є ... [T] він кількість .. . Кількість називається коефіцієнтом довіри процедури ... називається at = [ L , U ] ϕ ( θ ) θ θ 0 γ t ( θ 0 ) = Pr θ 0 { L ( X ) ϕ ( θ 0 ) U ( X ) } ˉ γ t = inf θ Ω γ t ( θ ) t tXt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttдовірчий інтервал. "
whuber

@whuber, ваше визначення для мене насправді незрозуміле, і я боюся для більшості людей :) І так, я мав на увазі поточну оцінку, оскільки частолістські отримують оцінку параметрів як дані та дані як випадкові, протилежні байєсівським.
Цікаво

3
Я думаю, що головне питання у вашому визначенні Цікаве: "... оцінене значення параметра потрапить у інтервал". Це не оцінений параметр, а невідомий фіксований параметр; і він не потрапляє в інтервал, швидше інтервал переміщується і 95% часу фіксує параметр.
Іван

2

Припустимо, ми опинилися в простій ситуації. У вас є невідомий параметр і - оцінювач який має неточність близько 1 (неофіційно). Ви вважаєте, що (неофіційно) найчастіше має бути в .T θ θ [ T - 1 ; T + 1 ]θTθθ[T1;T+1]

У реальному експерименті ви спостерігаєте .T=12

Закономірно задати питання "З огляду на те, що я бачу ( ), яка ймовірність ?". Математично: . Усі, природно, задають це питання. Теорія інтервалу довіри повинна логічно відповісти на це питання. Але це не так.T=12θ[11;13]P(θ[11;13]|T=12)

Байєська статистика відповідає на це питання. У статистиці Байєса ви дійсно можете обчислити . Але вам потрібно прийняти попередній , що цей розподіл для , перш ніж робити експеримент і спостереження . Наприклад :P(θ[11;13]|T=12)θT

  • Припустимо, має попередню форму розподілу наθ[0;30]
  • зробіть цей експеримент, знайдітьT=12
  • Застосуйте формулу Байєса:P(θ[11;13]|T=12)=0.94

Але у частотистській статистиці немає жодного попереднього і, отже, нічого подібного до не існує. Натомість статистики говорять приблизно так: "Що б не , ймовірність того, що дорівнює ". Математично: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

Тому :

  • Байєсів: дляT = 12P(θ[T1;T+1]|T)=0.94T=12
  • Частота:θ,P(θ[T1;T+1]|θ)=0.95

Заява Байєса є більш природною. Найчастіше частолістське твердження спонтанно трактується як байєсівське твердження (будь-яким нормальним людським мозку, який не практикує статистику роками). І якщо чесно, багато статистичних книжок не роблять це дуже зрозумілим.

І практично?

У багатьох звичайних ситуаціях факт полягає в тому, що ймовірності, отримані за допомогою частотистського та баєсівського підходів, дуже близькі. Тож заплутаність частолістської заяви для байесівської має мало наслідків. Але "по-філософськи" це зовсім інакше.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.