Частина питання полягає в тому, що частотистське визначення ймовірності не дозволяє застосувати нетривіальну ймовірність до результату певного експерименту, а лише до деякої вигаданої сукупності експериментів, з яких саме цей експеримент можна вважати вибіркою. Визначення ІП є заплутаним, оскільки це твердження про цю (звичайно) вигадану сукупність експериментів, а не про конкретні дані, зібрані в конкретному випадку. Тож частина питання є одним із визначення ймовірності: Ідея справжнього значення, що лежить у певному інтервалі з вірогідністю 95%, не узгоджується із частофілістською структурою.
Інший аспект проблеми полягає в тому, що підрахунок довіри частолістів не використовує всю інформацію, що міститься в конкретному зразку, що має значення для обмеження справжнього значення статистики. Моє запитання: "Чи є приклади, коли достовірні інтервали Байєса, очевидно, поступаються інтервалів довірчих частот"обговорюється документ Едвіна Джейнеса, в якому є кілька справді хороших прикладів, які дійсно підкреслюють різницю між довірчими інтервалами та достовірними інтервалами. Особливо актуальним для цієї дискусії є Приклад 5, який обговорює різницю між достовірним та довірчим інтервалом для оцінки параметра усіченого експоненціального розподілу (для проблеми управління промисловим якістю). У прикладі, який він наводить, у вибірці є достатньо інформації, щоб бути впевненим, що справжнє значення параметра не знаходиться ніде у правильно побудованому 90% довірчому інтервалі!
Для когось це може здатися шокуючим, але причиною цього результату є те, що довірчі інтервали та достовірні інтервали - це відповіді на два різні запитання з двох різних інтерпретацій вірогідності.
Інтервал довіри - це відповідь на запит: "Надайте мені інтервал, який укладе в дужку справжнє значення параметра в % випадків експерименту, який повторюється велика кількість разів". Довіри інтервал є відповіддю на запит: «Дайте мені інтервал то, що дужки справжнє значення з імовірністю р . Даний конкретний зразок , я на самому ділі спостерігається » Для того, щоб бути в змозі відповісти на останній запит, ми повинні спочатку прийняти або (а ) нове поняття процесу генерації даних або (b) інше поняття визначення самої ймовірності. 100 сторp
Основна причина того, що будь-який конкретний 95-відсотковий інтервал довіри не передбачає 95% шансу утримувати середнє, полягає в тому, що довірчий інтервал є відповіддю на інше запитання, тому це лише правильна відповідь, коли відповідь на два питання трапляється на мають однакове числове рішення.
Коротше кажучи, надійні та довірчі інтервали відповідають на різні запитання з різних точок зору; обидва корисні, але вам потрібно вибрати правильний інтервал для питання, яке ви насправді хочете задати. Якщо ви хочете, щоб інтервал, який допускає інтерпретацію 95% (задньої) ймовірності містити справжнє значення, тоді виберіть надійний інтервал (а разом з цим супутню концептуалізацію ймовірності), а не довірчий інтервал. Що ви не повинні робити, це прийняти інше визначення ймовірності в інтерпретації, ніж те, яке використовується в аналізі.
Дякуємо @cardinal за його вдосконалення!
Ось конкретний приклад з чудової книги Девіда Макая "Теорія інформації, висновки та алгоритми навчання" (стор. 464):
Нехай параметр, що цікавить, буде а дані D - пара точок x 1 і x 2, проведених незалежно від наступного розподілу:θDх1х2
p ( x | θ ) = ⎧⎩⎨⎪⎪1 / 21 / 20x = θ ,x = θ + 1 ,о т ч е r w i s e
Якщо є 39 , то можна було б очікувати , щоб побачити набори даних ( 39 , 39 ) , ( 39 , 40 ) , ( 40 , 39 ) і ( 40 , 40 ) , все з однаковою ймовірністю 1 / 4 . Розглянемо довірчий інтервалθ39( 39 , 39 )( 39 , 40 )( 40 , 39 )( 40 , 40 )1 / 4
.[ θм я н( D ) , θм а х( D ) ] = [ m i n ( x1, х2) , m a x ( x1, х2) ]
Зрозуміло, що це допустимий 75% -ний довірчий інтервал, оскільки якщо ви повторно відібрали дані, , то багато разів тоді інтервал довіри, побудований таким чином, містив би справжнє значення 75% часу.D = ( х1, х2)
Тепер розглянемо дані . У цьому випадку часто-довірчий інтервал довіри 75% був би [ 29 , 29 ] . Однак, якщо припустити, що модель процесу генерації є правильною, θ в цьому випадку може бути 28 або 29, і ми не маємо підстав припускати, що 29 більше, ніж 28, тому задня ймовірність дорівнює p ( θ = 28 | D ) = р ( θ = 29 | D ) = 1 / 2D = ( 29 , 29 )[ 29 , 29 ]θp(θ=28|D)=p(θ=29|D)=1/2. Отже, у цьому випадку часто довірчий інтервал явно не є 75% достовірним інтервалом, оскільки існує лише 50% вірогідність того, що він містить справжнє значення , враховуючи, що ми можемо зробити висновок про θ з цього конкретного зразка .θθ
Так, це надуманий приклад, але якби довірчі інтервали та достовірні інтервали не відрізнялися, вони все одно були б ідентичними у надуманих прикладах.
Зауважте, що ключова відмінність полягає в тому, що інтервал довіри - це твердження про те, що трапилося б, якщо ви повторили експеримент багато разів, достовірний інтервал - це твердження про те, що можна зробити з цього конкретного зразка.