Інтервали прогнозування та толерантності


11

У мене є пара запитань щодо прогнозування та інтервалів допуску.

Давайте погодимось спочатку з визначенням інтервалів допусків: нам дають рівень довіри, скажімо, 90%, відсоток населення, який охоплює, скажімо, 99%, і розмір вибірки, скажімо 20. Розподіл ймовірностей відомий, скажімо, нормальний для зручності. Тепер, з огляду на три вищенаведені числа (90%, 99% та 20) та той факт, що базовий розподіл є нормальним, ми можемо обчислити число допуску . З огляду на вибірку із середнім та стандартним відхиленням , інтервал допуску становить . Якщо цей інтервал толерантності охоплює 99% населення, то вибірка називається успішноюk(x1,x2,,x20)x¯sx¯±ks(x1,x2,,x20)і вимога полягає в тому, що 90% зразків є успіхами .

Коментар: 90% - це апріорна ймовірність успіху вибірки. 99% - це умовна ймовірність того, що майбутнє спостереження буде знаходитись в інтервалі допуску, враховуючи, що вибірка є успішною.

Мої запитання: Чи можна розглядати інтервали прогнозування як інтервали допуску? Дивлячись в Інтернеті, я отримав суперечливі відповіді на це, не кажучи вже про те, що ніхто насправді ретельно не визначав інтервали прогнозування. Отже, якщо у вас є чітке визначення інтервалу прогнозування (або посилання), я би вдячний.

Я зрозумів, що, наприклад, інтервал прогнозування 99% не охоплює 99% усіх майбутніх значень для всіх зразків. Це було б те саме, що інтервал допуску, який захоплює 99% населення зі 100% вірогідністю.

У визначеннях, які я знайшов для інтервалу прогнозування 90%, 90% - це апріорна ймовірність даної вибірки, скажімо, (розмір фіксований) та єдине майбутнє спостереження , що буде в інтервалі прогнозування Отже, схоже, що і вибірку, і майбутнє значення дають одночасно, на відміну від інтервалу допуску, де дана вибірка і з певною вірогідністю є успішною , і за умови, що вибірка є успіхy y(x1,x2,,x20)yy, задається майбутнє значення і з певною вірогідністю потрапляє в інтервал допуску. Я не впевнений, чи є правильним наведене вище визначення інтервалу прогнозування, але це здається контрінтуїтивним (принаймні).

Будь-яка допомога?


4
Односторонні інтервали допуску для звичайного відбору проб можуть допомогти зрозуміти це поняття. Верхня межа толерантності - це не що інше, як верхня межа довіри з -квантилу передбачуваного розподілу моделі. Тому у випадку нормального розподілу це верхня межа довіри параметра де становить від стандартного гауссового розподілу. 99 % μ + k σ k = z 99 % 99 %99%99%μ+kσk=z99%99%
Стефан Лоран

Це хороше переформулювання, Стефане, тому що воно відразу ж показує, що існує кілька видів меж допуску: можна попросити верхню межу довіри на , для нижньої межі довіри на або для (скажімо) неупередженої оцінки цього параметра. Усі три в літературі називаються "межами толерантності". μ + z 0,99 σμ+z0.99σμ+z0.99σ
whuber

Думаю, ви скоріше хотіли сказати нижню межу довіри на ? μz0.99σ
Стефан Лоран

2
Насправді ні, Stéphane (саме тому я подбав про повторення формули для параметра). Існують також три подібні визначення для нижньої межі допуску. Наприклад, ми могли б під -Оцінку верхньої 99 - й процентиль населення, але контролювати кількість недооцінки ми наполягаємо там бути (скажімо) на 5% ймовірність того, що наша занижена ще буде занадто високою. Це дозволить нам сказати такі речі, як "Дані показують, з 95% впевненістю, що 99-й відсоток населення перевищує таке і таке значення".
whuber

Відповіді:


14

Ваші визначення здаються правильними.

Книга консультуйтеся цих питаннях Інтервали статистичний (Gerald Hahn & William Meeker), 1991. Я цитую:

Інтервал прогнозування для одного майбутнього спостереження - це інтервал, який з визначеним ступенем впевненості буде містити наступне (або якесь інше заздалегідь визначене) випадкове обране спостереження з популяції.

[A] Інтервал допуску - це інтервал, на який можна стверджувати, що містить хоча б певну частку, p , населення з визначеним ступенем впевненості, .100(1α)%

Ось перекази в стандартній математичній термінології. Нехай дані вважаються реалізацією незалежних випадкових величин із загальною функцією кумулятивного розподілу . ( з'являється як нагадування про те, що може бути невідомим, але вважається, що він лежить у заданому наборі розподілів ). Нехай - ще одна випадкова величина з тим же розподілом і незалежна від перших змінних.X = ( X 1 , , X n )x=(x1,,xn)X=(X1,,Xn) θ F F θ | θ Θ X 0 F θ nFθθFFθ|θΘX0Fθn

  1. Інтервал передбачення (для одного спостереження в майбутньому), визначається кінцевими точками , має визначальне властивість,[l(x),u(x)]

    infθ{Prθ(X0[l(X),u(X)])}=100(1α)%.

    Зокрема, посилається на розподіл змінних визначений законом . Зверніть увагу на відсутність будь-яких умовних ймовірностей: це повна спільна ймовірність. Зауважте також, відсутність будь-яких посилань на тимчасову послідовність: дуже добре може спостерігатися в часі перед іншими значеннями. Це не має значення. n+1Prθn+1(X0,X1,,Xn)FθX0

    Я не впевнений, який із аспектів цього може бути "контрінтуїтивним". Якщо ми бачимо вибір статистичної процедури як діяльності, яку слід здійснювати до збору даних, то це природна і розумна постановка запланованого двоступеневого процесу, оскільки обидва дані ( ) і "майбутнє значення" потрібно моделювати як випадкове.Xi,i=1,,nX0

  2. Інтервал допуску, визначається кінцевими точками , має визначальне властивість , що(L(x),U(x)]

    infθ{Prθ(Fθ(U(X))Fθ(L(X))p)}=100(1α)%.

    Зверніть увагу на відсутність будь-яких посилань на : він не грає ніякої ролі.X0

Коли є набором нормальних розподілів, існують інтервали передбачення форми{Fθ}

l(x)=x¯k(α,n)s,u(x)=x¯+k(α,n)s

( - середня вибірка, - стандартне відхилення вибірки). Значення функції , які Хан і Мекер складають, не залежать від даних . Існують і інші інтервали прогнозування, навіть у звичайному випадку: це не єдині.x¯skx

Так само існують інтервали допуску форми

L(x)=x¯K(α,n,p)s,U(x)=x¯+K(α,n,p)s.

Існують інші процедури інтервалу допуску : це не єдині.

Зазначаючи подібність цих пар формул, ми можемо вирішити рівняння

k(α,n)=K(α,n,p).

Це дозволяє інтерпретувати інтервал прогнозування як інтервал допуску (різними можливими способами, змінюючи і ) або повторно інтерпретувати інтервал допуску як інтервал передбачення (тільки зараз зазвичай однозначно визначається і ). Це може бути одним із джерел плутанини.αpααp


2
Плутанина між цими інтервалами реальна. Десять років тому я мав кілька складних розмов з державним статистиком, який не знав різниці і (вірулентно) не зміг визнати, що існує. Її помітна роль у створенні керівництва, перегляді звітів, консультуванні працівників справи, розповсюдженні програмного забезпечення та навіть рецензованій публікації сприяла продовженню цих помилок. Тож будьте обережні!
whuber

Дуже приємна відповідь, дякую. У мене було серце деяких статистиків, які говорять, що інтервал прогнозування є інтервалом допуску з . Чи є за цією ідеєю справжній факт? Іншими словами, чи правда, що , чи щось подібне? p=50%k(α,n)=K(α,n,0.5)
Стефан Лоран

3
Ні, це неправда @ Stéphane. Щоб зрозуміти, чому ні, розглянемо випадок надзвичайно великої та помірної впевненості, скажімо, 95%. При інтервал двостороннього допуску повинен бути надзвичайно близьким до середнього 50% розподілу, тому за визначенням є лише 50% шансів, що лежить всередині нього, а не бажаних 95%. Це величезна різниця! Інтуїтивно зрозуміло, що інтервал допуску для 95% населення повинен бути наближеним до інтервалу прогнозування з 95% впевненістю, але вони все ще точно не згодні. np=50%X0
whuber

Я щойно думав про це, і вважаю, що факт полягає в наступному: коли великий. Це легко зрозуміти, коли - класичний коефіцієнт допуску, заданий за допомогою нецентрального розподілу t ( -кількість - параметр )k(α,n)K(50%,n,1α)nK50%z1α/n
Стефан Лоран

@whuber. Дякую за відповідь. Мені доведеться переконатися, що я це розумію, перш ніж зазначити це правильно. Дайте мені трохи часу, щоб "перетравити" це.
Іоанніс Солдатос

1

Як я розумію, для нормальних меж толерантності значення походить від не центрального t перцентиля. Зрозуміло, що, на думку Гу Губера, є деякі статистики, незнайомі з ідеєю меж толерантності та меж прогнозування; Ідея толерантності, здається, виникає здебільшого в інженерному проектуванні та виробництві, на відміну від клінічної біостатистики. Можливо, причиною недостатнього ознайомлення з інтервалами допуску та плутаниною з інтервалами прогнозування є той контекст, в якому людина отримує свою статистичну підготовку.K(α,p)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.