Чому можна використовувати «випадкові» довірчі або достовірні інтервали?


16

Нещодавно я читав статтю, яка включала випадковість у її впевненість та достовірні інтервали, і мені було цікаво, чи це стандарт (і якщо так, то чому це розумно робити). Щоб встановити позначення, припустимо, що наші дані є і ми зацікавлені у створенні інтервалів для параметра . Я звик будувати інтервали довіри / достовірності, будуючи функцію:θ ΘxXθΘ

fx:Θ{0,1}

і нехай наш інтервал буде .I={θΘ:fx(θ)=1}

Це випадково в тому сенсі, що це залежить від даних, але умовно від даних це просто інтервал. Цей документ натомість визначає

gx:Θ[0,1]

а також сукупність iid однорідних випадкових змінних on [0,1] . Він визначає пов'язаний інтервал, який буде I = \ {\ theta \ в \ Theta \,: \, f_ {x} (\ theta) \ geq U _ {\ theta} \} . Зауважте, що це багато в чому залежить від допоміжної випадковості, крім того, що виходить з даних. [ 0 , 1 ] I = { θ Θ{Uθ}θΘ[0,1]I={θΘ:fx(θ)Uθ}

Мені дуже цікаво, чому б це зробити. Я думаю, що «розслаблення» поняття інтервалу від функцій, таких як fx до таких функцій, як gx має певний сенс; це якийсь зважений довірчий інтервал. Я не знаю жодних посилань на це (і вдячний би за будь-які вказівки), але це здається цілком природним. Однак я не можу придумати жодної причини, щоб додати допоміжну випадковість.

Будемо вдячні за будь-які вказівки до літератури / причини цього!


5
(+1) Це називається рандомізованою процедурою. Вони є стандартною частиною структури статистичного оцінювання та тестування, тому ви можете розраховувати майже на будь-який суворий підручник для надання пояснень. Додаткову мотивацію їх використання можна знайти в літературі з теорії ігор.
whuber

Дякуємо за відповідь. Після прочитання цього коментаря я зрозумів, що, наприклад, завантажувальна програма вписується в цю рамку, але в цій ситуації причина рандомізації зрозуміла (у вас немає доступу до f, просто g). У моєму випадку автори явно розраховують , а потім дивляться на . Хоча у мене є багато підручників із статистикою, я цього ніде не бачу ... чи є у вас запропонований текст? fxgx
QQQ

3
Насправді завантажувальний процес не є випадковою процедурою. Це визначена процедура, приблизний обчислення якої здійснюється за допомогою випадкової вибірки.
whuber

Відповіді:


4

Рандомізовані процедури іноді використовуються в теорії, оскільки це спрощує теорію. У типових статистичних проблемах це не має сенсу на практиці, тоді як в налаштуваннях теорії ігор це може мати сенс.

Єдиною причиною, яку я бачу використовувати на практиці, є те, якщо якимось чином спрощує обчислення.

Теоретично можна стверджувати, що його не слід застосовувати з принципу достатності : статистичні висновки повинні базуватися лише на достатній кількості підсумків даних, а рандомізація вводить залежність стороннього випадкового який не є частиною достатнього підсумків даних.U

UPDATE  

Щоб відповісти на коментарі Уубера, наведені нижче: "Чому рандомізовані процедури" не мають сенсу на практиці "? Як зазначали інші, експериментатори цілком готові використовувати рандомізацію при побудові своїх експериментальних даних, таких як рандомізоване призначення лікування та контролю , то чим настільки різний (і непрактичний чи заперечний) використання рандомізації при наступному аналізі даних? "

Що ж, рандомізація експерименту для отримання даних робиться з метою, головним чином, щоб розбити ланцюги причинності. Якщо і коли це ефективно - інша дискусія. Яка може бути мета використання рандомізації у складі аналізу? Єдина причина, яку я коли-небудь бачив - це робить математичну теорію більш повною! Це нормально, поки йде. У теорії ігор в контекстах ігор, коли є фактичний противник, рандомізація допоможе мені заплутати його. У контексті реального рішення (продати чи не продати?) Рішення має бути прийняте, і якщо в даних немає доказів, можливо, можна було б просто кинути монету. Але в науковому контексті, де питання полягає в тому, чого ми можемо навчитисяз даних, рандомізація здається не на місці. Я не бачу жодної реальної переваги від цього! Якщо ви не погоджуєтесь, чи є у вас аргументи, які можуть переконати біолога чи хіміка? (І тут я не думаю про моделювання як частину завантажувальної програми або MCMC.)


1
Чому рандомізовані процедури "не мають сенсу на практиці"? Як зазначали інші, експериментатори цілком готові використовувати рандомізацію при побудові своїх експериментальних даних, таких як рандомізоване призначення лікування та контролю, тому що настільки відрізняється (і непрактично чи заперечно) щодо використання рандомізації при наступному аналізі даних ?
whuber

1
@kjetil Я думаю, що ви, можливо, не завершили свою заяву про принцип достатності, вона, здається, була відрізана в середині речення ("статистичні висновки повинні ...").
Срібна рибка

1
U

1
@whuber: Це чіткий, принциповий аргумент, що рандомізація в отриманні даних може бути вигідною. (Розриває причинно-наслідкові ланцюги). Що це за принциповий аргумент для використання рандомізації як частини аналізу?
kjetil b halvorsen

1
Kjetil: Це дозволяє вам досягти наміченої функції ризику, а не приймати функцію ризику (часто у формі номінального розміру та потужності), що не є тим, чого ви хотіли. Більше того, якщо процедура є "теоретично" корисною, то, звичайно, не може бути заперечень щодо її використання на практиці, окрім нездійсненності (що, як правило, не відбувається в рандомізованих процедурах). Таким чином, ваше запитання має бути повернено на голову: на вас лежить тягар, щоб продемонструвати, що з використанням рандомізованих процедур щось не так Як ви це можете досягти, не суперечивши собі?
whuber

3

Ідея стосується тестування, але з огляду на подвійність тестування та довірчі інтервали, та ж логіка стосується ІС.

В основному, рандомізовані тести гарантують, що заданий розмір тесту може бути отриманий і для дискретних експериментів.

α=0.05pH0:p=0.5H1:p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


α

Добре, це, напевно, повертає нас до історії статистики, коли Р. А. Фішер дещо довільно вирішив працювати з рівнем значущості в 5%, щоб вирішити, чи є якісь початкові докази необхідними для подальшого вивчення. Як ми знаємо, 5% з тих пір перетворилося на своєрідний золотий стандарт у багатьох галузях, незважаючи на відсутність хороших теоретичних підстав для прийняття рішень.
Крістоф Хенк
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.