Що означає, що щось має хороші частолістські властивості?


12

Я часто чув цю фразу, але ніколи не розумів, що вона означає. В даний час фраза "хороші частолістські властивості" має близько 2750 звернень у Google, 536 - на scilar.google.com, а 4 - на statts.stackexchange.com .

Найближче, що я знайшов для чіткого визначення, походить з остаточного слайду в цій презентації університету Стенфорда , в якому йдеться

[T] Він має на увазі, що доповідь про 95% довірчих інтервалів полягає в тому, що ви «захоплюєте» справжній параметр у 95% заявок, які ви робите, навіть через різні проблеми з оцінкою. Це визначальна характеристика процедур оцінювання з хорошими частолістськими властивостями: вони піддаються ретельному контролю при багаторазовому використанні.

Розмірковуючи трохи про це, я припускаю, що словосполучення "хороші частістські властивості" передбачає деяку оцінку байєсівського методу, зокрема баєсовського методу побудови інтервалу. Я розумію, що байєсівські інтервали мають на увазі містити справжнє значення параметра з ймовірністю . Інтервали частоти повинні бути побудовані таким чином, що якщо, якщо процес побудови інтервалу повторювався багато разів, приблизно інтервалів містило б справжнє значення параметра. Байєсівські інтервали взагалі не дають жодних обіцянок щодо того, який% інтервалів покриє справжнє значення параметра. Однак, деякі байєсівські методи також мають властивість, якщо вони повторюються багато разів, вони покривають справжнє значення про p * 100 \%p 100 %pp100%p100%того часу. Коли вони володіють цією властивістю, ми говоримо, що вони мають "добрі властивості часто".

Це так? Я вважаю, що в цьому має бути більше, ніж це, оскільки ця фраза стосується хороших частолістських властивостей , а не володіння хорошим частолістським властивістю .


1
Мені дуже подобається, як ви продумували це запитання. У перші дні сер Гарольд Джеффріс намагався побудувати байєсівські задні розподіли, які поводилися як імовірнісні функції і, отже, мали хороші частолістські властивості. Отже, це означає побудову "рівномірного" попереднього розподілу. Ідея полягає в тому, що при використанні такого попереднього засобу пріоритет є нейтральним і не впливає на умовивід. Тож це стосується більше, ніж просто створення достовірних інтервалів схожими на довірчі інтервали. Але Джеффріс зіткнувся з деякими неприємностями, тому що були випадки, коли "рівномірний" попередній не був належним.
Майкл Р. Черник

1
Неправильне означає, що попередня щільність не інтегрується до 1. Схоже, Джеффрі вважав, що байєсівський метод потрібно виправдовувати, погоджуючись з методом частолістів. Врешті-решт байєси відкинули це поняття, оскільки цінність підходу, який вони заявляють, полягає в тому, що є попередня інформація, яка впливає на висновок, і тому вони вважають за краще використовувати належні "інформативні" пріори.
Майкл Р. Черник

2
@MichaelChernick: чи можете ви надати точну інформацію про Джефріса, який шукає частолістських властивостей для оцінок Байєса? Я ніколи не чув про цю історію. І я також сумніваюся, що Джеффрі взагалі хвилювався з приводу використання неправомірних пріорів, вони всюди переймаються Теорією ймовірності .
Сіань

Я люблю це питання!
Олексій

1
@ Xi'an насправді, для бета-біноміальної моделі це попередня Haldane (що є неправильною), що призводить до частолістської оцінки, а не до Джефріса (що в цьому випадку належним чином). Я також ніколи не чув, щоб Джеффрі шукав хороших частолістських властивостей: я думав, що він шукає об'єктивних пріорів, а під об'єктом мав на увазі інваріант під репараметризацією.
DeltaIV

Відповіді:


3

Складно в тому, що стосується хороших частотистських властивостей - це те, що вони є властивістю процедури, а не властивостями певного результату чи умовиводу. Хороша частолістська процедура дає правильні умовиводи щодо визначеної частки випадків у довгостроковій перспективі, але хороша байєсівська процедура часто є тією, яка дає правильні умовиводи в окремому випадку, про який йдеться.

Наприклад, розглянемо байєсівську процедуру, яка є "доброю" в загальному сенсі, оскільки вона забезпечує задній розподіл ймовірностей або достовірний інтервал, який правильно представляє поєднання доказів (функція ймовірності) з попереднім розподілом ймовірності. Якщо попередній вміст містить точну інформацію (скажімо, а не порожню думку чи якусь форму неінформативної попередньої), цей задній або інтервал може призвести до кращого висновку, ніж до частого результату з тих же даних. Краще в сенсі привести до більш точного висновку про цей конкретний випадок або більш вузький інтервал оцінки, оскільки процедура використовує індивідуальний попередній вміст точної інформації. Зрештою, на відсоток покриття інтервалів та правильність умовиводів впливає якість кожного попереднього.

Зауважте, що процедура не визначає, як слід отримати попередній результат, і тому довгостроковий облік результатів роботи, мабуть, передбачає будь-який попередній, а не заздалегідь призначений на замовлення для кожного випадку.

Байєсівська процедура може мати хороші частістські властивості. Наприклад, у багатьох випадках байєсівська процедура з рецептом, наданим неінформативним способом, матиме досить хороші та чудові властивості частолістів. Ці хороші властивості були б випадковістю, а не конструктивною ознакою, і були б прямим наслідком такої процедури, що давала б аналогічні проміжки часу, ніж процедури часто.

Таким чином, байєсівська процедура може мати чудові інфекційні властивості в індивідуальному експерименті, маючи при цьому погані частістські властивості в довгостроковій перспективі. Не менш важливо, що часті процедури з хорошими довгостроковими частолістськими властивостями часто мають низьку ефективність у випадку окремих експериментів.


2
Я не стежу за цим. За винятком емпіричного Байєса, у всіх байєсівських процедурах я бачив, що пріоритет вибирається незалежно від даних. Таким чином, застосовуючи таку процедуру до декількох наборів даних, що надходять з одного і того ж процесу генерування даних (це частістські рамки), байєсівці використовуватимуть ту саму функцію ймовірності (процес генерування даних однаковий) і той самий попередній (попередній незалежно від даних у більшості процедур Байєса). Звичайно, оскільки дані змінюються щоразу, величина ймовірності змінюється, але форма її однакова. Тепер, якщо кожен індивід [1/2]
DeltaIV

2
[2/2] оцінка є більш точною, як вся процедура може бути менш точною? Це можливо лише в тому випадку, якщо байєсівська оцінка не завжди є більш точною. Однак, оскільки попередній не налаштований на спостережувані дані, я не впевнений, що робить його більш-менш точним для кожного окремого випадку та / або "в середньому".
DeltaIV

@DeltaV Я думаю, що ви маєте справу з неправильним набором посилань. Часті властивості процедури стосуються довготривалого виконання процедури, застосовуваної у всіх нових випадках, а не лише до повторів конкретного експерименту. Ось чому процедури інтервалу довіри для біноміальних пропорцій повинні працювати для всіх значень параметра, а не лише для значення, яке стосується будь-якого конкретного екземпляра, де використовується процедура. Цей тип "довгого бігу" означає, що підготований до того, що відповідає конкретному випадку, буде недоречним для довгострокової перспективи.
Майкл Лев

Ви маєте рацію, що процедура часто довіри повинна мати номінальне покриття для всіх значень невідомого параметра. Це чітко вказали Newman & Pearson, і сьогодні це часто не помічають. Однак, вибираючи попереднє, ви не знаєте, яке саме "справжнє" значення параметра. У вас є лише зразок, а попередній повинен бути незалежним від вибірки. Таким чином, я все ще не бачу чітко, як ви могли налаштувати попереднє на основі вибірки. Чи можете ви зробити практичний приклад?
DeltaIV

@DeltaIV Якщо я знаю, що поточний параметр, що цікавить, був оцінений у попередньому дослідженні, то я можу сформувати інформаційний попередній на основі цієї оцінки. Цей попередній варіант буде доречним для цього поточного аналізу, але не існує еквівалентної відповідної інформативної інформації, доступної для умовного набору застосованих методів у довгостроковій перспективі. Таким чином, аналіз може мати набагато кращі властивості в ізольованому реальному випадку, ніж, здавалося б, в частому періоді.
Майкл Лев

2

Я відповів би, що ваш аналіз правильний. Для надання ще декількох відомостей я б зазначив відповідні пріори.

Відповідні пріори, як правило, є пріорами, розробленими для побудови байесівських моделей з частою ознакою. Зокрема, вони визначені таким чином, що отримані інтервали hpd задовольняють частість покриття довірчого інтервалу (тому 95% з 95% hpd містять справжні значення в довгостроковій перспективі). Зауважте, що в 1d є аналітичні рішення: пріори Джеффріса відповідають пріорам. У вищому вимірі це справа не обов'язкова (наскільки мені відомо, немає результату, який би підтвердив, що це ніколи не буває).

На практиці цей принцип узгодження іноді також застосовується для налаштування значення деяких параметрів моделі: дані основної істини використовуються для оптимізації цих параметрів у тому сенсі, що їх значення максимально збільшують частотне покриття отриманих достовірних інтервалів для параметра, що цікавить . З мого власного експерименту це може бути дуже тонким завданням.


0

Якщо я можу внести якийсь внесок, дозвольте спершу додати уточнення, а потім безпосередньо відповісти на ваше запитання. Існує багато плутанини щодо теми (фреквістські властивості байєсівської процедури), і навіть розбіжності серед фахівців. Перше неправильне уявлення: "Байєсівські інтервали мають на увазі містити справжнє значення параметра з ймовірністю ." Якщо ви чистий байєсів (той, хто не приймає жодного частолістського поняття для оцінки байєсівської процедури), не існує такого поняття, як "справжній параметр". Основна кількість зацікавлених, які є фіксованими параметрами у частістському світі, - випадкові величини в байєсівському світі. Як байєсист, ви не відновлюєте справжнє значення параметрів, а розподіл "параметрів" або їх моментів.p

Тепер, щоб відповісти на ваше запитання: ні, це не передбачає жодної оцінки байєсівського методу. Пропускання нюансів і зосередження уваги в процедурі оцінки, щоб зробити це просто: частота статистики - це ідея оцінки невідомої фіксованої кількості або тестування гіпотези та оцінка такої процедури на тлі гіпотетичного повторення її. Ви можете прийняти багато критеріїв для оцінки процедури. Що робить його частою критерієм, це те, що хтось дбає про те, що станеться, якщо повторно застосовувати ту саму процедуру. Якщо ви так робите, ви дбаєте про властивості частолістів. Іншими словами: "які властивості частолістів?" означає "що станеться, якщо ми повторимо процедуру знову і знову?" Тепер, що робить таких властивості частотних добреце ще один рівень критеріїв. Найпоширенішими частолістськими властивостями, які вважаються хорошими властивостями, є послідовність (за оцінкою, якщо ви продовжуєте вибірку, оцінювач буде збігатися з фіксованим значенням, яке ви оцінюєте), ефективність (якщо ви будете тримати вибірку, дисперсія оцінювача піде на нуль , тому ви будете все точнішими), ймовірність покриття(у багатьох повторах процедури процедура 95% довірчого інтервалу буде містити справжнє значення 95% часу). Перші два називаються великими властивостями вибірки, третя - властивістю Неймана, що є справді частофілістською, у тому сенсі, що їй не потрібно використовувати асимптотичні результати обов'язково. Отже, підсумовуючи, в частофілістських рамках є справжня і невідома цінність. Ви оцінюєте це, і ви завжди (за винятком рідкісної щасливої ​​випадковості) помиляєтесь в оцінці, але намагаєтесь врятувати себе, вимагаючи, щоб принаймні під гіпотетично невизначеним повторенням вашої оцінки ви будете все менше і менше помилятися аботи знаєш, що можеш мати рацію певну кількість разів. Я не буду обговорювати, чи має це сенс чи ні, чи додаткові припущення, необхідні для його обґрунтування, враховуючи, що це не ваші запитання. Концептуально - це саме те, про що говорять про часті властивості , і які хороші засоби взагалі означають у такому контексті.

Я закрию, вказавши на цей документ, щоб ви самі судили, чи є сенс і що це означає, що байєсівська процедура має хороші частолістські властивості (ви знайдете більше посилань там):

  • Little, R. та ін., (2011). Калібровані затоки для загальної статистики, зокрема відсутні дані. Статистична наука, 26 (2), 162–174.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.