Чи визнає Байєс, що існує одне фіксоване значення параметра?


39

У баєсівському аналізі даних параметри трактуються як випадкові величини. Це випливає з байєсівської суб'єктивної концептуалізації ймовірності. Але чи теоретично байєси визнають, що в реальному світі є одне справжнє фіксоване значення параметра?

Здається, очевидною відповіддю є «так», тому що тоді намагатися оцінити параметр було б майже безглуздим. Цитувальна академічна цитата на цю відповідь буде дуже вдячна.


2
Дайте мені цей параметр, і я визначу його розподіл. :-)
Енн ван Россум

Відповіді:


42

ІМХО «так»! Ось одна з моїх улюблених цитат Гренландії (2006: 767):

Часто говорять (неправильно), що "параметри трактуються як фіксовані частолістськими, але як випадкові байєсівські". Для часто відвідувачів і байєсів значення параметра може бути зафіксовано з самого початку або може бути сформовано за допомогою фізично випадкового механізму. В будь-якому випадку обидва припускають, що він набув певного значення, яке ми хотіли б знати. Байєсські використовують формальні моделі ймовірності, щоб висловити особисту невпевненість у цьому значенні. «Випадковість» у цих моделях представляє особисту невизначеність щодо значення параметра; це не властивість параметра (хоча ми сподіваємось, що він точно відображає властивості механізмів, які створили параметр).

Гренландія, С. (2006). Байєсські перспективи епідеміологічних досліджень: I. Основи та основні методи. Міжнародний журнал епідеміології , 35 (3), 765–774.


2
Будучи трохи протилежним, чи не можна було стверджувати, що (положення, імпульс) частинки - це "параметр", який ми можемо спробувати оцінити? Можна стверджувати, що не існує "фіксованого" значення цього параметра, і що ми справді повинні розглядати його як розподіл. Що стосується невідомих конкретно як розподілів, а не фіксованих значень, те, що природа робить у певних ситуаціях. Я не думаю, що це міркування дуже привабливе для байєсів на практиці, але я думаю, що для повного відповіді на питання ОП потрібне певне обговорення природи випадковості.
хлопець

3
Я не бачу, що є «неконфесійним» у розгляді розподілу як цілі висновку. Дійсно, індексування речей за параметрами все одно необов’язкове, наприклад, можна стверджувати свою невизначеність, використовуючи безпосередньо розподіл по функціях (див. Ніл та Вільямс про Гауссові процеси). І не потрібно мати особливого уявлення про "випадковість", щоб представити невизначеність з обчисленням ймовірності. Умовивід на основі вибірки (теорії) , можливо чи потрібна така теорія, але, наскільки я можу бачити Bayesianism не є (або , по крайней мере , не потрібно.)
conjugateprior

2
Я не згоден з тим, що байєсовський припускає, що параметр має фіксоване значення, і визначає параметр як розподіл, а не як точка, лише їх особиста невизначеність. Я намагався розширити це у своїй відповіді. Ваша особиста / теоретична невизначеність є частиною розподілу, але мені здається, що ваша модель по суті є усередненням змінних, які залишилися поза моделлю і які створюють розподіл, навіть якщо ваші особисті пріори дуже точні.
Уейн

29

Байєсівська концепція ймовірності не обов'язково є суб'єктивною (пор. Jaynes). Важливою відмінністю тут є те, що Байєс намагається визначити свій стан знань щодо значення параметра, поєднуючи попередній розподіл для його правдоподібного значення з ймовірністю, яка узагальнює інформацію, що міститься в деяких спостереженнях. Отже, як баєсів, я б сказав, що я задоволений думкою про те, що параметр має справжнє значення, яке точно не відомо, і мета заднього розподілу полягає в тому, щоб узагальнити те, що я знаю про його правдоподібні значення, виходячи з моїх попередніх припущень та спостережень.

Тепер, коли я роблю модель, модель не є реальністю. Так, в деяких випадках відповідний параметр існує насправді (наприклад, середня вага матки), а в деяких питаннях він не відповідає (наприклад, справжнє значення параметра регресії - модель регресії є лише моделлю результату фізичні закони, що керують системою, які фактично можуть не бути повністю зафіксовані моделлю регресії). Отже, щоб сказати, що в реальному світі є одне справжнє значення фіксованого параметра, необов'язково істинно.

З іншого боку, я б припустив, що більшість лікарів-лікарів скажуть, що існує одна справжня цінність для статистики, але вони також не знають, що це таке, але вони мають оцінювачі для цього та довірчі інтервали, які оцінюють (у певному сенсі) ) кількісно оцінює їхню непевність щодо правдоподібності різних значень (але частофілістське уявлення про ймовірність заважає їм виражати це як прямо).


Я завжди вважав, що "суб'єктивні ймовірності" називаються суб'єктивними, оскільки вони стосуються властивості суб'єкта, що робить розрахунок (тобто її знань), а не властивості об'єктивної реальності (наприклад, розподіл ваги не досконало-справедливих кісток).
nikie

1
@nikie існують принципи, такі як MaxEnt та групи перетворень для визначення пріорів об'єктивним способом. У цьому випадку обчислення дають ту саму відповідь незалежно від того, хто чи що виконує розрахунок (робот прийшов би до того ж висновку). Статистика частотологів не позбавлена ​​суб'єктивності, наприклад, як встановити для тестів на гіпотези, але наміром було вилучити суб'єктивність зі статистики в розумінні "особистої ймовірності / віри", а не "ступеня правдоподібності" (IIRC) . α
Дікран Марсупіал

Я знаю, але вони все ще суб'єктивні ймовірності, правда? Тому що вони все ще описують знання суб'єкта про якийсь параметр (який для
частолюбителя

Тема не обов'язково. Набір роботів чи комп’ютерів може виконати один і той же розрахунок і дійти одного і того ж висновку, використовуючи часто-чи об'єктивістський байєсівський підхід. Це стан знань, незалежно від суб'єкта , який здійснює розрахунок, тому вона є об'єктивною , а не суб'єктивною.
Дікран Марсупіал

16

На вашу думку, в Bayesian Data Analysis (3-е видання, 93) також пише Гельман

З точки зору аналізу даних Баєса, ми часто можемо інтерпретувати класичні точкові оцінки як точні або приблизні задні підсумки на основі якоїсь неявної моделі повної ймовірності. Насправді, в межах великого розміру вибірки, ми можемо використовувати асимптотичну теорію для побудови теоретичного байєсівського обґрунтування класичного максимуму імовірності висновку.

Тож, можливо, не байєзці повинні "визнати", що насправді є єдині реальні значення параметрів, але часто відвідувачі, які повинні звернутися до байєсівської статистики, щоб виправдати свої процедури оцінки! (Я кажу це язиком твердо в щоку.)

Як осторонь, я заперечую проти твердої заяви про те, що байєсівська статистика базується на суб'єктивній ймовірності, і на думку про те, що Байєс є суб'єктивним, а інші інфекційні парадигми - ні. Це, безумовно, один аргумент, який може бути викладений, можливо, також включає перспективу аргументації "узгодженості ставок", але див. Гельман, який тут визначає "Баєсіан" як статистик, який використовує задній розподіл , і тут, де він заперечує надмірно обмежувальні визначення.Pr(θ|y)

Але думка про існування одиничних параметрів у природі або в соціальних системах - лише спрощення припущення. Можливо, є якийсь вишуканий процес, що дасть спостережувані результати, але виявити цю систему надзвичайно складно; припустимо, що існує одне значення фіксованого параметра, значно спрощує проблему. Я думаю, що це вирішує основну частину вашого питання: Байєси не повинні «визнавати» здійснення цього спрощення більше, ніж слід часто.


Ви б не хотіли детальніше зупинитися на тому, чому ви відкидаєте байєсівські умовиводи, спираючись на суб'єктивну ймовірність? Вступні тексти, які я читав (Крушке, Лінч), схоже, так і рамкують. Хіба що це лише частково суб'єктивно (походить від попереднього)?
ATJ

@ATJ Я сподіваюся, що це прояснить мою думку. Є й інші аргументи, які можна просунути, але справжнім моментом для мене було неявне припущення, що статистика Байєса є суб'єктивною таким чином, як інші парадигми. Наприклад, я б заперечував характеристиці в цитаті Бернда, тому що це виглядає так само "особистим", що надає перевагу методу неупередженої оцінки точки над рамкою задньої мінливості.
Відновіть Моніку

@ATJ, вступні тексти розповідають історію для мотивації методів. Щось подібне до цієї історії, можливо, спочатку мотивувало методи. Але це не означає, що ця історія має великий вплив на припущення, які люди роблять, застосовуючи ці методи на практиці. (І ця історія може бути нісенітницею. Наприклад, думка про те, що ймовірності, пов’язані зі статистикою, можна визначити за частотою так, як іноді говорять вступні тексти частолістів, не має сенсу - документи "15 аргументів" Google Алана Гаека Це не означає, що статистика часто працює, вона є.)
Марс,

8

Як ви вважаєте, чи існує єдиний «справжній фіксований параметр» для чогось такого, як внесок випивання молока у ріст дитини? Або для зменшення розміру пухлини в залежності від кількості хімічної речовини X, яку ви вводите в організм пацієнта? Виберіть будь-яку модель, з якою ви знайомі, і запитайте себе, чи дійсно ви вірите, що існує одне справжнє, універсальне, точне і фіксоване значення для кожного параметра, навіть теоретично.

Ігноруйте помилку вимірювання, просто подивіться на свою модель так, ніби всі вимірювання були ідеально точними та нескінченно точними. З огляду на вашу модель, чи вважаєте ви, що кожен параметр реально має певне бальне значення?

Той факт, що у вас є модель, свідчить про те, що ви залишаєте деякі деталі. Ваша модель матиме точну точність, оскільки ви усереднюєте параметри / змінні, які ви залишили, щоб зробити модель - спрощене представлення реальності. (Так само, як ви не робите карту планети 1: 1 з усіма деталями, а скоріше карту 1: 10000000, або якесь таке спрощення. Карта є моделлю.)

З огляду на те, що ви усереднюєте ліві змінні параметри, параметрами змінних, які ви включаєте у свою модель, будуть розподіли, а не балові значення.

Це лише частина байєсівської філософії - я ігнорую теоретичну невизначеність, невизначеність вимірювань, пріори тощо, але мені здається, що думка про те, що ваші параметри мають розподіли, має інтуїтивний сенс так само, як і описова статистика розповсюдження.


6

Але чи теоретично байєси визнають, що в реальному світі є одне справжнє фіксоване значення параметра?

На мою думку, відповідь - так. Існує невідоме значення параметра і попередній розподіл описує наші знання / невизначеність щодо нього. У байєсівському математичному моделюванні розглядається як реалізація випадкової величини після попереднього розподілу.θ0θ0


Що саме є , тобто що являє собою цей індекс ? 0θ00
nbro

2

Якщо ми з’єднаємо байєсіанство з детермінованим всесвітом (перш ніж ти скажеш що-небудь із словом "квант" в ньому, принизи гумором і згадаймо, що це не Physics.stackexchange), ми отримаємо цікаві результати.

Робіть наші припущення явними:

  1. У нас є байєсівський агент, який є частиною та спостерігає за детермінованою всесвітом.
  2. Агент має обмежені обчислювальні ресурси.

Тепер детермінований Всесвіт може бути таким, де атоми є маленькими більярдними кульками ньютонів. Це може бути зовсім не квантовим. Скажімо, так і є.

Агент зараз гортає справедливу монету. Подумайте про це на секунду, що являє собою справедлива монета у детермінованому Всесвіті? Монета, яка має коефіцієнт ймовірності 50/50?

Але це детерміновано! Маючи достатню обчислювальну потужність, ви зможете точно розрахувати, як приземлиться монета, чисто імітуючи модель монети, яка перевертається таким же чином.

У детермінованому Всесвіті справедливою монетою був би диск з металу однакової щільності. Жодна сила не змушує її проводити більше часу однією обличчям вниз, ніж іншою (подумайте, як функціонує зважена кістка.)

Так агент перекидає справедливу монету. І все-таки агент не досить потужний. У нього недостатньо гострих очей, щоб виміряти, як монета крутиться при переверненні, вона бачить, але не розмиття.

І так сказано: "Ця монета приземлить голови з 50% ймовірністю". Брак інформації призводить до ймовірностей.

Ми можемо подивитися на фазовий простір того, як кидається монета. Велика багатовимірна система координат з осями, що відносяться до напрямку кидка, сили кидання, віджиму монети, швидкості та напрямку вітру тощо. Єдина точка в цьому просторі відповідає одному можливому монетному перевороту.

Якщо ми попросимо агента раніше зафарбовувати в системі координат градієнт сірого масштабу, відповідний призначенню агентом ймовірності головок за кожен заданий кидок, він найбільше забарвить його в рівномірний відтінок сірого.

Якщо ми поступово надамо йому більш потужні внутрішні комп’ютери, за допомогою яких можна обчислити ймовірності голів, він зможе робити все більш вибагливі забарвлення. Коли ми, нарешті, подаруємо йому найпотужніший внутрішній комп'ютер, зробивши його всезнаючим, він ефективно намалювати дивну шахівницю.

Ярмарок монет не складається з вірогідностей, вони виготовлені з металу. Ймовірності існують лише в обчислювальних структурах. Так каже байєсів.


-3

Є неправі пріори, наприклад, Джеффріс, який має певне відношення до матриці інформації Fisher. Тоді це не суб’єктивно.


2
Не могли б ви детальніше розповісти про те, як попереднє значення Джеффріса та його відношення до інформаційної матриці Фішера означає, що байєсівський висновок не є суб'єктивним? Як я розумію, головна причина використання попереднього Джеффріса полягає в тому, що він інваріантний альтернативним параметризаціям моделі. Крім того, у багатовимірній обстановці попередній показ Джефріса може стати високоінформативним, а результати суперечливими (Gelman, BDA 3, p. 53). Чи це підриває його "об'єктивність"?
Відновіть Моніку

@ user777, оскільки він заснований на параметрах щільності на руці є об'єктивним. Припустимо, я помножую ймовірність на 1, чи маю я тоді суб'єктивний характер для ймовірності? Оскільки задня ймовірність пов'язана з попередньою вірогідністю x.
Аналітик

І частоліст також повинен посилатися на Аксіому Істинної моделі, якщо вони хочуть використовувати ймовірність ... :)
Аналітик
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.