Багато людей (поза експертами-спеціалістами), які вважають, що вони часто, є насправді баєсами. Це робить дебати трохи безглуздими. Я думаю, що байєсіанство перемогло, але все ж є багато баєсів, які вважають, що вони часто. Є люди, які думають, що вони не використовують пріорів, і тому вони вважають, що вони часто. Це небезпечна логіка. Мова йде не стільки про пріорів (рівномірних пріорів чи нерівномірних), реальна різниця більш тонка.
(Я офіційно не у відділі статистики; моє знання - математика та інформатика. Я пишу через труднощі, які я намагався обговорити цю «дискусію» з іншими нестатистами, і навіть з деякою ранньою кар'єрою статистики.)
MLE - насправді байєсівський метод. Деякі люди скажуть: "Я частість, тому що я використовую MLE для оцінки своїх параметрів". Я це бачив у рецензованій літературі. Це нісенітниця і ґрунтується на цьому (несказаному, але мається на увазі) міфі, що частофіліст - це той, хто використовує єдину форму замість нерівномірного попереднього).
Розглянемо малювання єдиного числа із звичайного розподілу із відомим середнім значенням та невідомою дисперсією. Назвіть цю дисперсію .μ=0θ
X≡N(μ=0,σ2=θ)
Тепер розглянемо функцію ймовірності. Ця функція має два параметри, і і вона повертає ймовірність, задану , .xθθx
f(x,θ)=Pσ2=θ(X=x)=12πθ√e−x22θ
Ви можете уявити, як побудувати це в тепловій карті, з на осі x та на осі y, та використовуючи колір (або вісь z). Ось сюжет, з контурними лініями та кольорами.xθ
По-перше, кілька спостережень. Якщо ви фіксуєте одне значення , ви можете взяти відповідний горизонтальний зріз через теплову карту. Цей фрагмент дасть вам pdf для цього значення . Очевидно, що площа під кривою у цьому зрізі буде 1. З іншого боку, якщо ви фіксуєте одне значення , а потім подивитесь на відповідний вертикальний зріз, то такої гарантії щодо площі під кривою немає. .θθx
Ця різниця між горизонтальними та вертикальними зрізами має вирішальне значення, і я виявив, що ця аналогія допомогла мені зрозуміти частістський підхід до зміщення .
Байєсівський хто - то , хто говорить
Для цього значення x, які значення дають 'досить високе' значення ?.θf(x,θ)
Крім того, байєсівський може включати пріоритет, , але вони все ще говорять про цеg(θ)
для цього значення x, які значення дають досить високе значення ?f ( x , θ ) g ( θ )θf(x,θ)g(θ)
Отже, Байєс виправляє х і дивиться на відповідний вертикальний зріз у цій контурній ділянці (або у варіантному графіку, що включає попередній). У цьому зрізі площа під кривою не повинна бути 1 (як я вже говорив раніше). 95% достовірний інтервал Байєса (CI) - це інтервал, який містить 95% доступної площі. Наприклад, якщо площа дорівнює 2, то площа під байєсівською CI повинна бути 1,9.
З іншого боку, частофіліст буде ігнорувати х і спочатку розглянути питання про виправлення та попросить:θ
Для цього , які значення x найчастіше з'являться?θ
У цьому прикладі з одна відповідь на це питання частолістінгу: "Для даної 95% з'явиться між і . "θ x - 3 √N(μ=0,σ2=θ)θx +3 √−3θ√+3θ√
Тож частість більше стосується горизонтальних ліній, що відповідають фіксованим значенням .θ
Це не єдиний спосіб побудувати частолістський CI, він навіть не хороший (вузький), але потерпіть зі мною на мить.
Найкращий спосіб інтерпретувати слово 'інтервал' - це не як інтервал на 1-й рядку, а мислити його як область у вищезгаданій 2-й площині. "Інтервал" - це підмножина двовимірної площини, а не жодної 1-d лінії. Якщо хтось пропонує такий «інтервал», то нам доведеться перевірити, чи «інтервал» дійсний на рівні 95% надійності / надійності.
Частіст перевіряє чинність цього «інтервалу», розглядаючи по черзі кожен горизонтальний зріз і дивлячись на область під кривою. Як я вже говорив, площа під цією кривою завжди буде цілою. Найважливішою вимогою є те, щоб площа у межах «інтервалу» була не менше 0,95.
Байєсів перевірить дійсність, замість того, щоб подивитися на вертикальні фрагменти. Знову площу під кривою буде порівнювати з підмайстром, що знаходиться під інтервалом. Якщо останній становить щонайменше 95% від першого, то "інтервал" є дійсним 95% достовірним інтервалом Байєса.
Тепер, коли ми знаємо, як перевірити, чи певний інтервал є "дійсним", питання полягає в тому, як вибрати найкращий варіант з дійсних варіантів. Це може бути чорним мистецтвом, але, як правило, ви хочете найвужчий інтервал. Обидва підходи тут, як правило, погоджуються - вертикальні зрізи розглядаються, а мета полягає в тому, щоб інтервал був максимально вузьким у межах кожного вертикального фрагмента.
У вищенаведеному прикладі я не намагався визначити найбільш вузький можливий частотистський інтервал довіри. Дивіться коментарі @cardinal нижче для прикладів більш вузьких інтервалів. Моя мета - не знайти найкращі інтервали, а підкреслити різницю між горизонтальним та вертикальним зрізами у визначенні достовірності. Інтервал, який задовольняє умовам 95% частотного довірчого інтервалу, зазвичай не задовольняє умовам 95% достовірного інтервалу Байєса, і навпаки.
Обидва підходи бажають вузьких інтервалів, тобто, розглядаючи один вертикальний зріз, ми хочемо зробити інтервал (1-d) у цьому зрізі максимально вузьким. Різниця полягає в тому, як примусово застосовується 95% - частофіліст дивитиметься лише на запропоновані інтервали, коли 95% площі кожного горизонтального зрізу знаходяться під інтервалом, тоді як байєсівський наполягає на тому, щоб кожен вертикальний зріз був таким, щоб 95% його площі було під інтервал.
Багато нестатистів цього не розуміють, і вони зосереджуються лише на вертикальних зрізах; це робить їх баєсами, навіть якщо вони думають інакше.