Чи існують розбіжності в байєсівському та частістському підходах до ЗНО?


14

Простіше кажучи: Чи є якісь відмінності в байєсівському та частотологічному підходах до дослідницького аналізу даних?

Я не знаю жодних властивих упередженості методам ЕДА, оскільки гістограма - це гістограма, розсіювач - це розсіювач тощо, і я не знайшов прикладів відмінностей у тому, як навчають чи представляють ЕДА (ігноруючи особливо теоретичний документ А. Гельмана) . Нарешті, я подивився на CRAN, арбітра всіх застосованих речей: я не знайшов пакунків, пристосованих до байєсівського підходу. Однак я подумав, що в CV може бути декілька людей, які можуть прояснити це.

Чому мають бути різниці?

Для початківців:

  1. Визначаючи відповідні попередні розподіли, чи не слід це візуально досліджувати?
  2. Узагальнюючи дані та пропонуючи використовувати частолістську чи баєсовську модель, чи не повинен EDA підказувати, в якому напрямку рухатися?
  3. Два підходи мають дуже чіткі відмінності щодо поводження з моделями сумішей. Виявлення того, що вибірка, ймовірно, походить із суміші популяцій, є складним і безпосередньо пов'язана з методологією, що використовується для оцінки параметрів суміші.
  4. Обидва підходи включають стохастичні моделі, і вибір моделі визначається розумінням даних. Більш складні дані або більш складні моделі вимагають більше часу в EDA. З такими відмінностями між стохастичними моделями або процесами генерації існують відмінності в діяльності ОВР, тож чи не повинні бути відмінності, що виникають внаслідок різних стохастичних підходів?

Примітка 1: Я не переймаюся філософіями будь-якого "табору" - я хочу лише вирішити будь-які прогалини в моєму наборі інструментів і методах EDA.

Відповіді:


17

На мій погляд, Байес проти частолістів стосується формального висновку, а дослідницький аналіз даних - це не те.

Звичайно, якщо мова йде про оцінку моделі / аналіз придатності та чутливості, в якій я класифікував би ваші бали (1), (3) та (4), будуть різниці в тому, як діяти, але це тому, що характер відмінностей між методом аналізу та обчислення, а не філософією.

Щодо Вашого (2), я, як правило, не бачу результатів ЗНО, що спрямовують Вас на байєсівський або фркентистський підхід, але, швидше за все, я вважаю, що це було найбільш важливою метою дослідження.

Для мене особисто, EDA (плюс глибокий самоаналіз) вказував би на модель, і якби я міг знайти природний частістський підхід, який досить добре відповів би на наукове питання, я б пішов з цим, але якби за характером ситуації , жоден частолістський метод не спрацював би добре, і якби раніше було розумно, я б застосував Байєса.


(+1) Дуже добре сказано - особливо, "EDA (плюс глибокий самоаналіз) вказував би мені на модель"
suncoolsu

Також +1. EDA насправді не полягає у виборі перспективи, а в розумінні ваших даних для прийняття більш обгрунтованих рішень.
Фоміт

+1 За гарну відповідь. На жаль, я вважаю, що оригінальне питання було неправильно зрозумілим. Я не питав про те, як використовувати EDA для вирішення між моделями Bayesian або часто. Мені потрібно переглянути, як я це висловив, якщо здається, що у кількох людей однакове непорозуміння.
Ітератор

@ Ітератор Я розумію, що ваше головне питання: чи існують відмінності між підходами байесів і часто відвідувачів до ЄАО? Моя відповідь на це: ні; EDA не є ані частофілістською, ані баєською.
Карл

3
Я думаю, що моє визначення "дослідницького аналізу даних" є більш вузьким, ніж ваше. На мій погляд, весь хороший аналіз даних передбачає дослідження. Що відрізняє "дослідницький аналіз даних" - це відсутність моделі або будь-які зусилля щодо формального висновку.
Карл

0

Я думаю, що EDA допомагає вам створити модель, зробити деякі припущення та (за потреби) оновити модель та її припущення. Я вибираю прагматичний підхід, який потрібно використовувати для встановлення моделі та оцінки.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.