Про Джорджа Бокса, Галіта Шмулі та науковий метод?


16

(Це питання може здатися, що він краще підходить для філософії SE. Я сподіваюся, що статистики зможуть роз'яснити мої помилки щодо тверджень Бокса та Шмуелі, отже, я їх розміщую тут).

Джордж Бокс (про славу ARIMA) сказав:

"Усі моделі помиляються, але деякі корисні."

Галіт Шмулі у своїй знаменитій статті "Пояснити або передбачити" стверджує (і цитує інших, хто з нею згоден), що:

Пояснення та прогнозування - це не те саме, і що деякі моделі роблять хорошу роботу з поясненням, хоча вони і погано працюють при прогнозуванні.

Я відчуваю, що ці принципи якимось чином суперечать.

Якщо модель не прогнозує добре, чи корисна вона?

Що ще важливіше, якщо модель добре пояснює (але не обов'язково прогнозує добре), то вона повинна бути правдою (тобто не помилкою) в тій чи іншій мірі. То як ця сітка з Box "усі моделі помиляються"?

Нарешті, якщо модель добре пояснює, але не прогнозує добре, як це навіть науково? Більшість критеріїв наукової демаркації (верифікація, фальсифікація тощо) свідчать про те, що наукове твердження повинно мати прогностичну силу або розмовно: Теорія чи модель є правильною лише тоді, коли вона може бути емпірично перевірена (або підроблена), що означає, що вона має передбачити майбутні результати.

Мої запитання:

  • Чи заява Бокса та ідеї Шмуелі дійсно суперечливі, чи я щось пропускаю, наприклад, чи може модель ще не мати передбачувальну силу, але все ще може бути корисною?
  • Якщо висловлювання Бокса і Шмуелі не суперечать один одному, то що означає, що модель помиляється і не прогнозує добре, але все ще має пояснювальну силу? По-іншому: якщо забирати і правильність, і здатність прогнозування, що залишилося від моделі?

Які емпіричні валідації можливі, коли модель має пояснювальну силу, але не прогностичну силу? Шмуелі згадує такі речі: використовуйте AIC для пояснення, а BIC - для прогнозування тощо, але я не бачу, як це вирішує проблему. Для прогнозних моделей ви можете використовувати AIC, або BIC, або R2 , або L1 регуляризацію тощо, але в кінцевому підсумку вибірка випробувань та продуктивність у виробництві - це те, що визначає якість моделі. Але для моделей, які добре пояснюють, я не бачу, як будь-яка функція втрат може справді оцінити модель. У філософії науки існує поняття недовизначеннящо здається доречним тут: Для будь-якого даного набору даних завжди можна з розумом вибрати деякий розподіл (або суміш розподілів) і функцію втрати L таким чином, щоб вони відповідали даним (і тому можна стверджувати, що це пояснюють). Більше того, поріг, за яким повинен бути L для того, щоб хтось стверджував, що модель адекватно пояснює дані, є довільними (на кшталт p-значень, чому це p<0.05 а не p<0.1 або p<0.01 ?).

  • Виходячи з вищесказаного, як можна об'єктивно підтвердити модель, яка добре пояснює, але не прогнозує добре, оскільки тестування зразка неможливе?


3
Наскільки я пам’ятаю Шмуелі, для неї добре пояснити означає правильну функціональну форму (але, можливо, мати величезну неточність оцінки, коли мова йде про параметри цієї функціональної форми), тоді як добре передбачити означає отримати компроміс відхилення відхилення правильно (компроміс щодо функціональної форми з метою підвищення точності оцінки). Також тег філософський тут може бути корисним.
Річард Харді

1
Я не думаю, що "чи" не має бути виключним. Простота та уніфікація - це суперечливі критерії відбору для теорій, що мають однакову прогностичну цінність, і якщо так, то жертваючи точністю для них цілком може бути виправданою у багатьох контекстах. Девіз Бокса відображає інший погляд на науку, просунутий, наприклад, у Науковому образі Ван Фраассена (і повертаючись до Канта): він повинен будувати адекватні / корисні описи спостережуваних, а не розповідати буквально правдиві історії про неспостережувану "реальність". Грубої адекватності може вистачити для багатьох завдань, і "одна правильна модель" цілком може бути наївною фігурою.
Хвойний

2
@Conifold Дійсно, циклічний аналіз Річарда Левінса складних причинно-наслідкових систем (не статистичний метод, хоча є його застосування, які безпосередньо стосуються статистичних прогнозів) приносить у жертву майже всю точність на користь модельного реалізму (змінних та взаємозв'язків між ними) та загальності (застосованість аналітичних результатів на моделі до всіх змінних, що мають однакову причинно-наслідкову структуру). Див. Левінс, Р. (1966). Стратегія побудови моделі в біології населення . Американський вчений , 54 (4), 421–431.
Олексій

(+1. Я все ще сподіваюсь знайти час, щоб опублікувати відповідь тут ...)
Амеба каже

Відповіді:


9

Дозвольте розпочати з жалюгідної цитати Джорджа Бокса, що "всі моделі неправильні, але деякі корисні". Це твердження - це інкапсуляція методологічного підходу "позитивізму", який є філософським підходом, який має високий вплив у науках. Цей підхід детально описано (в контексті економічної теорії) у класичному методологічному нарисі Фрідмана (1966) . У цьому есе Фрідман стверджує, що будь-яка корисна наукова теорія обов'язково являє собою спрощення реальності, і тому її припущення завжди повинні певною мірою відходити від реальності і навіть можуть суттєво відходити від реальності.у зменшенні складності світу до керованого набору принципів та його точності в прогнозуванні реальності та генерування нових перевіряються гіпотез про реальність. Таким чином, Фрідман стверджує, що "всі моделі помиляються", оскільки всі вони містять припущення, які спрощують (і тому відходять від) реальності, але що "деякі є корисними", якщо вони дають просту основу для корисних прогнозів щодо реальності.

Тепер, якщо ви прочитаєте Box (1976) (стаття, де він вперше стверджує, що "всі моделі неправильні"), ви побачите, що він не цитує Фрідмана, а також не згадує про методологічний позитивізм. Тим не менш, його пояснення наукового методу та його характеристик надзвичайно близьке до того, яке розробив Фрідман. Зокрема, обидва автори підкреслюють, що наукова теорія зробить передбачення щодо реальності, яку можна перевірити на спостережуваних фактах, і помилка в передбаченні може бути використана як основа для перегляду теорії.

Тепер, про дихотомію, яку обговорював Галіт Шмулі в " Шмулі" (2001) . У цій роботі Шмуелі порівнює причинно-наслідкове пояснення та прогнозування спостережуваних результатів і стверджує, що це різні види діяльності. Зокрема, вона стверджує, що причинно-наслідкові зв'язки ґрунтуються на основоположних конструкціях, які не виявляються безпосередньо в вимірюваних результатах, і тому "вимірювані дані не є точними уявленнями про їх основні конструкції" (с. 293). Тому вона стверджує, що існує аспект статистичного аналізу, який передбачає висновки про непомітні основні причинно-наслідкові зв'язки, які не виявляються в вимірюваних протилежних відмінностях результатів.

Якщо я щось не розумію, я вважаю, що справедливо сказати, що ця ідея знаходиться в напрузі з позитивістськими поглядами Бокса і Фрідмана, як це представлено у цитаті Box. Позитивістська точка зору, по суті, говорить про те, що немає допустимих метафізичних «конструкцій», крім тих, що виявляються в вимірюваних результатах. Позитивізм обмежується врахуванням даних, що спостерігаються, та концепцій, побудованих на цих даних; це виключає розгляд апріоріметафізичні поняття. Таким чином, позитивіст стверджує, що поняття причинності може бути справедливим лише в тій мірі, в якій вона визначається з точки зору вимірюваних результатів насправді --- настільки, наскільки вона визначається як щось відмінне від цього (як Шмуелі трактує це), це було б розцінено як метафізична спекуляція і вважатиметься неприйнятною у науковому дискурсі.

Тож я думаю, ви праві - ці два підходи по суті конфліктують. Позитивістський підхід, застосований Боксом, наполягає на тому, що діючі наукові концепції цілком повинні ґрунтуватися на їх проявах у дійсності, тоді як альтернативний підхід, який застосовує Шмуелі, говорить про те, що існують деякі "конструкції", які є важливими науковими концепціями (які ми хочемо пояснити), але які не можуть бути ідеально представленими, коли вони "оперуються", пов'язуючи їх з вимірюваними результатами в реальності.


Саме !!! Шмуелі, здається, суперечить більшості позитивістських (і фальсифікаторських) визначень того, що таке наукове твердження, і мені цікаво, чи дійсно її намір зробити таке сміливе філософське твердження? чи вона, як статистик, не знає, наскільки сміливі її заяви насправді?
Скандер Х.

Я розмістив відповідне запитання щодо філософії SE , хочете зважити його?
Скандер Х.

1
Хоча позитивізм і прагматизм поділяють антиреалістичні риси, підхід Бокса - останній, а позитивізм не впливає на науки принаймні з кінця 1960-х років. Ось чому Box не згадує Фрідмана чи інших позитивістів. Прагматизм не обмежується спостережуваними даними і не має проблем з апріорними поняттями або метафізичними побудовами. Просто вони не сприймають їх як наближення до "реальності", а отже, націлені на унікально "правильні" риси, вони можуть бути множинними, залежними від завдань та ревізійними. Причинно-наслідкові зв’язки - це такі конструкти, тому між Коробкою та Шмуелі немає конфлікту.
Хвойний

Незалежно від того, незалежно від того, Ящик був прагматиком чи ні, конкретна цитата, яку він тут наводить, є, на мою думку, більш сприятливою для позитивізму, ніж прагматизму. Остання філософія сприймає плюралістичний погляд на метафізику, яка стверджує, що існує декілька когерентних способів концептуалізації реальності, і що все це "справжнє" в сенсі корисних концептуалізацій реальності. Таким чином, позитивізм би сказав: "всі моделі помиляються, але деякі корисні", тоді як максимум прагматизму буде ближчим до "багатьох моделей правильних, тому що вони корисні".
Моніку

Ідентифікація правдивого з корисним - лише народна помилка щодо прагматизму. Усі моделі помиляються, тому що "правильні" підказують, що їм є що відповідати, що прагматики заперечують. А принцип толерантності, "моделі мають рацію, поки вони служать цілі", пояснюється Карнапом, батьком логічного позитивізму.
Хвойний

4

Модель, коли використовується для пояснення речей, - це спрощення реальності. Спрощення - це ще одне слово для "неправильного в якийсь корисний спосіб". Наприклад, якщо ми округлимо число від 3,1415926535898 до 3,14, ми робимо помилку, але ця помилка дозволяє нам людям зосередитись на найбільш важливій частині цього числа. Ось як використовуються моделі при поясненні, вони дають уявлення про певну проблему, але за необхідності потрібно абстрагуватися від багатьох інших речей: Ми, люди, просто не дуже добре дивимось на тисячі речей одночасно. Якщо ми в першу чергу дбаємо про те, щоб передбачити, ми хочемо включити ці тисячі речей, коли це можливо, але пояснення компромісу - це інше.


1
π

1
@SkanderH. Наскільки «елегантні та інтуїтивні графіки» полегшують інженерні програми чи розробку нових теорій, їх значення не є суто суб’єктивним чи ненауковим, воно є прагматичним. Уніфікація, пояснювальна сила, простота і узгодженість широко визнані як епістемічні , а не естетичні цінності . Вибір між теорією ефіру Лоренца та спеціальною відносністю був зроблений виходячи саме з таких міркувань, вони прогнозно рівноцінні.
Хвойний

3

Приклад моделі, яка є чудовою для прогнозування, але нічого не пояснює, наведена у статті Вікіпедії « Усі моделі неправильні ». Прикладом є модель гравітації Ньютона. Модель Ньютона майже завжди дає прогнози, які не відрізняються від емпіричних спостережень. І все ж модель є надзвичайно неправдоподібною: вона постулює силу, яка може діяти миттєво на довільно великі відстані.

Модель Ньютона була витіснена моделлю, наведеною в загальній теорії відносності Ейнштейна. При загальній відносності гравітаційні сили рухаються через простір з кінцевою швидкістю (швидкістю світла).

Модель Ньютона не є спрощенням загальнорелятивістської моделі. Щоб проілюструвати це, розгляньте яблуко, що падає з дерева. Згідно загальної відносності, яблуко падає без Землі, не чинячи на це жодної сили. (Основна причина того, що яблуко падає, полягає в тому, що Земля вигрібає час, так що годинники біля основи дерева бігають повільніше, ніж годинники високо вгору на дереві.) Таким чином, як зазначається у статті Вікіпедії, модель Ньютона абсолютно неправильна від пояснювальної перспектива.

У статті Шмуелі [2010] передбачається, що для моделі є дві цілі: передбачення та пояснення. Насправді кілька авторів заявили, що три цілі (див., Наприклад, Konishi & Kitagawa [ Інформаційні критерії та статистичне моделювання , 2008: §1.1] та Friendly & Meyer [ Дискретний аналіз даних , 2016: §11.6]). Ці три цілі відповідають трьом видам логічних міркувань:

  • прогнозування (відповідає відрахуванню);
  • оцінка параметрів (відповідає індукції);
  • опис структури (відповідно до викрадення).

Сказати, що модель гравітації Ньютона "нічого не пояснює", чесно кажучи, смішно. -1.
амеба каже, що

Амеба, модель Ньютона нічого не пояснює про те, як працює гравітація, за умови, що загальна відносність точна. Якщо яблуко падає, модель Ньютона постулює, що Земля чинить силу на яблуко і що цей постулат є абсолютно помилковим. Я прошу вас додатково розглянути мою відповідь. Якщо ви все ще не розумієте, то ласкаво скажіть мені, що незрозуміло.
SolidPhase

Те, що ви говорите, цілком зрозуміло, але я категорично не згоден з цим.
амеба каже, що

амеба, я прошу пояснити, чому ви не згодні: у вас є причина? (Зверніть увагу, що я додав додаткове речення у відповідь.)
SolidPhase

Спасибі. Я перегляну згадки, які ви згадуєте. Я розумію, як модель може передбачити, навіть якщо вона не пояснює. Що я не отримую - це протилежний напрямок: Як можна пояснити модель, не прогнозуючи. Ви, наприклад, Ньютон проти Ейнштейна, просто затуманили все ще більше: вся причина Ейнштейнової теорії витіснила Ньютона в тому, що вона прогнозувала краще. Подивіться на це по-іншому: Якщо у нас є змагальні пояснювальні моделі, як ми можемо їх оцінити, якщо не перевірити, яка з них має найбільш передбачувальну силу?
Скандер Х.

1

Я бакалавр статистики, тому я не буду називати себе експертом, але ось два мої центи.

Моделі не пояснюють себе; люди їх інтерпретують. Лінійні моделі легше зрозуміти, ніж нейронні мережі та випадкові ліси, оскільки вони ближче до того, як ми приймаємо рішення. Дійсно, ANN імітують людський мозок, але ви не вирішите, в який ресторан поїхати завтра, зробивши серію множин матриць. Натомість, ви зважуєте деякі фактори у своїй свідомості за їх важливістю, що по суті є лінійною комбінацією.

"Пояснювальна сила" вимірює, наскільки добре модель поєднується з інтуїцією людини, тоді як "прогностична сила" вимірює те, наскільки вона добре узгоджується з основним механізмом процесу, який цікавить. Суперечність між ними - це, по суті, розрив між тим, що є світом, і тим, як ми можемо сприймати / розуміти його. Я сподіваюся, що це пояснює, чому "деякі моделі роблять хорошу роботу з поясненням, хоча вони і погано працюють при прогнозуванні".

Ян Стюарт одного разу сказав: "Якби наші мізки були досить простими, щоб ми їх зрозуміли, ми були б настільки простими, що не змогли б". На жаль, наші маленькі людські мізки насправді дуже прості в порівнянні з Всесвітом, або навіть фондовим ринком (який передбачає багато мізків :). На сьогоднішній день всі моделі є продуктами людського мозку, тому вони повинні бути більш-менш неточними, що призводить до того, що Box "Усі моделі неправильні". З іншого боку, модель не повинна бути технічно правильною, щоб бути корисною. Наприклад, закони руху Ньютона були спростовані Ейнштейном, але він залишається корисним, коли об'єкт не є смішно великим чи швидким.

Щоб вирішити ваше запитання, я, чесно кажучи, не бачу несумісності між пунктами Box і Шмуелі. Здається, ви вважаєте, що "пояснювальна сила" та "сила прогнозування" є біноміальними властивостями, але я думаю, що вони сидять на двох кінцях спектру.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.