Чи всі моделі марні? Чи можлива якась точна модель - чи корисна?


45

Це питання гнається в моїй свідомості вже більше місяця. Випуск Amstat News за лютий 2015 року містить статтю професора Берклі Марка ван дер Лаана, яка лаять людей за використання неточних моделей. Він заявляє, що, використовуючи моделі, статистика - це мистецтво, а не наука. За його словами, завжди можна використовувати "точну модель", і те, що наша неспроможність цього зробити, сприяє "відсутності суворості ... Я боюся, що наше представництво в науці даних стає маргіналізованим".

Я погоджуюсь, що нам загрожує стати маргіналізованими, але загроза, як правило, приходить від тих, хто стверджує (схоже, що це звучить як професор ван дер Лаан), що вони не використовують якийсь приблизний метод, але чиї методи насправді набагато менше суворіші, ніж ретельно застосовуються статистичні моделі - навіть неправильні.

Я думаю, що справедливо сказати, що професор ван дер Лаан досить зневажливо ставиться до тих, хто повторює часто використовувану цитату Бокса, "всі моделі неправильні, але деякі корисні". В основному, як я читав, він каже, що всі моделі помиляються, і всі марні. Тепер, хто я, щоб не погодитися з професором Берклі? З іншого боку, хто він так кавалерно відкидає погляди одного з реальних гігантів нашої галузі?

Докладно доктор Ван дер дер Лаан заявляє, що "цілковита дурниця стверджувати, що всі моделі помиляються, ... Наприклад, статистична модель, яка не робить припущень, завжди вірна". Він продовжує: "Але часто ми можемо зробити набагато краще, ніж це: ми можемо знати, що дані є результатом незалежних однакових експериментів". Я не бачу, як можна це знати, за винятком дуже вузьких випадкових вибіркових або контрольованих експериментальних налаштувань. Автор вказує на свою роботу в цілеспрямованому навчанні з максимальною вірогідністю та цілеспрямованому навчанні на основі мінімальних втрат, яке "інтегрує сучасний стан в машинне навчання / оцінку, адаптоване до даних, всі неймовірні досягнення в причинному виведенні, цензуровані дані, ефективність та емпіричність теорія процесів при цьому ще надає формальний статистичний висновок ".н

Є також деякі твердження, з якими я згоден. Він каже, що ми повинні серйозно ставитися до нашої роботи, ролі статистиків та наших наукових співробітників. Почуй чуй! Безумовно, це погана новина, коли люди звичайно використовують логістичну регресійну модель чи будь-яку іншу, не ретельно розглядаючи, чи адекватна відповідь на наукове запитання чи вона відповідає даним. І я бачу багато таких зловживань у питаннях, розміщених на цьому форумі. Але я також бачу ефективне та цінне використання неточних моделей, навіть параметричних. І всупереч тому, що він говорить, я рідко «нудьгував на смерть іншою логістичною моделлю регресії». Думаю, така моя наївність.

Тож ось мої запитання:

  1. Які корисні статистичні умовиводи можна зробити за допомогою моделі, яка взагалі не робить припущень?
  2. Чи існує тематичне дослідження з важливими, реальними даними при використанні цільової максимальної ймовірності? Чи широко застосовуються і приймаються ці методи?
  3. Чи справді всі неточні моделі справді марні?
  4. Чи можна знати, що у вас є точна модель, відмінна від тривіальних випадків?
  5. Якщо це занадто ґрунтується на думці і, отже, поза темою, де це можна обговорити? Оскільки стаття доктора Ван дер дер Лаана, безумовно, потребує певного обговорення.

13
Я б сказав, що модель без припущень майже завжди марна, але ван дер Лаан, безумовно, робить припущення, не визнаючи цього. Ми точно не знаємо багато речей, тому його "Ми можемо знати, що дані є результатом n незалежних однакових експериментів" насправді є припущенням або, принаймні, частково. Ми можемо мати вагомі підстави припустити, що вони однакові і незалежні, але на практиці ми бачимо, що дуже часто виявляється, що це було не так і справді (і якщо ми виявимо, що іноді, це потрібно іноді не розкривати, імовірно, набагато частіше ).
Glen_b

19
Модель без припущень - це лише реплікація вашої матриці даних. Це правда, але і марне дублювання зусиль. Можна також стверджувати, що така модель не є моделлю: Одне визначення моделі полягає в тому, що це спрощення реальності. Отже модель, яка не спрощує, за визначенням не є моделлю. Це спрощення має мету: воно допомагає нам по суті зрозуміти, що відбувається; це дає нам головну історію. Якщо вам не байдуже розуміти, чому все відбувається, і хочете лише передбачити, головна історія не має значення. Однак деякі хочуть зробити більше, ніж створити кришталевий бал ...
Маартен Буїс

8
Модель без припущень - це не модель. Модель IS - це сукупність припущень. Крім того, як говорить @Glen_b, припущення про іїд досить сильне, і я не можу придумати приклад, коли це "правда". Навіть коли неодноразово гортають монету, виникають кореляції (див. Роботу Діаконіса). Я лише прокинув статтю, але, здається, недалекоглядний.
P.Windridge

11
Перший приклад автора щодо польоту на Марс - хибний. Механіка Ньютона (на яку покладаються багато аспектів космічних місій) - неправильна модель, але ми покладаємось на неї і вона корисна.
P.Windridge

6
Так, механіка Ньютона є прекрасним прикладом точки Джорджа Бокса.
Glen_b

Відповіді:


15

Цитована стаття, здається, заснована на побоюванні, що статистики "не стануть сутнісною частиною наукового колективу, і вчені, природно, будуть сумніватися у використанні методів", і що "співробітники розглядають нас як техніків, на які вони можуть керувати, щоб отримати їхні наукові результати опубліковані ". Мої коментарі до питань, які поставив @rvl, походять з точки зору нестатиста-біолога, який був змушений розібратися зі все складнішими статистичними питаннями, коли я перейшов від стендових досліджень до трансляційних / клінічних досліджень за останні кілька років. На запитання 5 чітко дано відповіді на кілька відповідей, що знаходяться на цій сторінці; Я звідти піду в зворотному порядку.

4) Не важливо, чи існує "точна модель", тому що навіть якщо вона є, я, мабуть, не зможу дозволити собі зробити дослідження. Розглянемо це питання в контексті дискусії: чи насправді потрібно включати "всіх відповідних прогнозів?" Навіть якщо ми зможемо визначити "всіх відповідних прогнозів", все одно буде проблема зібрати достатню кількість даних, щоб забезпечити ступінь свободи для включення всі вони надійно входять в модель. Це досить важко в контрольованих експериментальних дослідженнях, не кажучи вже про ретроспективні чи популяційні дослідження. Можливо, у деяких типах "Великих даних" це менше проблеми, але це для мене та моїх колег. Завжди буде потреба "бути розумним до цього", як @Aksakal поставив відповідь на цій сторінці.

Справедливості до професора ван дер Лаана, він не вживає слова "точно" у цитованій статті, принаймні у версії, доступній в режимі он-лайн за посиланням . Він розповідає про "реалістичні" моделі. Це важлива відмінність.

Потім знову професор ван дер Лаан скаржиться, що "статистика - це тепер мистецтво, а не наука", що з його боку є більш ніж трохи несправедливим. Розглянемо спосіб, яким він пропонує співпрацювати з колаборантами:

... нам потрібно сприймати ці дані, нашу особу як статистику та наших наукових співробітників. Нам потрібно дізнатися якомога більше про те, як формувалися дані. Після того, як ми створимо реалістичну статистичну модель, нам потрібно витягти з наших співробітників те, що оцінювання найкраще являє собою відповідь на їх наукове питання, що цікавить. Це велика робота. Важко. Це вимагає розумного розуміння статистичної теорії. Це гідне академічне підприємство!

Застосування цих наукових принципів у реальних проблемах, мабуть, вимагає значної кількості «мистецтва», як і роботи на будь-якому науковому підприємстві. Я знав декількох дуже успішних вчених, багато інших, хто зробив добре, і деякі невдачі. На мій досвід, схоже, різниця полягає у «мистецтві» досягнення наукових цілей. Результатом може бути наука, але процес - це щось більше.

3) Знову ж таки, частина випуску є термінологічною; є велика різниця між "точною" моделлю та "реалістичною" моделями, якої прагне професор ван дер Лаан. Його твердження полягає в тому, що багато стандартних статистичних моделей є досить нереальними для отримання «недостовірних» результатів. Зокрема: "Оцінювачі оціночної величини, визначені у чесній статистичній моделі, не можуть бути розумно оцінені на основі параметричних моделей". Це питання для тестування, а не думка.

Його власна робота чітко визнає, що точні моделі не завжди можливі. Розгляньте цей рукопис щодо цільових оцінок максимальної ймовірності (TMLE) в контексті відсутніх змінних результатів. Він заснований на припущенні результатів, відсутніх випадковим чином, які ніколи не можуть бути перевірені на практиці: "... ми припускаємо, що не спостерігаються непомічені плутанини між зв'язком між відсутністю ... та результатом". Це ще один приклад труднощів із включенням "усіх відповідних прогнозів". Однак, сильною стороною TMLE є те, що він, мабуть, допомагає оцінити "припущення про позитивність" адекватної підтримки в даних для оцінки цільового параметра в цьому контексті. Мета - максимально наблизитись до реалістичної моделі даних.

2) TMLE вже обговорювались на Cross Valified . Мені не відомо про широке використання реальних даних. Google Scholar показав сьогодні 258 цитат того, що, здається, є початковим звітом , але, на перший погляд, жоден з них не виявився у великих наборах даних у реальному світі. У статті " Журнал статистичного програмного забезпечення" про пов'язаний пакет R на сьогодні показано лише 27 цитат Google Академія. Однак це не повинно вважатися доказом цінності TMLE. Її спрямованість на отримання надійних неупереджених оцінок фактичних "оцінок" інтересів, що часто є проблемою з оцінками плагінів, отриманими зі стандартних статистичних моделей, здається потенційно цінною.

1) Заява: "статистична модель, яка не робить припущень, завжди є правдою", здається, призначена як солом'яна людина, тавтологія. Дані - це дані. Я припускаю, що існують закони Всесвіту, які залишаються послідовними з дня на день. Метод TMLE, імовірно, містить припущення про опуклості в пошуковому просторі, і як зазначено вище, його застосування у певному контексті може зажадати додаткових припущень.

Навіть професор ван дер Лаан погодився б, що деякі припущення необхідні. Моє відчуття полягає в тому, що він хотів би мінімізувати кількість припущень і уникати тих, що нереально. Чи справді це вимагає відмовитися від параметричних моделей, як він, схоже, стверджує, є вирішальним питанням.


Дуже приємна відповідь. Книга Цільове навчання - це гарне місце, щоб дізнатися більше. Окрім теорії, він містить деякі приклади.
NRH

12

Можливо, я пропустив суть, але я думаю, що вам доведеться трохи відступити.

Я думаю, що його суть полягає в зловживанні легкодоступними інструментами без додаткових знань. Це справедливо і для простого t-тесту: просто подавайте алгоритм своїми даними, отримуючи p <0,05 і думаючи, що ваша теза правдива. Зовсім неправильно. Ви, звичайно, повинні знати більше про свої дані.

Відступивши ще далі: немає нічого подібного до точної моделі ( фізик тут). Але деякі дуже добре погоджуються з нашими вимірами. Єдине точно - математика. Що не має нічого спільного з реальністю чи її моделями . Все інше (і кожна модель реальності) є "неправильним" (як це часто цитується).

Але що означає "неправильне" та корисне? Судіть самі:

ВСІ наші сучасні високотехнологічні (комп'ютери, ракети, радіоактивність тощо) засновані на цих неправильних моделях. Можливо, навіть обчислюються "неправильними" моделювання з "неправильними" моделями.
-> Зосередьтеся більше на "корисному", а не на "неправильному";)

Більш чітко до ваших питань:

  1. Не знаю, вибачте!
  2. Так. Один із прикладів: у фізиці частинок ви хочете виявити певні частинки (скажімо, електрони, протони тощо). Кожна частинка залишає характерний слід у детекторі (а отже, і даних), але змінюється навіть для однієї і тієї ж частинки (за своєю природою). Сьогодні більшість людей використовують машинне навчання для досягнення цієї мети (це було величезне спрощення, але воно майже подібне до цього) і спостерігається підвищення ефективності на 20% -50% порівняно з цим, як це робити за допомогою ручної статистики .
  3. Ніхто насправді цього не стверджував! Не робіть неправильного висновку! (a: всі моделі неточні і b: деякі корисні. не плутайте речі)
  4. Точної моделі немає ( за винятком математики, але насправді в статистиці немає, бо саме точки на прямій лінії і "підганяння" лінії через неї можуть бути точними ... але це нецікавий спеціальний випадок, який ніколи не буває) .
  5. Не знаю :) Але ІМХО я сприймаю це більше як "лише тому, що кожна дитина може ним користуватися, а не всі повинні", і не переслідуйте це сліпо.

Я розгляну ваші моменти, але на (3) і (4), я пропоную вам переглянути статтю ван дер Лаана, а також моє запитання, оскільки ця стаття досить чітко говорить про те, що він не має користі для неточних моделей, і неодноразово посилається на "точну модель". Так так, я б сказав, що хтось справді це сказав. Я майже згоден з тим, що ви говорите про моделі, а також механічним застосуванням методів; і тому я не думаю, що ви мене хочете просити відступити.
rvl

Так, для всіх. І, головним чином, я мав на увазі його відступити, напевно;) Я думаю, що я не згадував, щоб будувати теоретичні (математичні) моделі, вам, звичайно, потрібні "точні" моделі. Отже, щоб «вигадати» кращі моделі та статистичні засоби, вам потрібні детерміновані (або точні) моделі як основа. Я думаю, навіть цілеспрямоване навчання з тіста не повинно бути "неточним".
Mayou36

6

В еконі багато сказано про розуміння "процесу генерації даних". Я не впевнений, що саме мається на увазі під «точною» моделлю, але в econ це може бути те саме, що «правильно вказана» модель.

Звичайно, ви хочете дізнатися якомога більше про процес, який генерував дані, перш ніж спробувати модель, правда? Я думаю, що складність пов'язана з а) ми можемо не мати поняття про реальний DGP і б) навіть якби ми знали реальний DGP, це може бути незрозумілим для моделювання та оцінки (з багатьох причин).

Отже, ви робите припущення щодо спрощення питань та зниження вимог до оцінки. Чи можете ви коли-небудь дізнатися, чи ваші припущення абсолютно вірні? Ви можете отримати докази на користь них, але IMO важко бути впевненим у деяких випадках.

Я маю все це фільтрувати з точки зору як усталеної теорії, так і практичності. Якщо ви зробите припущення, що відповідає теорії, і це припущення дає вам кращі результати оцінки (ефективність, точність, послідовність, будь-що інше), то я не бачу причин цього уникати, навіть якщо модель робить "неточною".

Відверто кажучи, я вважаю, що стаття має на меті стимулювати тих, хто працює з даними, задуматися над усім процесом моделювання. Зрозуміло, що ван дер Лаан робить припущення у своїй роботі . У цьому прикладі насправді ван дер Лаан, здається, відкидає будь-яку стурбованість точною моделлю, а натомість використовує міш-меш процедур для досягнення максимальної продуктивності. Це робить мене більш впевненим, що він підняв цитату Бокса з наміром завадити людям використовувати її як втечу від важкої роботи з розумінням проблеми.

Зіткнемося з цим, світ насичений зловживанням та зловживанням статистичними моделями. Люди сліпо застосовують все, що вміють робити, і ще гірше, інші часто трактують результати найбільш бажаним чином. Ця стаття є гарним нагадуванням, щоб бути обережними, але я не думаю, що ми повинні сприймати це до крайності.

Наслідки вищезазначених питань:

  1. Я погоджуюся з іншими на цій посаді, які визначили модель як набір припущень. З таким визначенням модель, яка не має припущень, насправді не є моделлю. Навіть дослідницький аналіз даних (тобто без моделей) вимагає припущень. Наприклад, більшість людей припускають, що дані вимірюються правильно.
  2. Я не знаю про TMLE, сама по собі, але в економіці є багато статей, які використовують ту саму основу філософії висновку про причинний вплив на незабезпечений контрафактний зразок. Однак у цих випадках лікування не залежить від інших змінних в моделі (на відміну від TMLE), і тому економісти широко використовують моделювання. Існує декілька кейсів для структурних моделей, таких як ця, де автори переконували компанію у впровадженні своєї моделі та знайшли хороші результати.
  3. Я думаю, що всі моделі неточні, але, знову ж таки, цей термін трохи нечіткий. IMO, це в основі котировки Box. Я повторю своє розуміння Боксу таким чином: "жодна модель не може відобразити точну суть реальності, але деякі моделі вловлюють змінну, що цікавить, тож у цьому сенсі ви можете використовувати їх".
  4. Я звернувся до цього вище. Словом, я не думаю.
  5. Я не впевнений. Мені це подобається саме тут.

5

На адресу пункту 3 відповідь, очевидно, - ні. Практично кожне людське підприємство в якийсь момент базується на спрощеній моделі: кулінарія, будівництво, міжособистісні стосунки включають людей, які діють за деякими даними + припущеннями. Ніхто ніколи не сконструював модель, якою вони не збиралися використовувати. Стверджувати інакше - простоювати педантизм.

Набагато цікавіше і освічує, і корисніше запитати, коли неточні моделі не корисні, чому вони не в своїй корисності та що відбувається, коли ми покладаємось на моделі, які виявляються не корисними. Будь-який дослідник, незалежно від того, чи то в науці, чи то в галузі, мусить задавати це питання зухвало і часто.

Я не думаю, що на питання взагалі можна відповісти, але принципи поширення помилок дадуть відповідь. Неточні моделі розпадаються, коли поведінка, яку вони прогнозують, не відображає поведінку в реальному світі. Розуміння того, як поширюються помилки через систему, може допомогти зрозуміти, яка точність необхідна при моделюванні системи.

Наприклад, жорстка сфера зазвичай не є поганою моделлю для бейсболу. Але коли ви розробляєте рукавицю видовища, ця модель не підведе вас і призведе до того, що ви спроектували неправильну справу. Ваші спрощення припущень щодо фізики бейсболу поширюються через вашу систему бейсбольної рукавиці та приводять вас до неправильних висновків.


5

1) Які корисні статистичні умовиводи можна зробити за допомогою моделі, яка взагалі не робить припущень?

Модель є за визначенням узагальненням того, що ви спостерігаєте, що може бути захоплено певними причинними факторами, які, в свою чергу, можуть пояснити та оцінити подію, яку ви спостерігаєте. Враховуючи, що всі ці алгоритми узагальнення мають певні основні припущення. Я не впевнений, що залишилося від моделі, якщо у вас немає припущень. Я думаю, що вам залишаються оригінальні дані, і немає моделі.

2) Чи існує тематичне дослідження з важливими реальними даними при використанні цільової максимальної ймовірності? Чи широко застосовуються і приймаються ці методи?

Не знаю. Максимальна ймовірність використовується весь час. Моделі Logit засновані на таких, як і на багатьох інших моделях. Вони не сильно відрізняються від стандартних OLS, де ви зосереджуєтесь на зменшенні суми квадрата залишків. Я не впевнений, яка цільова максимальна ймовірність. І чим вона відрізняється від традиційної максимальної ймовірності.

3) Чи справді всі неточні моделі є марними?

Абсолютно ні. Неточні моделі можуть бути дуже корисними. По-перше, вони сприяють кращому розумінню або поясненню явища. Це має щось розраховувати. По-друге, вони можуть забезпечити оцінку та прогнозування пониження з відповідним інтервалом довіри, щоб визначити невизначеність, пов'язану з оцінкою. Це може надати багато інформації про те, що ви вивчаєте.

Питання "неточного" також піднімає питання про напруженість між парситизмом і надмірністю. Ви можете мати просту модель з 5 змінними, що є "неточним", але робить досить непогану роботу з захоплення та пояснення загальної тенденції залежної змінної. Ви можете мати більш складну модель з 10 змінних, яка "точніша", ніж перша (вища скоригована площа R, нижча стандартна помилка тощо). Тим не менш, ця друга більш складна модель може справді вийти з ладу, коли ви протестуєте її за допомогою зразка Hold Out. І, в такому випадку, можливо, "неточна" модель насправді працює набагато краще у зразку Hold Out. Це відбувається буквально весь час в економетриці, і я підозрюю, що в багатьох інших соціальних науках. Остерігайтеся «точних» моделей.

4) Чи можна знати, що у вас є точна модель, відмінна від тривіальних випадків?

Неможливо знати, що у вас є точна модель. Але, можливо, ви знаєте, що у вас досить гарна модель. Заходи критеріїв інформації (AIC, BIC, SIC) можуть дати вам багато інформації, що дозволяє порівняти та порівняти відносну продуктивність різних моделей. Також тест LINK також може допомогти в цьому плані.

5) Якщо це занадто ґрунтується на думці і, отже, поза темою, де це можна обговорити? Оскільки стаття доктора Ван дер дер Лаана, безумовно, потребує певного обговорення.

Я думаю, що це відповідний форум для обговорення цього питання, як і деінде. Це досить цікаве питання для більшості з нас.


5

(Я не бачу фрази "точна модель" у статті (хоча це цитується вище))

1) Які корисні статистичні умовиводи можна зробити за допомогою моделі, яка взагалі не робить припущень?

Треба десь почати. Якщо це все, що у вас є (нічого), це може бути відправною точкою.

2) Чи існує тематичне дослідження з важливими реальними даними при використанні цільової максимальної ймовірності? Чи широко застосовуються і приймаються ці методи?

Щоб відповісти на друге запитання, цільова максимальна ймовірність виявляється в документах 93/1143281 (~ .008%) на arxiv.org. Отже, жодна , мабуть, не хороша оцінка (без припущень) до цієї.

3) Чи справді всі неточні моделі є марними?

Ні. Іноді ви дбаєте лише про один аспект моделі. Цей аспект може бути дуже хорошим, а решта дуже неточним.

4) Чи можна знати, що у вас є точна модель, відмінна від тривіальних випадків?

Краща модель модель , яка найкраще відповідає на ваше запитання. Це може означати залишити щось поза. Те, що ви хочете уникати, як тільки можете, це порушення припущення.

5) Щаслива година . І напої дешевше завантажуються!

Мені вживання слова "точно" трохи непокоїть. Це не дуже статистичні розмови. Неточність? Варіація? Дякую Б-г! Тому ми всі тут. Я думаю, що фраза "Усі моделі неправильні ..." гаразд, але тільки в правильній компанії. Статистики розуміють, що це означає, але мало хто це робить.


Хороший момент щодо фрази "точна модель". Він каже, що про "справжні" та "фактичні" моделі є рівнозначними, особливо з огляду на контекст та тон статті, але ви маєте рацію, цитата не "точна" (призначена каламбур).
SQLServerSteve

Моє ліжко. Я повинен був правильно його цитувати.
rvl

Я відчуваю, що намагаючись досягти справжньої чи реальної моделі, пропускає точку вправи. Я думаю, що він насправді намагається обговорити - це погані моделі.
мандата

Так, стаття містить багато хороших моментів, але він перекладає безліч крайніх коментарів на кшталт "Повна дурниця стверджувати, що всі моделі помиляються", коли вони насправді в певній мірі всі неправильні. Дурно говорити інакше. Він напевно ставить екстремальну позицію. Rvl був цілком правильний, щоб підняти це і викликати його (не потійте цитату Ріл, важливо, що ви правильно засвоїли значення).
SQLServerSteve

4

Згадана стаття видається мені чесною, але політичною статтею, щирою полемікою . Як такий, він містить безліч пристрасних уривків, які є науковими безглуздими, але, тим не менш, можуть бути ефективними для розбудови корисних бесід та дискусій з важливих питань.

Тут є багато хороших відповідей, тому дозвольте мені лише процитувати кілька рядків із статті, щоб просто показати, що проф. Лаан, безумовно, не використовує у своїй роботі будь-якої "точної моделі" (і, до речі, хто говорить, що "точне" модель "- поняття, еквівалентне фактичному механізму генерування даних?)

Котирування (жирний мій акцент)

"Після того, як ми створимо реалістичну статистичну модель, нам потрібно витягти з наших співробітників те, що оцінювання найкраще являє собою відповідь на їх наукове питання, що цікавить ".

Коментар: "реалістично" так само, як видалено з "точного", як і Марс із Землі. Вони обидва орбітують на Сонці, тому для деяких цілей не має значення, яку планету обирає. Для інших цілей це має значення. Також "найкраще" - відносне поняття. "Точне" - ні.

"Оцінювачі оцінки визначаються чесно статистичній моделі, не можуть бути розумно оцінені на основі параметричних моделей ...

Коментар: Чесність - це найкраща політика, але вона точно не гарантована. Крім того, "розумна оцінка" виявляється дуже розведеним результатом, якщо використовується "точна модель".

" У відповідь на необхідність вирішити ці важкі проблеми з оцінкою найкраще, що ми можемо , ми розробили загальний статистичний підхід ... "

Коментар: Гаразд. Ми "робимо все можливе". Як майже всі думають про себе. Але "найкраще, що ми можемо", це не "точне".


2

Я збираюся підійти до цього з альтернативного напряму філософії, з огляду на дійсно корисні принципи управління невизначеністю, обговорювані в книгах Джорджа Ф. Кліра про нечіткі множини. Я не можу дати точності ван дер Лаану, але можу навести дещо вичерпний випадок, чому його мета логічно неможлива; це закликає до тривалої дискусії, в якій згадуються інші сфери, тож майте мене.

Клір та його співавтори ділять невизначеність на кілька підтипів, таких як неспецифічність (тобто, коли у вас є невідомий набір альтернатив, розглядаються за допомогою засобів, таких як Функція Хартлі); неточність у визначеннях (тобто "нечіткість", змодельована та кількісно визначена у нечітких наборах); чвари чи розбрат у доказах (розглянуто в Теорії доказів Демпстера-Шафера); плюс теорія ймовірностей, теорія можливостей та невизначеність вимірювань, де метою є адекватна область для збору відповідних доказів, з мінімізацією помилок. Я розглядаю весь інструментарій статистичних прийомів як альтернативний засіб розбиття невизначеності різними способами, подібно до вирізання печива; довірчі інтервали та карантинна невизначеність p-величин однозначно, тоді як такі заходи, як Ентропія Шеннона, знижують її з іншого кута. Що вони можуть " t, однак, це повністю усунути. Щоб досягти "точної моделі" такого типу, як Ван дер Лаан, як видається, описує, нам потрібно було б звести всі ці види невизначеності до нуля, щоб більше не залишалося для розділення. По-справжньому "точна" модель завжди мала б значення ймовірності та можливості 1, неспецифічні показники 0 і відсутність якихось невизначеностей у визначеннях термінів, діапазонів значень або шкал вимірювання. Не було б розбрату в альтернативних джерелах доказів. Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки: такого типу, як видається Ван дер Лаан, нам потрібно було б звести всі ці види невизначеності до нуля, щоб більше не залишилося розділити. По-справжньому "точна" модель завжди мала б значення ймовірності та можливості 1, неспецифічні показники 0 і відсутність якихось невизначеностей у визначеннях термінів, діапазонів значень або шкал вимірювання. Не було б розбрату в альтернативних джерелах доказів. Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки: такого типу, як видається Ван дер Лаан, нам потрібно було б звести всі ці види невизначеності до нуля, щоб більше не залишилося розділити. По-справжньому "точна" модель завжди мала б значення ймовірності та можливості 1, неспецифічні показники 0 і відсутність якихось невизначеностей у визначеннях термінів, діапазонів значень або шкал вимірювання. Не було б розбрату в альтернативних джерелах доказів. Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки: По-справжньому "точна" модель завжди мала б значення ймовірності та можливості 1, неспецифічні показники 0 і відсутність якихось невизначеностей у визначеннях термінів, діапазонів значень або шкал вимірювання. Не було б розбрату в альтернативних джерелах доказів. Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки: По-справжньому "точна" модель завжди мала б значення ймовірності та можливості 1, неспецифічні показники 0 і відсутність якихось невизначеностей у визначеннях термінів, діапазонів значень або шкал вимірювання. Не було б розбрату в альтернативних джерелах доказів. Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки: Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки: Прогнози, зроблені такою моделлю, завжди були б на 100 відсотків точними; прогнозні моделі по суті розділяють свою невпевненість у майбутньому, але не залишиться нічого, щоб відкласти. Перспектива невизначеності має деякі важливі наслідки:

• Цей високий орден є не лише фізично неправдоподібним, а й фактично логічно неможливим. Очевидно, що ми не можемо досягти ідеально масштабних шкал вимірювання з нескінченно малими ступенями, збираючи кінцеві спостереження за допомогою помилкового, фізичного наукового обладнання; завжди буде певна невизначеність щодо масштабу вимірювання. Так само завжди знайдеться нечіткість навколо самих визначень, які ми використовуємо в наших експериментах. Майбутнє також є невизначеним, тому передбачувані ідеальні прогнози наших "точних" моделей повинні розглядатися як недосконалі до тих пір, поки не буде доведено інше - що займе вічність.

• Що ще гірше, жодна методика вимірювання не є на 100 відсотків помилкою в якийсь момент процесу, а також не може бути достатньо вичерпною, щоб охопити всю можливу суперечливу інформацію у Всесвіті. Крім того, усунення можливих заплутаних змінних та повна умовна незалежність неможливо довести ґрунтовно, не вивчивши всіх інших фізичних процесів, які впливають на те, що ми вивчаємо, а також тих, що впливають на ці вторинні процеси тощо.

• Точність можлива лише у чистій логіці та її підмножині, математиці, саме тому, що абстракції відокремлені від реальних проблем, як ці джерела невизначеності. Наприклад, чистою дедуктивною логікою ми можемо довести, що 2 + 2 = 4 і будь-яка інша відповідь на 100 відсотків невірна. Ми також можемо зробити абсолютно точні прогнози, що вона завжди дорівнює 4. Така точність можлива лише в статистиці, коли ми маємо справу з абстракціями. Статистика надзвичайно корисна при застосуванні до реального світу, але саме те, що робить її корисною, вводить хоча б певну ступінь неминучої невизначеності, тим самим робить її неточною. Це неминуча дилема.

• Крім того, Пітер Чу підвищує додаткові обмеження в розділі коментарів статті rvl, пов'язаної з цим. Він вважає це краще, ніж я можу:

"Ця поверхня для вирішення проблем, що стосується НП, як правило, має багато локальних оптимізмів, і в більшості випадків вирішити проблему обчислювально, тобто в цілому знайти оптимальне глобальне рішення. Отже, кожен модельєр використовує деякі (евристичні) методи моделювання, в кращому випадку знайти адекватні локальні оптимальні рішення у величезному просторі рішень цієї складної цільової функції ".

• Все це означає, що сама наука не може бути абсолютно точною, хоча, здається, ван дер Лаан говорить про це таким чином у своїй статті; науковий метод як абстрактний процес точно визначений, але неможливість універсального та досконалого точного вимірювання означає, що він не може створити точні моделі, позбавлені невизначеності. Наука - чудовий інструмент, але має свої межі.

• Звідси стає гірше: навіть якби можна було точно виміряти всі сили, що діють на кожен складовий кварк і глюон у Всесвіті, деякі невизначеності все одно залишаться. По-перше, будь-які прогнози, зроблені такою повною моделлю, все ще будуть невизначеними через існування безлічі розв’язків для квінтічних рівнянь та вищих многочленів. По-друге, ми не можемо бути повністю впевнені, що крайній скептицизм, втілений у класичному питанні "можливо, це все мрія чи галюцинація", не є відображенням реальності. . Це в основному еквівалентно більш екстремальній онтологічній інтерпретації оригінальних гносеологічних формулювань таких філософій, як феноменалізм, ідеалізм та соліпсизм.

• У 1909 р. Класичне православ’яГ. К. Честертон зазначав, що про крайні версії цих філософій дійсно можна судити, але по тому, чи вводять вони своїх віруючих у психічні установи чи ні; Наприклад, онтологічний соліпсизм є насправді маркером шизофренії, як і деякі його двоюрідні брати. Найкраще, що ми можемо досягти в цьому світі, - це усунути розумні сумніви; Нерозумного сумніву цього неспокійного виду не можна суворо усунути навіть у гіпотетичному світі точних моделей, вичерпних та безпомилкових вимірювань. Якщо ван дер Лаан прагне позбавити нас від необгрунтованих сумнівів, то він грає з вогнем. Осягнувши досконалість, кінцеве добро, яке ми можемо зробити, прослизне через наші пальці; ми є кінцевими створіннями, що існують у нескінченному світі, а це означає, що вид повного і цілком певного знання, про яке доводиться Ван дер Лаан, постійно перебуває поза нашим розумінням. Єдиний спосіб, коли ми можемо досягти такої визначеності, - це відступити з того світу в більш вузькі рамки ідеально абстрактного, який ми називаємо "чистою математикою". Однак це не означає, що відступ до чистої математики є рішенням для усунення невизначеності. Це був, по суті, підхід наступників Людвіга Вітгенштейна (1889-1951), який виснажив свою філософію логічного позитивізму будь-якого здорового глузду, цілком відкинувши метафізику і повністю відступивши від чистої математики та сцієнтизму, а також крайнього скептицизму, надспеціалізація та переоцінка точності над корисністю. У ході цього процесу вони зруйнували дисципліну філософії, розчиняючи її у дурному похованні на дефініції та огляді пупка, тим самим роблячи її неактуальною для решти наукових шкіл. Це по суті знищило всю дисципліну, яка дотепер була на передньому плані академічних дебатів до початку 20 століття, до тих пір, коли вона все ще привертала увагу ЗМІ, а деякі її керівники були домашніми іменами. Вони зрозуміли ідеальне, відшліфоване пояснення світу, і воно прослизнуло через їхні пальці - так, як це робилося через психічних пацієнтів, про які говорив GKC. Він також вислизне з Ван дер Лаана, який вже спростував власну точку, про що йдеться нижче. Погоняти надто точними моделями не просто неможливо; це може бути небезпечно, якщо поставити його до точки самовбивчої одержимості. Прагнення до такої чистоти рідко закінчується; це часто настільки самопоразно, як ті гермофоби, які так люто вичісують руки, що в них потрапляють рани, які заражаються. Це ' s нагадує Ікара, який намагається вкрасти вогонь із Сонця: як кінцеві істоти, ми можемо мати лише кінцеве розуміння речей. Як Честертон також говорить у православ'ї, "саме логік прагне занести небо в голову. І це його голова, яка розбивається".

У світлі сказаного, дозвольте мені вирішити деякі конкретні питання, перелічені rvl:

1) Модель, яка не має припущень, або а) не усвідомлює власних припущень, або б) повинна бути чітко відмежована від міркувань, що вносять невизначеність, наприклад помилки вимірювання, враховуючи кожну можливу змішувальну змінну, ідеально безперервні шкали вимірювання та подібно до.

2) Я все ще новачок, коли мова йде про максимальну оцінку ймовірності (MLE), тому я не можу коментувати механіку цільової ймовірності, крім того, щоб зазначити очевидне: ймовірність - це саме це, ймовірність, а не впевненість. . Для отримання точної моделі потрібно повне усунення невизначеності, що ймовірнісна логіка може рідко робити, якщо взагалі.

3) Звичайно, ні. Оскільки всі моделі зберігають певну невизначеність і, таким чином, є неточними (за винятком випадків чистої математики, відірваних від фізичних вимірювань реального світу), людська раса не могла б досягти жодного технологічного прогресу на сьогоднішній день - і справді, будь-якого іншого прогресу в всі. Якби неточні моделі завжди були марними, ми б проводили цю розмову в печері, а не про цей неймовірний подвиг технології під назвою Інтернет, і все це стало можливим завдяки неточному моделюванню.

Як не дивно, власна модель ван дер Лаана є основним прикладом неточності. У його власній статті накреслюється така модель, як слід керувати сферою статистики з метою конкретних моделей; до цієї "моделі" ще немає жодних цифр, жодного вимірювання того, наскільки на його думку зараз неточна чи марна більшість моделей, немає кількісного визначення того, наскільки ми далекі від його зору, але, гадаю, можна було б розробити тести на ці речі . Однак, як виглядає, його модель є точною. Якщо це не корисно, це означає, що його пункт неправильний; якщо це корисно, воно перемагає його головне, що неточні моделі не корисні. У будь-якому випадку він спростує власний аргумент.

4) Мабуть, ні, тому що ми не можемо мати повну інформацію для перевірки нашої моделі з тих самих причин, що ми не можемо отримати точну модель в першу чергу. Точна модель за визначенням вимагає ідеальної передбачуваності, але навіть якщо перші 100 тестів виявляться на 100 відсотків точними, 101-й може не зробити. Тоді є вся проблема нескінченно малих шкал вимірювання. Після цього ми потрапляємо у всі інші джерела невизначеності, які забруднюють будь-яку оцінку Башти Слонової кістки за нашою моделлю Башта слонової кістки.

5) Щоб вирішити це питання, мені довелося поставити його в більш широкому контексті набагато більш великих філософських питань, які часто є суперечливими, тому я не думаю, що це можливо обговорити, не вникаючи в думки (зверніть увагу, що саме по собі це інше джерело невизначеності) але ви праві, ця стаття заслуговує на відповідь. Багато з того, що він говорить про інші теми, є на правильному шляху, наприклад, необхідність стати статистикою, що стосується Big Data, але там є якийсь непрактичний екстремізм, який слід виправити.


1
Хто ці "наступники Вітгенштейна", які "знищили дисципліну філософії" !? Тенденція післявоєнної аналітичної філософії - думати про пізніших Вітгенштейна, Остіна, Куїна, Кенні, Гудмена, Льюїса, Девідсона, Рорті - здається, неприйняття принципів логічного позитивізму, реабілітація метафізики та відступ від наученцтва. (У коментарях Рорті щодо Ніцше та Лойоли можна стверджувати, що він, можливо, погодився з пунктом Честертона.) Щодо того, чому Кім Кардашян - домашнє ім'я, а не Саул Крипке, я підозрюю, що інші тенденції існують з початку 20 століття.
Скорчі - Відновлення Моніки

Ці післявоєнні реформатори невідомі за межами своєї сфери саме тому, що вони з'явилися після того, як дисципліна відступила у 20-ті / 30-ті роки (після багатовікового занепаду крайні логічні позитивісти просто прискорилися) до нерелевантності, від якої вона ніколи не оговталася. Пошкодження вже було зроблено. До 50-х років інші навчальні дисципліни вже не зверталися до філософії лідерства, і з тих пір часто ставилися до неї з відвертим презирством, за неприкосненість, обманювання. Зображення може не відображати реальність філософії, але неприємність все ж залишається.
SQLServerSteve

Я був би радий обговорити це у чаті наступного тижня, якщо у вас є час, я не хочу виходити на дотичну в цій темі, але я підозрюю, що наші позиції не так вже й однакові. Я думаю, що ви абсолютно праві, рух, який привів до Кардашян тощо, ведеться з початку 20 століття - саме час, коли дисципліна філософії впала в затемнення (чи заслуговує вона це інша справа; я вважаю це високо практичне і хотілося б, щоб його все ще цінували).
SQLServerSteve

Коментарі не для розширеного обговорення; ця розмова була переміщена до чату .
Scortchi
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.