Чи насправді потрібно включати "всіх відповідних прогнозів?"


15

Основним припущенням використання регресійних моделей для висновку є те, що "всі відповідні предиктори" були включені в рівняння прогнозування. Обґрунтування полягає в тому, що невключення важливого фактору реального світу призводить до упереджених коефіцієнтів і, отже, неточних висновків (тобто пропущених змінних зміщень).

Але в дослідницькій практиці я ніколи не бачив нікого, включаючи щось, що нагадувало б "всі відповідні прогнози". У багатьох явищах є безліч важливих причин, і було б дуже важко, якщо не неможливо, включити їх усіх. Прикладом без маніпуляцій є моделювання депресії як результату: ніхто не побудував нічого близького до моделі, яка включає "всі відповідні змінні": наприклад, історія батьків, особистісні риси, соціальна підтримка, дохід, їх взаємодія тощо. тощо ...

Більше того, пристосування такої складної моделі призведе до дуже нестабільних оцінок, якщо б не було дуже великих розмірів вибірки.

Моє запитання дуже просте: чи припущення / порада "включити всі відповідні прогнози" є лише тим, що ми "кажемо", але насправді ніколи не означає? Якщо ні, то чому ми даємо це як фактичну пораду щодо моделювання?

І чи означає це, що більшість коефіцієнтів, ймовірно, вводять в оману? (наприклад, дослідження факторів особистості та депресії, яке використовує лише декілька прогнозів). Іншими словами, наскільки великою є ця проблема для висновків наших наук?


6
Версія цього аргументу вирувала в психології, економіці та соціальних науках протягом 19 століття. Вчені стверджували, що статистичні методи не застосовуються для людей та соціальних систем, оскільки люди занадто різноманітні та складні. Наприкінці цього століття корисність перемогла філософію: навіть коли ми не включаємо всіх прогнозів, ми все ще можемо багато чого навчитися. Існує мудрість у включенні "відповідної" до заголовкової фрази.
whuber

Відповіді:


18

Ви маєте рацію - ми рідко реалістично говоримо "всі відповідні прогнози". На практиці ми можемо бути задоволені в тому числі провісників, що пояснюють основні джерела зміни в . У спеціальному випадку, коли можна зробити висновок про фактор ризику чи лікування в спостережному дослідженні, це рідко є досить хорошим. Для цього коригування для непорозуміння повинно бути дуже агресивним, включаючи змінні, які можуть бути пов'язані з результатом і можуть бутиY бути пов'язані з вибором лікування або з фактором ризику, який ви намагаєтеся оприлюднити.

Цікаво, що за нормальної лінійної моделі опущені коваріати, особливо якщо ортогональні включені коваріати, можна вважати просто збільшенням терміна помилки. У нелінійних моделях (логістична, Кокс та багато інших) опущення змінних може змістити ефекти всіх змінних, що входять до моделі (наприклад, через нерозбірність коефіцієнта шансів), наприклад.


Дякую за корисну інформацію. Відкладаючи оцінку ефектів лікування, я хотів би детальніше розібратися про прагматичні наслідки цього питання. Якщо ви переглянули документ, і явно були пропущені важливі прогнози, чи це може бути підставою для відмови? Я запитую це тому, що: а) я ніколи не чув про це, що трапляється, і б.) Соціологи часто включають ТІЛЬКИ прогнозів, про які вони хочуть знати більше (тобто тему дослідження) та нехтують "уже відомими" факторами ( виходячи з необхідності більш ефективного вимірювання).
ATJ

Наприклад, не рідкість бачити модель прихованої змінної, яка має лише Єдиний предиктор для ендогенної змінної. Чи це говорить про розрив між сферою статистики та її впровадженням у фактичних тематичних областях?
ATJ

6
Мабуть, так і є. До попереднього питання підстави для відхилення включатимуть упущення важливих змінних, включення яких дало б різну інтерпретацію включених змінних, або які кардинально змінили б модель. Одного разу я переглянув статтю про ризик раку легенів, в якій було доступно лише те, що хтось курив чи ні, і автори не намагалися оцінити дозу куріння (наприклад, рік пакування). Я рекомендував відверте відхилення.
Френк Харрелл

9

Так, ви повинні включити всі "відповідні змінні", але ви повинні бути розумними щодо цього. Ви повинні подумати про способи побудови експериментів, які б ізолювали вплив вашого явища від неспоріднених речей, яких є багато в реальному світі (на відміну від класної кімнати). Перш ніж потрапити в статистику, вам доведеться зробити важкий підйом у вашому домені, а не в статистиці.

Я закликаю вас не бути цинічним щодо включення всіх відповідних змінних, оскільки це не тільки благородна мета, але й тому, що це часто можливо. Ми говоримо це не заради того, щоб сказати це. Ми насправді це маємо на увазі. Насправді, проектування експериментів та досліджень, які здатні включати всі відповідні змінні, - це те, що робить науку справді цікавою та відрізняється від «експериментів» механічної котлової пластини.

Щоб мотивувати мою заяву, я наведу вам приклад того, як Галілей вивчав прискорення. Ось його опис фактичного експерименту (з цієї веб-сторінки ):

Був взятий шматок дерев’яного лиття чи мізерної форми, довжиною близько 12 ліктів, шириною пів ліктів та товщиною трьох пальців; на її краю був вирізаний канал у ширину трохи більше одного пальця; зробивши цей паз дуже прямим, гладким і відшліфованим, і, обклавши його пергаментом, також максимально гладким і відшліфованим, ми прокатали по ньому твердий, гладкий і дуже круглий бронзовий кульку. Помістивши цю дошку в похиле положення, піднявши одним кінцем якийсь один або два ліктів вище іншого, ми катали кульку, як я вже говорив, по каналу, відзначаючи таким чином, як слід описати, необхідний час здійснити спуск. Ми повторювали цей експеримент не один раз, щоб виміряти час з точністю, щоб відхилення між двома спостереженнями ніколи не перевищувало однієї десятої частини пульсу. Виконавши цю операцію і впевнившись у її надійності, ми тепер прокатали кульку лише на чверть довжини каналу; і, вимірявши час його сходу, ми виявили його точно половиною колишнього. Далі ми пробували інші відстані, порівнювали час на всю довжину з тим, що для половини, або з тим, що на дві третини, або на три чверті, або взагалі на будь-який дріб; в таких експериментах, повторених повну сотню разів, ми завжди виявляли, що проходять проміжки були один до одного як квадрати часів, і це було справедливо для всіх нахилів площини, тобто каналу, по якому ми прокочували куля. Ми також зауважили, що часи спуску для різних нахилів площини пов'язують один одного саме в тому співвідношенні, яке, як ми побачимо згодом,

Для вимірювання часу ми використовували велику посудину з водою, поставлену у піднесеному положенні; на дно цієї посудини була припаяна труба невеликого діаметру, що подає тонку струмінь води, яку ми збирали у невелику склянку під час кожного спуску, будь то на всю довжину каналу чи на частину його довжини; зібрану таким чином воду зважували після кожного спуску на дуже точному балансі; відмінності та співвідношення цих ваг дали нам відмінності та співвідношення часу, і це з такою точністю, що, хоча операція повторювалася багато, багато разів, не було помітного розбіжності в результатах.

d=gt2,
dgtd0=1t0ditid0/dit02/ti2
d0di=t02ti2

Зверніть увагу, як він вимірював час. Це настільки грубо, що мені нагадує, як в ці дні неприродні науки вимірюють свої змінні, думають про "задоволеність клієнтів" чи "корисність". Він зазначає, що похибка вимірювання була в межах десятої частини одиниці часу, btw.

Він включав усі відповідні змінні? Так, він зробив. Тепер ви повинні зрозуміти, що всі тіла тяжіють одне до одного за допомогою сили тяжіння. Отже, теоретично для обчислення точної сили на кулю потрібно додати до рівняння кожне тіло у Всесвіті. Крім того, набагато важливіше, що він не включав поверхневий опір, вологостійкість, імпульс кута тощо. Чи все це впливало на його вимірювання? Так. Однак вони не мали відношення до того, що він вивчав, оскільки він зміг зменшити чи усунути їх вплив, виділивши вплив майна, яке він вивчав.

t2


Що так грубо в його методі вимірювання часу? Установка матиме конкретну швидкість, з якою вода покине велику посудину і ввійде в чашку; якщо припустити, що судно містить велику кількість води, ця швидкість зміниться мінімально. Що ще важливіше, він буде залишатися послідовним протягом експериментів. Це насправді дуже елегантний метод, враховуючи, що тоді у них не було секундомірів та модних автоматичних таймерів.
JAB

@JAB, це, звичайно, лише порівняно із зупинкою годинника чи сучасними способами вимірювання часу. Ви абсолютно праві, що це дуже елегантно, враховуючи сучасність вимірювання часу в часи Галілея. Однак я висловив думку про те, що навіть такої, здавалося б, низької точності (1/10 інтервалу) все-таки було достатньо, щоб спостерігати співвідношення між часом та відстані
Аксакал

@JAB, один з моїх улюблених прикладів смішних методів вимірювання у фізиці - це те, як Черенков виявив своє випромінювання . Він би сидів у темній кімнаті, поки очі не пристосуються до темряви, потім він відкриє або закриє отвір світлом, що йде від нього, поки світло не зникне. Він записував, яка кількість отвору відкрита, щоб виявити рівень випромінювання. Мабуть, людське око може виявити різницю світла, виміряну в жмені фотонів! Папір завдовжки 3 сторінки.
Аксакал

6

Для того, щоб припущення регресійної моделі були ідеальними, необхідно включити всі відповідні прогнози. Але жодне з припущень будь-якого статистичного аналізу не є ідеальним, і більша частина статистичної практики базується на "Досить близько".

При проектуванні експериментів та правильній рандомізації ефект термінів, не включених до моделей, часто може ігноруватися (вважається рівним шансом рандомізації). Але, як правило, регресія використовується тоді, коли повна рандомізація неможлива для обліку всіх можливих змінних, що не входять до моделі, тому ваше питання стає важливим.

Насправді в будь-якій регресійній моделі, яка колись підходила, ймовірно, відсутні деякі потенційні прогнози, але "я не знаю" без будь-яких додаткових роз'яснень не дозволяло б працюючим статистикам продовжувати працювати, тому ми намагаємося зробити все, а потім спробуємо розробити, наскільки різниця між припущеннями та реальністю впливатиме на наші результати. У деяких випадках відмінність від припущень дуже відрізняється, і ми не дуже переживаємо про різницю, але в інших випадках це може бути дуже серйозно.

Один з варіантів, коли ви знаєте, що можуть бути прогнози, які не були включені в модель, яка була б доречною, - це зробити аналіз чутливості. Це вимірює, наскільки можлива упередженість на основі потенційних зв’язків із незміреною змінною. Ця стаття:

Lin, DY і Psaty, BM і Kronmal, RA. (1998): Оцінка чутливості результатів регресії до немережних плутанин у спостережних дослідженнях. Біометрія, 54 (3), верес., С. 948-963.

дає деякі інструменти (і приклади) аналізу чутливості.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.