Зараз я працюю над тим, щоб намагатися реалізувати метод, використаний у популярній роботі під назвою "Я просто перебіг регрес на два мільйони". Основна ідея, що стоїть за ним, полягає в тому, що є певні випадки, коли не очевидно, які елементи управління повинні бути включені в модель. Одне, що ви можете зробити в такому випадку - це випадковим чином намалювати елементи управління, запустити мільйони різних регресій, а потім побачити, як реагувала ваша змінна інтерес. Якщо він, як правило, має однаковий знак у всіх специфікаціях, то ми можемо вважати його більш надійним, ніж змінна, знак якої завжди змінюється.
Більша частина паперу дуже чітка. Однак папір зважує всі ці різні регресії наступним чином: Комплексна ймовірність даної специфікації ділиться на суму всіх інтегрованих ймовірностей для всіх специфікацій.
Проблема, яка у мене виникає, полягає в тому, що я не впевнений, як інтегрована ймовірність стосується регресій OLS, які я хотів би запустити (у Stata). Гуглінг теми, такі як "інтеграція статистичних даних", був глухим кутом, оскільки я продовжую стикатися з такими речами, як логістична регресія змішаних ефектів. Зізнаюся, ці моделі мені занадто складні, щоб зрозуміти.
Моя нинішня робота полягає в тому, що існують різні схеми зважування, які використовуються в літературі, яку я (на зразок) розумію. Наприклад, можна зважити кожну регресію на основі показника коефіцієнта ймовірності. Існує навіть пакет R, який використовує lri як вагу. Природно, хотілося б також реалізувати оригінальний.
Будь-яка порада?
Посилання на папір: http://down.cenet.org.cn/upfile/34/2009112141315178.pdf