Існує щонайменше три (може бути більше) підходів для виконання завантажувальної програми для лінійної регресії з незалежними, але не однаково розподіленими даними. (Якщо у вас є інші порушення "стандартних" припущень, наприклад, через автокореляцію з даними часових рядів або кластеризацію через дизайн вибірки, все ускладнюється).
- Ви можете повторно проаналізувати спостереження в цілому, тобто взяти зразок із заміною з вихідних даних . Це буде асимптотично еквівалентно корекції гетероскедастичності Хубера-Білого .{ ( y i , x i ) }( у∗j, х∗j){ ( уi, хi) }
- Ви можете підходити до своєї моделі, отримувати залишки і перепропонувати самостійно та із заміною їх відповідних емпіричних розподілів, але це розбиває структури гетероскедастичності, якщо такі є, тому я сумніваюся, що цей завантажувальний пристрій є послідовним. х * J е * Jеi= уi- х'iβ^х∗jе∗j
- Ви можете виконати дикий завантажувальний запуск, в якому ви переутворюєте знак залишку, який контролює умовний другий момент (і, з деякими додатковими налаштуваннями, і для умовного третього моменту теж). Це була б процедура, яку я б рекомендував (за умови, що ви можете зрозуміти це та захистити його перед іншими, коли запитають: "Що ви зробили, щоб контролювати гетерокедастичність? Як ви знаєте, що це працює?").
Кінцевою посиланням є Ву (1986) , але Аналі не є саме читанням картинок.
ОНОВЛЕННЯ на основі наступних питань ОП, заданих у коментарях:
Кількість повторень мені здалася великою; Єдине добре обговорення цього параметра завантажувальної програми, про який я знаю, - це книга "Вступ до завантаження" Efron & Tibshirani .
Я вважаю, що загалом подібні виправлення у зв'язку з відсутністю припущень щодо розподілу можна отримати за допомогою стандартних помилок Хубера / Білого. У підручнику Cameron & Triverdi обговорюється еквівалентність пари завантажувальної пари та корекція гетероскедастичності Уайта. Еквівалентність випливає із загальної теорії стійкості для оцінок: обидва виправлення спрямовані на виправлення припущень розподілу, якими б вони не були, з мінімальним припущенням кінцевих секунд залишків та незалежності між спостереженнями. Дивіться також Хаусмана та Палмера (2012) про більш конкретні порівняння в кінцевих зразках (версія цього документу доступна на одному з веб-сайтів авторівМ) на порівняння між виправленнями завантаження та гетерокедастичністю.