Що станеться, якщо залишки не є гомосептичними? Якщо залишки показують зростаючу чи зменшувальну картину в графіку Залишкові та Пристосовані.
Якщо термін помилки не є гомосептичним (ми використовуємо залишки як проксі для терміну непомітної помилки), Оцінювач OLS все ще є послідовним та неупередженим, але вже не є найбільш ефективним у класі лінійних оцінювачів. Саме оцінювач GLS зараз користується цією властивістю.
Що станеться, якщо залишки нормально не поширюються і не виконають тест Шапіро-Вілка? Тест на нормальність Шапіро-Вілка є дуже суворим тестом, і іноді навіть якщо графік Normal-QQ виглядає дещо розумним, дані не піддаються тесту.
Нормальність не вимагається теоремою Гаусса-Маркова. Оцінювач OLS все ще БІЛЬКИЙ, але без нормальності у вас виникнуть труднощі робити висновки, тобто тестування гіпотез та довірчі інтервали, принаймні для кінцевих розмірів вибірки. Проте, ще є завантажувальний пристрій.
Асимптотично це менше проблеми, оскільки Оцінювач OLS має обмежуючий нормальний розподіл в умовах легкої регулярності.
Що станеться, якщо один або декілька предикторів не поширюються нормально, не дивляться правильно на графік Normal-QQ або якщо дані не відповідають тесту Шапіро-Вілка?
Наскільки мені відомо, передбачувачі вважаються фіксованими, або регрес їх умовний. Це обмежує ефект ненормальності.
Що означає недотримання нормальності для моделі, яка добре підходить відповідно до значення R-Squared. Це стає менш надійним, або зовсім марним?
R-квадрат - це частка дисперсії, поясненої моделлю. Це не вимагає припущення про нормальність, і це міра корисності придатності незалежно. Якщо ви хочете використовувати його для часткового F-тесту, це зовсім інша історія.
Наскільки відхилення прийнятне, або воно взагалі прийнятне?
Ви маєте на увазі відхилення від нормальності, правда? Це дійсно залежить від ваших цілей, оскільки, як я вже сказав, висновок стає важким за відсутності нормальності, але не є неможливим (завантаження!).
Застосовуючи перетворення на даних, щоб відповідати критеріям нормальності, чи покращується модель, якщо дані є більш нормальними (вище P-значення в тесті Шапіро-Вілка, краще дивлячись на звичайний QQ-графік), або вони марні (однаково добре або погано порівняно з оригіналом), поки дані не пройдуть тест на нормальність?
Коротше кажучи, якщо у вас є всі припущення Гаусса-Маркова плюс нормальність, то оцінювач OLS - найкращий безпристрасний (BUE), тобто найефективніший у всіх класах оцінювачів - досягається нижня межа Крамера-Рао. Це бажано, звичайно, але це не кінець світу, якщо цього не відбудеться. Наведені вище зауваження стосуються.
Щодо перетворень, майте на увазі, що хоча розподіл відповіді може бути наближений до нормальності, інтерпретація може бути не простою.
Це лише короткі відповіді на ваші запитання. Ви, здається, особливо стурбовані наслідками ненормальності. В цілому, я б сказав, що це не так катастрофічно, як вірять люди (до чого? Дві посилання, які я включив, є гарною відправною точкою для подальшого читання, перша теоретична.
Список літератури :
Хаяші, Фуміо. : "Економетрика.", Прінстонський університетський прес, 2000
Кутнер, Майкл Х. та ін. "Прикладні лінійні статистичні моделі.", МакГрау-Хілл Ірвін, 2005.