Регресія з дуже невеликим розміром вибірки


9

Я хочу запустити регресію з 4 до 5 пояснювальних змінних, але у мене є лише 15 спостережень. Не маючи можливості припустити, що ці змінні зазвичай розподілені, чи існує непараметричний чи будь-який інший дійсний метод регресії?


5
Немає припущення, що будь-яка із пояснювальних змінних є нормальною. Не існує припущення щодо граничного розподілу відповіді. Якщо ви робите тести на ІП або гіпотези, звичайне висновок передбачає умовну нормальність відповіді. Більш важливі припущення про лінійність та постійну розбіжність. З чого складається ваша відповідь (/ чому вона не буде нормальною)?
Glen_b -Встановити Моніку

3
Ні. У вас недостатньо даних. Це дослідницький аналіз. Можливо, ви добре бачите сугестивні стосунки. Але вам слід уникати p-значень, довірчих інтервалів та перевірки гіпотез.
Чарлз

Відповіді:


10

@Glen_b має рацію щодо природи припущення про нормальність в регресії 1 .

Я думаю, що вашою більшою проблемою буде те, що у вас недостатньо даних для підтримки 4 - 5 пояснювальних змінних. Стандартне правило 2 полягає в тому, що у вас має бути принаймні 10 даних на пояснювальну змінну, тобто 40 або 50 даних у вашому випадку (і це ідеально для ситуацій, коли питання про припущення не виникає). Тому що ваша модель не була б повністю насиченою 3(у вас більше даних, ніж параметри, що підходять), ви можете отримати параметри (нахил тощо), і при ідеальних обставинах оцінки є асимптотично неупередженими. Однак цілком ймовірно, що ваші оцінки будуть далеко вдалині від справжніх значень, а показники ваших ІС / ІС будуть дуже великими, тому у вас не буде статистичної сили. Зауважте, що використання непараметричного чи іншої альтернативи регресійного аналізу не дозволить вам позбутися цієї проблеми.

Тут вам потрібно буде або вибрати одну пояснювальну змінну (перед тим, як переглянути ваші дані!) На основі попередніх теорій у вашій галузі або ваших переслідувань, або ви повинні поєднати пояснювальні змінні. Розумна стратегія останнього варіанту - запустити аналіз основних компонентів (PCA) та використовувати перший компонент принципу як свою пояснювальну змінну.

Посилання:
1. Що робити, якщо залишки зазвичай розподіляються, але Y - ні?
2. Правила великого розміру для мінімального розміру вибірки для множинної регресії
3. Максимальна кількість незалежних змінних, які можна ввести в рівняння множинної регресії

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.