Я хочу запустити регресію з 4 до 5 пояснювальних змінних, але у мене є лише 15 спостережень. Не маючи можливості припустити, що ці змінні зазвичай розподілені, чи існує непараметричний чи будь-який інший дійсний метод регресії?
Я хочу запустити регресію з 4 до 5 пояснювальних змінних, але у мене є лише 15 спостережень. Не маючи можливості припустити, що ці змінні зазвичай розподілені, чи існує непараметричний чи будь-який інший дійсний метод регресії?
Відповіді:
@Glen_b має рацію щодо природи припущення про нормальність в регресії 1 .
Я думаю, що вашою більшою проблемою буде те, що у вас недостатньо даних для підтримки 4 - 5 пояснювальних змінних. Стандартне правило 2 полягає в тому, що у вас має бути принаймні 10 даних на пояснювальну змінну, тобто 40 або 50 даних у вашому випадку (і це ідеально для ситуацій, коли питання про припущення не виникає). Тому що ваша модель не була б повністю насиченою 3(у вас більше даних, ніж параметри, що підходять), ви можете отримати параметри (нахил тощо), і при ідеальних обставинах оцінки є асимптотично неупередженими. Однак цілком ймовірно, що ваші оцінки будуть далеко вдалині від справжніх значень, а показники ваших ІС / ІС будуть дуже великими, тому у вас не буде статистичної сили. Зауважте, що використання непараметричного чи іншої альтернативи регресійного аналізу не дозволить вам позбутися цієї проблеми.
Тут вам потрібно буде або вибрати одну пояснювальну змінну (перед тим, як переглянути ваші дані!) На основі попередніх теорій у вашій галузі або ваших переслідувань, або ви повинні поєднати пояснювальні змінні. Розумна стратегія останнього варіанту - запустити аналіз основних компонентів (PCA) та використовувати перший компонент принципу як свою пояснювальну змінну.
Посилання:
1. Що робити, якщо залишки зазвичай розподіляються, але Y - ні?
2. Правила великого розміру для мінімального розміру вибірки для множинної регресії
3. Максимальна кількість незалежних змінних, які можна ввести в рівняння множинної регресії