Ось якийсь контекст. Мені цікаво визначити, як дві змінні середовища (температура, рівень поживних речовин) впливають на середнє значення змінної реакції протягом 11-річного періоду. Протягом кожного року є дані з понад 100 тис. Локацій.
Мета - визначити, чи реагувало протягом 11 років середнє значення змінних реакцій на зміни змінних умов навколишнього середовища (наприклад, температура тепла + більше поживних речовин = більша реакція).
На жаль, оскільки відповідь є середньою величиною (не дивлячись на середнє значення, просто регулярні міжрічні зміни змінять сигнал), регресія становитиме 11 точок даних (1 середнє значення на рік) з 2 пояснювальними змінними. Мені навіть лінійну позитивну регресію важко вважати доцільною, враховуючи, що набір даних настільки малий (навіть не відповідає номінальному 40 балів / змінної, якщо зв'язок не є надзвичайно сильним).
Чи правильно я роблю це припущення? Чи може хтось запропонувати будь-які інші думки / перспективи, які мені можуть бути відсутні?
PS: Деякі застереження: Не можна отримати більше даних, не чекаючи додаткових років. Отже, наявні дані - це те, з чим ми справді маємо працювати.