У наборі даних про дві групи, що не перетинаються (пацієнти та здорові, загальна ), я хотів би знайти (із незалежних змінних) значних прогнозів для постійної залежної змінної. Кореляція між предикторами є. Мені цікаво з'ясувати, чи пов’язаний будь-який з предикторів із залежною змінною "насправді" (а не прогнозувати залежну змінну якомога точніше). Оскільки я перейнявся численними можливими підходами, я хотів би запитати, який підхід найбільше рекомендується.
З мого розуміння поетапне включення або виключення прогнозів не рекомендується
Наприклад, запустіть лінійну регресію окремо для кожного прогноктора і виправте р-значення для багаторазового порівняння за допомогою FDR (можливо, дуже консервативно?)
Принципова регресія: складна інтерпретація, оскільки я не зможу розповісти про передбачувальну силу окремих прогнокторів, а лише про компоненти.
будь-які інші пропозиції?