Мені цікаво, чи є евристика за кількістю ознак проти кількості спостережень. Очевидно, якщо низка особливостей дорівнює кількості спостережень, модель буде перевершувати. За допомогою розріджених методів (LASSO, еластична сітка) ми можемо усунути кілька функцій, щоб зменшити модель.
Моє запитання (теоретично): перед тим, як використовувати метрики для оцінки вибору моделі, чи існують емпіричні спостереження, які співвідносять оптимальну кількість ознак із кількістю спостережень?
Наприклад: для проблеми бінарної класифікації з 20 екземплярами у кожному класі, чи існує якась верхня межа щодо кількості функцій, які слід використовувати?