Я зіткнувся з простим питанням щодо порівняння гнучких моделей (тобто сплайнів) та негнучких моделей (наприклад, лінійної регресії) за різних сценаріїв. Питання:
Загалом, чи очікуємо, чи ефективність гнучких методів статистичного навчання може бути кращою чи гіршою, ніж негнучка методика, коли:
- Кількість предикторів надзвичайно велика, а кількість спостережень невелика? н
- Дисперсія термінів помилки, тобто , надзвичайно велика?
Я думаю, що для (1), коли мало, негнучкі моделі краще (не впевнені). Для (2) я не знаю, яка модель (відносно) краща.