Чи існують документи / книги / ідеї про співвідношення між кількістю ознак та кількістю спостережень, які потрібно мати для підготовки "надійного" класифікатора?
Наприклад, припустимо, що у мене є 1000 можливостей та 10 спостережень з двох класів як навчальний набір, та 10 інших спостережень як тестовий набір. Я треную деякі класифікатори X, і це дає мені 90% чутливості та 90% специфічності на тестовому наборі. Скажімо, я задоволений цією точністю, і виходячи з цього, я можу сказати, що це хороший класифікатор. З іншого боку, я наблизив функцію 1000 змінних, використовуючи лише 10 балів, що може здатися не дуже ... надійним?