Важко сказати, не знаючи трохи більше про ваш набір даних та про те, як відокремлений ваш набір даних ґрунтується на вашому функціональному векторі, але, напевно, я б запропонував використовувати крайній випадковий ліс над стандартними випадковими лісами через ваш порівняно невеликий набір зразків.
Екстремальні випадкові ліси дуже схожі на стандартні випадкові ліси, за винятком єдиного винятку, що замість оптимізації розколів на деревах екстремальний випадковий ліс робить розщеплення навмання. Спочатку це здавалося б негативним, але це загалом означає, що ви маєте значно кращі узагальнення та швидкість, хоча AUC на вашому тренувальному наборі, ймовірно, буде трохи гіршим.
Логістичний регрес - це також досить вагома ставка для подібних завдань, хоча при вашій відносно низькій розмірності та малому розмірі вибірки я б переймався переоцінками. Ви можете перевірити, використовуючи K-Найближчі сусіди, оскільки він часто виконує дуже волю з низькими розмірами, але зазвичай не дуже добре поводиться з категоричними змінними.
Якби мені довелося вибрати один, не знаючи більше про проблему, я, безумовно, ставлю свої ставки на екстремальний випадковий ліс, оскільки це дуже ймовірно, що ви дасте хороші узагальнення на цьому наборі даних, а також він обробляє сукупність числових і категоричних даних краще ніж більшість інших методів.