Мені хотілося б знати, чи є якісь / якісь переваги використання стратифікованого вибірки замість випадкової вибірки під час поділу оригінального набору даних на навчальний та тестовий набір для класифікації.
Крім того, чи вводить стратифікований вибірковий отвір більше класифікації в класифікатор, ніж випадковий вибірки
Додаток, для якого я хотів би використовувати стратифіковану вибірку для підготовки даних, є класифікатором випадкових лісів, підготовленим на вихідного набору даних. Перед класифікатором також є етап формування синтетичного зразка (SMOTE [1]), який врівноважує розмір класів.
[1] Чаула, В. Нітеш та ін. " SMOTE: техніка надмірного відбору проб синтетичних меншин ". Journal of Artificial Intelligence Research 16 (2002): 321-357.