Звичайно, ви також повинні визначитися з коефіцієнтами розщеплення для (подвійного) перекомпонування ...
Однак переустановка зазвичай працює для досить широкого діапазону коефіцієнтів розщеплення, якщо мати на увазі
- не робити відпустку, якщо це зменшить кількість можливих чітких прогонів
- залиште достатньо випадків тренувань у найглибшому навчальному наборі, щоб алгоритм відстеження мав гідний шанс створити корисну модель.
- чим більше незалежних випадків у вас, тим менш важливими є ці міркування.
А що робити, якщо ви працюєте за великими масштабними даними (але не великими даними) 10000 <N <1000000?
Що ви можете зробити, якщо не впевнені в необхідності перекомпонування - це повторити вибір декількох разів. Досить, щоб ви могли виміряти, чи потрібно було переустановку.
- перевірити стабільність своїх прогнозів
- перевірити стійкість параметрів моделі
За допомогою цих результатів ви можете вирішити, чи слід додавати більше повторних моделей ітерацій чи все добре, як є.