Я спостерігаю за змаганнями за Kaggle довгий час, і я усвідомлюю, що багато виграшних стратегій передбачають використання принаймні однієї з "великих трійки": розстрілювання, підсилення та складання.
Що стосується регресії, а не концентруватись на побудові однієї найкращої можливої регресійної моделі, створюється кілька регресійних моделей, таких як (Узагальнена) лінійна регресія, випадкові лісові, регресійні моделі KNN, NN та SVM та змішування результатів у розумний спосіб. -виконання кожного окремого методу багато разів.
Звичайно, чітке розуміння кожного методу є ключовим, і інтуїтивну історію можна розповісти на основі лінійної регресійної моделі, але мені цікаво, чи це стало найсучаснішою методологією для досягнення найкращих можливих результатів.