У мене є практичне питання щодо функціональної інженерії ... скажіть, я хочу спрогнозувати ціни на будинки, використовуючи логістичну регресію та використовуючи купу функцій, включаючи поштовий індекс. Потім, перевіривши важливість функції, я розумію, що поштовий індекс є досить хорошою характеристикою, тому я вирішив додати ще кілька функцій на основі zip - наприклад, я переходжу до бюро переписів і отримую середній дохід, кількість населення, кількість шкіл та кількість лікарень кожного поштового індексу. Завдяки цим чотирьом новим функціям я вважаю, що ефективність моделей зараз краща. Тож я додаю ще більше функцій, пов’язаних з блискавками ... І цей цикл продовжується і продовжується. Врешті-решт у моделі будуть домінувати ці функції, пов’язані з блискавками, правда?
Мої запитання:
- Чи має сенс це робити в першу чергу?
- Якщо так, то як я можу знати, коли настав час зупинити цей цикл?
- Якщо ні, то чому б і ні?