Я намагаюсь передбачити балансову оцінку і спробував кілька різних методів регресії. Одне, що я помітив, - це те, що передбачувані значення, здається, мають якусь верхню межу. Тобто фактичний баланс знаходиться у , але мої прогнози становлять приблизно . Наступний графік показує фактичний та передбачуваний баланс (прогнозований з лінійною регресією):
Ось два графіки розподілу з однаковими даними:
Оскільки мої прогнози дуже перекошені (дані користувачів з розподілом закону про владу), я застосував перетворення Box-Cox, яке змінює результати на наступне:
Хоча це змінює розподіл передбачень, все ще існує ця верхня межа. Отже, мої запитання:
- Які можливі причини таких верхніх меж у результатах прогнозування?
- Як я можу зафіксувати прогнози, які відповідають розподілу фактичних значень?
Бонус: Оскільки розподіл після трансформації Box-Cox, здається, слідує за розподілами трансформованих предикторів, чи можливо це безпосередньо пов'язане? Якщо так, чи можна застосувати перетворення, яке відповідає розподілу фактичним значенням?
Редагувати: я використовував просту лінійну регресію з 5 прогнокторами.