У розділі "Регресія до середнього" Даніеля Канемана "Мислення, швидкий і повільний" наводиться приклад, і читача просять прогнозувати продажі окремих магазинів, враховуючи загальний прогноз продажів та кількість продажів за попередній рік . Наприклад (у прикладі книги є 4 магазини, тут я використовую 2 для простоти):
Store 2011 2012
1 100 ?
2 500 ?
Total 600 660
Наївний прогноз буде 110 і 550 для магазинів 1 і 2, на 10% більше для кожного. Однак автор стверджує, що цей наївний підхід є неправильним. Більш імовірно, що магазин, який працює в слабкій економіці, збільшиться більше ніж на 10%, а кращий продукт, який має більш високу ефективність, збільшиться (або навіть зменшиться) менше ніж на 10%. Тож, можливо, прогноз у 115 (на 15% більше) та 535 (7% зростання) був би "правильнішим", ніж наївний прогноз.
Що я не розумію, - як можна зробити висновок, що продажі 100 магазину 1 - це обов'язково слабкіший магазин? Можливо, через відмінності в розташуванні справжніми засобами часових рядів магазинів 1 і 2 є 10 і 550, а магазин 1 мав супер рік у 2011 році, а магазин 2 мав катастрофічний рік у 2011 році. Тоді чи не було б сенсу прогнозувати зменшення для магазину 1 та збільшення для магазину 2?
Я знаю, що інформація про часовий ряд не була наведена в оригінальному прикладі, але я маю враження, що "регресія до середньої" відноситься до середнього перерізу, і тому інформація про часовий ряд не має значення. Що я нерозумію?