Я вчусь використовувати пакет BTYD, який використовує модель Pareto / NBD, щоб передбачити, коли очікується повернення замовника. Однак уся література про цю модель сповнена математики, і, здається, не існує простого / концептуального пояснення функціонування цієї моделі. Чи можна зрозуміти модель Pareto / NBD для не-математиків? Я переглянув цей відомий документ Фейдера . Модель Pareto / NBD передбачає такі припущення:
i. Під час активності кількість операцій, здійснених клієнтом за часовий період t, розподіляється Пуассоном зі швидкістю транзакцій λ.
ii. Неоднорідність ставок транзакцій серед клієнтів слід розподілу гамми з параметром форми r та параметром шкали α.
iii. У кожного замовника спостерігається незабезпечений «термін експлуатації» довжиною τ. Цей момент, коли клієнт стає неактивним, розподіляється експоненціально зі швидкістю випадання µ.
iv) Неоднорідність швидкості випадання серед клієнтів слід розподілу гамми з параметром форми s та параметром шкали β.
v. Коефіцієнт транзакції λ та коефіцієнт відмови µ змінюються незалежно від клієнтів. "
Я не розумію (інтуїція позаду) обґрунтування припущень (ii), (iii) та (iv). Чому тільки ці дистрибуції, чому не інші?
Також припущення щодо моделі BG / NBD:
i.) Під час активності кількість транзакцій, здійснених клієнтом, слідкує за процесом Пуассона зі швидкістю трансакції λ. Це еквівалентно припущенню, що час між транзакціями розподіляється експоненціально зі швидкістю транзакції λ
ii) Гетерогенність у λ слід гамма-розподілу
iii) Після будь-якої транзакції замовник стає неактивним із ймовірністю p. Тому точка, в якій клієнт «випадає», розподіляється між транзакціями відповідно до (зміщеного) геометричного розподілу з pmf
iv) Гетерогенність у p слід за бета-розподілом
(Інтуїтивна) раціональність припущень (ii), (iii) та (iv) також зовсім не очевидна.
Я буду вдячний за будь-яку допомогу. Дякую.