Враження, яке я склав, грунтуючись на кількох прочитаних нами працях, книгах та статтях, полягає в тому, що рекомендований спосіб встановлення розподілу ймовірностей на набір даних - це використання максимальної оцінки ймовірності (MLE). Однак, як фізик, більш інтуїтивно зрозумілим способом є просто пристосування pdf моделі до емпіричного pdf даних, використовуючи найменші квадрати. Чому тоді MLE кращий, ніж найменші квадрати, у примірному розподілі ймовірностей? Чи може хтось, будь ласка, вказати мені на науковий документ / книгу, яка відповідає на це запитання?
Моя думка полягає в тому, що MLE не передбачає шумової моделі, а "шум" в емпіричному форматі PDF є гетероскедастичним і не є нормальним.