Справа в тому, що іноді різні моделі (для одних і тих же даних) можуть призводити до імовірнісних функцій, які відрізняються мультиплікативною константою, але зміст інформації повинен бути однозначним. Приклад:
Ми моделюємо n незалежних експериментів Бернуллі, що призводять до даних X1,…,Xn , кожен з розподілом Бернуллі з параметром (ймовірність) p . Це призводить до функції ймовірності
∏i=1npxi(1−p)1−xi
Або ми можемо узагальнити дані за біноміально розподіленою змінною Y=X1+X2+⋯+Xn, що має біноміальне розподіл, що веде до ймовірності функції
(ny)py(1−p)n−y
який як функція невідомого параметраpпропорційний колишній функції ймовірності. Дві функції ймовірності чітко містять однакову інформацію і повинні вести до однакових висновків!
І дійсно, за визначенням вони вважаються тією ж функцією вірогідності.
Інша точка зору: зауважте, що коли ймовірнісні функції використовуються в теоремі Байєса, як це потрібно для байєсівського аналізу, такі мультиплікативні константи просто скасовуються! тому вони явно не мають значення для байєсівського умовиводу. Так само воно скасується при обчисленні коефіцієнтів імовірності, як це використовується в тестах на оптимальні гіпотези (лемма Неймана-Пірсона.) І не матиме впливу на значення оцінок максимальної вірогідності. Тож ми можемо бачити, що в більшості частофілістських висновків це не може грати ролі.
Ми можемо сперечатися з іншої точки зору. Функція ймовірності Бернуллі (далі ми використовуємо термін "щільність") вище - це дійсно щільність щодо міри підрахунку, тобто міра на невід'ємні цілі числа з масою одиниці для кожного невід'ємного цілого числа. Але ми могли б визначити щільність щодо якоїсь іншої домінуючої міри. У цьому прикладі це буде здаватися штучним, але у великих просторах (функціональних просторах) воно справді принципово! Давайте, для цілей ілюстрації, використовувати конкретний геометричний розподіл, написаний λ , з λ(0)=1/2 , λ(1)=1/4, λ(2)=1/8 і так далі. Тоді щільність розподілу Бернуллі по відношенню до λ задається
fλ(x)=px(1−p)1−x⋅2x+1
сенс , що P(X=x)=fλ(x)⋅λ(x)
З цією новою, домінуючою мірою функцією ймовірності стає (з позначенням зверху)
∏i=1npxi(1−p)1−xi2xi+1=py(1−p)n−y2y+n
відзначте додатковий коефіцієнт 2y+n. Отже, при зміні домінуючої міри, що використовується у визначенні функції ймовірності, виникає нова мультипликативна константа, яка не залежить від невідомого параметра p , і явно не має значення. Це ще один спосіб зрозуміти, як мультиплікативні константи повинні бути неактуальними. Цей аргумент можна узагальнити за допомогою похідних Радона-Нікодима (як наведений вище аргумент - приклад.)