Чого, здається, вам не вистачає, це рання історія. Ви можете перевірити статтю Фінберга (2006). Коли байєсівський висновок став "байєсівським"? . По-перше, він зауважує, що Томас Байєс був першим, хто запропонував використовувати єдину форму:
У сучасній статистичній мові документ Байєса вводить рівномірний попередній розподіл на біноміальний параметр , міркуючи за аналогією з "більярдним столом" і спираючись на форму граничного розподілу біноміальної випадкової величини, а не на принципі "недостатня причина", як стверджували багато інших.θ
П'єр Саймон Лаплас був наступним, хто обговорив це:
Лаплас також сформулював, більш чітко, ніж Байєс, свій аргумент щодо вибору рівномірного попереднього розподілу, стверджуючи, що задній розподіл параметра має бути пропорційним тому, що ми називаємо ймовірністю даних, тобто,θ
f( θ ∣ x1, х2, … , Хн) ∝ f( х1, х2, … , Хн∣ θ )
Тепер ми розуміємо, що це означає, що попередній розподіл для
є рівномірним, хоча загалом, звичайно, попередній може не існувати.θ
Більше того, Карл Фрідріх Гаус також посилався на використання неінформативного попереднього, як зазначають Девід та Едвардс (2001) у своїй книзі « Анотація читання в історії статистики» :
Гаусс використовує спеціальний аргумент байєсівського типу, щоб показати, що задня щільність пропорційна ймовірності (в сучасній термінології):год
f( h | x ) ∝ f( х | год )
де він припустив, що рівномірно розподілено по . Гаус не згадує ні Байєса, ні Лапласа, хоча останній популяризував цей підхід ще з Лапласа (1774).год[ 0 , ∞ )
і як зазначає Фінберг (2006), "зворотна ймовірність" (і що випливає з використанням рівномірних пріорів) була популярна на рубежі 19 століття
[...] Таким чином, у ретроспективі не дивно, що обернена ймовірність бачиться як метод вибору великих англійських статистиків рубежу століття, таких як Еджворт та Пірсон. Наприклад, Едгуорт (49) дав одну з найбільш ранніх похідних того, що ми тепер знаємо як розподіл Стьюдента , задній розподіл середнього звичайного розподілу, що дається рівномірними попередніми розподілами на та [...]тмк μh = σ- 1
Рання історія байєсівського підходу також розглядається Стіглером (1986) у своїй книзі «Історія статистики: Вимірювання невизначеності до 1900 року» .
У своєму короткому огляді ви також, схоже, не згадуєте про Рональда Ейльмера Фішера (знову цитується після Фінберга, 2006):
Фішер відступив від зворотних методів і до власного підходу до висновку він назвав "ймовірність", концепція, яку він стверджував, відрізняється від ймовірності. Але прогрес Фішера в цьому плані був повільним. Стіглер (164) зазначав, що в неопублікованому рукописі, що датується 1916 р., Фішер не розрізнив вірогідність і зворотну ймовірність з плоскою до того, хоча, коли пізніше зробив це розрізнення, він стверджував, що він це зрозумів у цей час.
Jaynes (1986) запропонував свій короткий оглядовий документ Bayesian Methods: General Background. Вступний підручник, який ви можете перевірити, але він не зосереджений на неінформативних пріорах. Більше того, як зазначає AdamO , ви обов'язково повинні прочитати Епічну історію максимальної ймовірності від Stigler (2007).
Варто також зазначити, що не існує такого поняття, як "неінформативний пріоритет" , тому багато авторів вважають за краще говорити про "розпливчасті пріори" або "тижневі інформативні пріори" .
Теоретичний огляд надає Касс та Вассерман (1996) у «Вибір попередніх розподілів за формальними правилами» , які детальніше розглядають питання про вибір пріорів, з розширеним обговоренням використання неінформативних пріорів.