Я переглядав документацію Стен, яку можна завантажити тут . Мене особливо зацікавило їх реалізація діагностики Гельмана-Рубіна. Оригінальний документ Gelman & Rubin (1992) визначає потенційний коефіцієнт зменшення масштабу (PSRF) наступним чином:
Нехай є ланцюжком го Маркова, відібраний загальний незалежних ланцюгів. Нехай - середнє значення з го ланцюга, а загальне середнє значення. Визначте, де І визначте B B = \ dfrac {N} {M-1} \ sum_ {m = 1} ^ {M} (\ bar {X} _ {m \ cdot} - \ bar {X} _ {\ cdot \ cdot }) ^ 2 \,. i M ˉ X i ⋅ i ˉ X ⋅ ⋅ W = 1s 2 m =1
Визначте
Документація Стен на сторінці 349 ігнорує термін з а також видаляє мультиплікативний термін. Це їх формула,
Оцінювач дисперсії -
Нарешті, потенційна статистика зменшення масштабу визначається
З того, що я міг бачити, вони не дають посилання на цю зміну формули, і не обговорюють її. Зазвичай не надто велика і часто може бути такою ж низькою, як , тому не слід ігнорувати, навіть якщо термін можна наблизити до 1.
То звідки ця формула?
EDIT: Я знайшов часткову відповідь на питання " звідки береться ця формула? ", Оскільки книга Байєсового аналізу даних Гельмана, Карліна, Стерна та Рубіна (Друге видання) має абсолютно таку ж формулу. Однак книга не пояснює, як / чому виправдано ігнорувати ці терміни?