Чи є якийсь "стандарт" для позначення статистичної моделі?


10

Наприклад, у посібнику про BUGS або в майбутній книзі Лі та Вагенмакерс ( pdf ) та в багатьох інших місцях використовується тип позначень, що мені здається дуже гнучким, оскільки він може бути використаний для короткого опису більшості статистичних моделей. Прикладом цього позначення є наступне:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

яка описувала б ієрархічну логістичну модель без предикторів, але з i=1n груп. Цей спосіб опису моделей, здається, працює однаково добре для опису частотистських та баєсівських моделей, наприклад, щоб зробити цей опис моделі повністю баєсівським, вам просто доведеться додати пріори на μp та σp .

Чи детально описаний цей тип моделювання / формалізму в якійсь статті чи книзі?

Якщо ви хочете використовувати цю позначення для написання моделей, існує багато різних способів вчинити, і було б дуже корисно з вичерпним посібником як слідкувати, так і посилатися на інших. Я знайшов деякі відмінності в тому, як люди використовують цей тип позначень:

  • Як ви називаєте дистрибуції? Наприклад, я бачив N,N,Norm,Normal тощо.
  • Як ви маєте справу з індексами? Наприклад, я бачив yij , уi[j] , уj|i тощо.
  • Які символи параметрів зазвичай використовуються для параметрів. Наприклад, звичайно використовувати мк як засіб для нормального розподілу, а як щодо інших розподілів? (Для цього я зазвичай перевіряю розповсюдження Вікіпедії )

Подальше запитання: Чи має це позначення назву? (Через відсутність кращого імені я назвав це конвенцією розподілу ймовірностей, орієнтованою на ймовірність, у своїй публікації в блозі, яку я написав ...)

Відповіді:


2

Деякі рекомендовані стандарти для статистичного позначення представлені у Гальперіна, Хартлі та Хоеля (1965) та Сандерса та П'ю (1972) . Більшість сучасних позначень походить від конвенцій, які були встановлені біометричними статистиками наприкінці 19 - початку 20 століття (більшість з них були зроблені Пірсоном та Фішером та їхніми соратниками). Економіст Джон Олдріх тут підтримує корисний перелік раннього вживання нотацій , а в Олдріху (2003) опубліковано історичний опис англійської біометричної школи . (Якщо у вас є додаткові запитання щодо цієї теми, Олдріх - це, мабуть, найбільший в світі експерт із історії нотації статистики.)

Окрім цієї чіткої роботи, існує чимало книг, які дають ознайомлення з полем, і вони обережно визначають позначення, що відповідають загальним конвенціям, визначаючи позначення під час їх подальшої роботи. У цій галузі існує багато відомих конвенцій, які послідовно діють з літератури, і статистики добре знайомі з ними через практику, навіть не ознайомившись з рекомендаціями цих дослідників.

Неоднозначність позначень, орієнтованих на розподіл: Використання позначень "орієнтоване на розподіл" - це стандартна конвенція, яка використовується у всій статистичній літературі. Однак одна цікава річ, яку слід зазначити щодо цієї нотації, - це те, що вона насправді означає, що це неприємне хитання. Стандартна умова полягає у тому, щоб прочитати об'єкт з правої частини цих висловлювань як якийсь опис міри ймовірності (наприклад, функції розподілу, функції щільності тощо), а потім прочитативідношення зі значенням "... має розподіл ..." або "... має міру ймовірності ..." і т. д. За цією інтерпретацією відношення порівнює дві різні сукупності речей; об’єкт з лівої сторони є випадковою змінною, а об'єкт з правого боку - описом міри ймовірності.

Однак так само справедливо трактувати праву частину як посилання на випадкову змінну (на відміну від розподілу) і читати відношення як значення "... має таке ж розподіл, як ..." . У цій інтерпретації відношення - це відношення еквівалентності, що порівнює випадкові величини; об'єкти ліворуч та праворуч є випадковими змінними, а відношення є рефлексивним, симетричним та перехідним.

Це дає дві можливі (і однаково справедливі) інтерпретації твердження типу:

ХN(мк,σ2).
  • Інтерпретація розподілу: " має розподіл ймовірностей ". Ця інтерпретація вважає, що останній об'єкт є деяким описом нормальної міри ймовірності (наприклад, його щільність, функція розподілу тощо).ХN(мк,σ2)

  • Випадкова інтерпретація змінної: " має такий самий розподіл ймовірностей, що і ". Ця інтерпретація вважає, що останній об'єкт є звичайною випадковою змінною.ХN(мк,σ2)

Кожна інтерпретація має свої переваги та недоліки. Перевага інтерпретації випадкових змінних полягає в тому, що вона використовує стандартний символ для позначення відношення еквівалентності , але його недолік полягає в тому, що він вимагає посилання на випадкові змінні з аналогічним позначенням їх функцій розподілу. Перевага інтерпретації розподілу полягає в тому, що вона використовує подібні позначення для розподілів у цілому та їх функціональних форм із заданим значенням аргументу; недоліком є ​​те, що він використовує символ таким чином, що не є відношенням еквівалентності.


Aldrich J. (2003) Мова англійської біометричної школи Міжнародний статистичний огляд 71 (1) , с. 109-131.

Halperin, M., Hartley, HO and Hoel, PG (1965) Рекомендовані стандарти для статистичних символів та позначень . Американський статистик 19 (3) , стор 12-14.

Sanders, JR and Pugh, RC (1972) Рекомендація щодо стандартного набору статистичних символів та позначень . Дослідник освіти 1 (11) , стор 15-16.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.