Чому 95% ІС для медіани має бути ?


11

У різних джерелах (див., Наприклад, тут ) наведена наступна формула для довіреного інтервалу для медіани (особливо для того, щоб намалювати виїмки на графіках коробки та вуса):

95% CImedian=Median±1.57×IQRN

Чарівна константа зводить мене з розуму, я не можу зрозуміти, як це було отримано. Різні наближення (наприклад, припустимо, що наш розподіл гауссова і великий) не дають підказки - я отримую різні значення для константи.1.57N


Відповіді:


15

Це легко. Якщо ми перевіримо оригінальний папір, де були введені зубчасті сюжети з коробкою і вусами ( Роберт Макгілл, Джон У. Тукі та Уейн А. Ларсен. 1978), стор. 12-16 ; на щастя, це на JSTOR ), ми знайшли розділ 7, де ця формула обґрунтована таким чином:

Якщо потрібно бажання виїмки, що вказує 95-відсотковий інтервал довіри щодо кожної медіани, буде використано C = 1,96. [Тут C - інша константа, яка пов'язана з нашою, але точне співвідношення не має ніякого значення, як стане зрозуміло пізніше - IS] Однак, оскільки була потрібна форма "вимірювання розриву", яка б вказувала на значні відмінності на рівні 95 відсотків , цього не було зроблено. Можна показати, що C = 1,96 було б доречним лише в тому випадку, якщо стандартні відхилення двох груп були сильно різними. Якби вони були майже рівними, C = 1.386 було б відповідним значенням, а 1.96 призведе до занадто жорсткого тесту (набагато перевищує 99 відсотків). Значення між цими межами, C = 1,7, було емпірично вибрано як переважне. Таким чином, використовувані виїмки були обчислені якM±1.7(1.25R/1.35N) .

Наголос мій. Зауважте, що , що є вашим магічним числом.1.7×1.25/1.35=1.57

Отже, коротка відповідь: це не загальна формула для медіани CI, а певний інструмент візуалізації, а константа була емпірично обрана для досягнення певної мети.

Немає ніякої магії.

Вибачте.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.