Справжнє значення еліпсу впевненості


12

Читаючи про справжнє значення 95% впевненого еліпса, я схиляюся до двох пояснень:

  1. Еліпс, який містить 95% даних
  2. Не вище, а еліпс, що пояснює дисперсію даних. Я не впевнений, що я правильно розумію, але вони, мабуть, означають, що якщо з'явиться нова точка даних, є 95% шансів, що нова дисперсія залишиться в еліпсі.

Ви можете пролити трохи світла?

Відповіді:


15

Насправді жодне пояснення не є правильним.

Еліпс довіри має відношення до неспостережуваних параметрів населення , як справжній середній показник популяції вашого двовимірного розподілу. 95% достовірність еліпса для цього означає справді алгоритм із наступним властивістю: якби ви багато разів повторювали вибірку з базового розподілу і кожен раз обчислювали довіру еліпса, то 95% так побудованих еліпсів містили б основу маю на увазі. (Зверніть увагу, що кожен зразок, звичайно, дасть різний еліпс.)

Таким чином, довірчий еліпс зазвичай не містить 95% спостережень. Насправді, у міру збільшення кількості спостережень середня величина, як правило, буде краще та краще оцінюватися, що призводить до менших та менших довіри еліпсів, які, у свою чергу, містять все меншу та меншу частку фактичних даних. (На жаль, деякі люди обчислюють найменший еліпс, який містить 95% своїх даних, нагадуючи квантил, який сам по собі є цілком нормальним ... але далі продовжуємо називати цей "квантильний еліпс" "впевненим еліпсом", який, як бачите, призводить до плутанини.)

Різниця базової сукупності стосується довірчого еліпса. Висока дисперсія буде означати, що дані перебувають в усьому місці, тому середня величина недостатньо оцінена, тому довіра еліпса буде більшою, ніж якби дисперсія була меншою.

Звичайно, ми можемо обчислити еліпси довіри також для будь-якого іншого параметру сукупності, який ми можемо бажати оцінити. Або ми можемо подивитися на інші області довіри, ніж еліпси, особливо якщо ми не знаємо, як оцінений параметр повинен бути (асимптотично) нормально розподілений.

Одновимірний аналог достовірного еліпса - це , і корисний перегляд попередніх питань у цьому тезі. Наше сьогоднішнє запитання з найвищим голосом у цьому тезі є особливо приємним: Чому 95% ІС не передбачає 95% шансу містити середнє? Більшість обговорень, що там обговорюються, так само добре стосуються і вищих розмірних аналогів одновимірного довірчого інтервалу.


1

Це залежить від області, до якої ця концепція стосується. Те, що було сказано вище, стосується статистики, але коли ми застосовуємо статистику до інших предметів, справи дещо відрізняються. Наприклад, в біомеханіці ми використовуємо термін впевнений еліпс (хоча є дискусія, чи це повинен бути прогнозуючий еліпс) як техніку вимірювання центру переміщення тиску, коли суб'єкт стоїть на платформі сили. Тоді еліпс, який намальований навколо двох осей (основної та другорядної), повинен містити 95% точок даних, які представляють центр переміщення тиску за час випробування.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.