Як похибки пов'язані з довірчими інтервалами?

11

Може хтось скаже мені різницю між похибками та довірчими інтервалами? В Інтернеті я бачу, як ці два значення вживаються взаємозамінно.

Чи правильно сказати:

"Інтервали довіри відображаються у формі 1,96 і відображаються на графіках у вигляді меж помилок"?

confidence-interval survey polling

— Мінтуз
джерело

1

Корисні дискусії на цю тему можна знайти за допомогою пошуку на нашому сайті .

— whuber

13

Інтернет переповнений сміттям, як всі ми знаємо. Це допомагає знайти авторитетні джерела та зосередитись на них, щоб допомогти вирішити подібні проблеми. Брошура публікується Американської статистичної асоціації (приписується Fritz Scheuren і «повністю оновлений близько 1997») визначає межу похибки як 95% довірчий інтервал (стор. 64, справа).

Зважаючи на це, дивно, що стаття у Вікіпедії про помилку використовує інше визначення, навіть якщо вона посилається на цю брошуру! Wikipedia пише,

Похибка зазвичай визначається як "радіус" (або половина ширини) довірчого інтервалу для певної статистики опитування. ... Коли для опитування повідомляється про єдину глобальну похибку, вона посилається на максимальну похибку для всіх повідомлених відсотків, використовуючи повну вибірку з опитування.

Іншими слова, в Вікіпедію МОС є половиною максимальної шириною набору довірчих інтервалів (які можуть мати покриття , що відрізняються від 95%).

Ми обговорювали цю плутанину (або, принаймні, відсутність стандартизації) в коментарях в інших місцях на цьому веб-сайті. Ми зробили висновок, що вам потрібно чітко розуміти, що ви маєте на увазі під "помилкою помилки", коли ви використовуєте цей термін.

— дзижчати
джерело

7

Не існує загальноприйнятої конвенції щодо того, що таке "похибка", але я думаю (як ви зауважили), вона найчастіше використовується як значення радіусу довірчого інтервалу , або в початковій шкалі оцінки, або у відсотках кошторису. Іноді він використовується як синонім «стандартної помилки», тому потрібно бути обережним, щоб інші зрозуміли, що ви маєте на увазі, коли ви ним користуєтесь.

А «довірчий інтервал» дійсно має універсальне угоду про його значення. Це, в основному, діапазон можливих оцінок, що формуються в результаті процесу оцінки, який би в X% часу (95% є найбільш часто використовуваним) містив справжнє значення оцінюваного параметра. Ця концепція "процесу", який давав би справжнє значення X% часу, є трохи протиінтуїтивним і не повинен змішуватися з "інтервалом достовірності" з байєсівського висновку, який має набагато більш інтуїтивне визначення, але є не те саме, що широко використовуваний довірчий інтервал.

Ваша фактична цитата трохи безладна і потребує незначного виправлення, як описано. Я б уникну цього додаткового використання слова "margin" і віддав би перевагу "смуги помилок". Так:

"Інтервали довіри оцінюються як 1,96, помножені на відповідні стандартні помилки та показані на графіках у вигляді рядків помилок."

(Це відкладає питання про те, чи це хороший спосіб розрахунку довірчих інтервалів, який залежить від вашої моделі тощо та не є актуальним).

Остаточний коментар щодо термінології - мені не подобається "стандартна помилка", яка просто означає "стандартне відхилення оцінки"; або "помилка вибірки" взагалі - я вважаю за краще вважати випадковість та дисперсію статистики, а не "помилки". Але я скористався терміном "стандартна помилка" вище, тому що він настільки широко використовується, я думаю.

— Пітер Елліс
джерело