Вузький інтервал довіри - більша точність?


18

У мене є два питання щодо довірчих інтервалів:

Мабуть, вузький довірчий інтервал означає, що існує менший шанс отримати спостереження протягом цього інтервалу, отже, наша точність вище.

Також 95% довірчий інтервал вужчий, ніж 99% довірчий інтервал, який ширший.

Інтервал довіри 99% є більш точним, ніж 95%.

Чи може хтось дати просте пояснення, яке могло б допомогти мені зрозуміти цю різницю між точністю та вузькістю?


2
Я думаю, ви маєте на увазі "є менший шанс отримати спостереження поза цим інтервалом". На жаль, інтервал довіри може не означати те, що він, мабуть, означає через технічні, статистичні проблеми, але в цілому вужчий інтервал (на заданому рівні довіри), тим менша невизначеність щодо результатів. На цьому сайті є багато тем, що обговорюють, що означає Інтервал довіри (на відміну, скажімо, від Інтернету). Ми навіть не потрапляємо в прогнозовані інтервали ...
Уейн,

@Wayne Чому твердження не може бути "є менший шанс отримати спостереження протягом цього інтервалу"? Оскільки вузький інтервал має велику помилку типу 1, то швидше відхилити справжню нульову гіпотезу, тобто моє справжнє нульове значення не міститься в цьому інтервалі. Отже, мені здається, a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalце правильно. Скажіть, будь ласка, мені, де я роблю помилку?
користувач 31466

Відповіді:


19

Ці 95% взагалі не прикріплені до чисельності того, наскільки ви впевнені, що ви покрили справжній ефект у своєму експерименті. Можливо, визнаючи, що "інтервал використання 95% розрахунку діапазону покриття" може бути більш точною назвою для цього. Ви можете зробити вибір, щоб вирішити, що інтервал містить справжнє значення; і ви матимете рацію, якщо будете робити це послідовно 95% часу. Але ви дійсно не знаєте, наскільки це можливо для вашого конкретного експерименту без додаткової інформації.

Q1: Ваш перший запит поєднує дві речі та зловживає терміном. Недарма ви розгублені. Більш вузький інтервал довіри може бути більш точним, але, якщо обчислюватися однаково, як, наприклад, метод 95%, всі вони мають однакову точність. Вони фіксують справжнє значення однакову частку часу.

Крім того, тільки тому, що вона вузька, це не означає, що ви менше шансів зустріти зразок, який потрапляє в цей вузький інтервал довіри. Вузький інтервал довіри можна досягти одним із трьох способів. Експериментальний метод або природа даних може просто мати дуже низьку дисперсію. Інтервал довіри навколо температури кипіння водопровідної води на рівні моря досить невеликий, незалежно від розміру проби. Інтервал довіри навколо середньої ваги людей може бути досить великим, оскільки люди дуже мінливі, але можна зробити цей довірчий інтервал меншим, лише отримавши більше спостережень. У цьому випадку, коли ви отримуєте більшу впевненість у тому, де ви вважаєте, що це справжня цінність, збираючи більше зразків і складаючи більш вузький інтервал довіри, то ймовірність зустріти особу в цьому довірчому інтервалі дійсно знижується. (це зменшується в будь-якому випадку, коли ви збільшуєте розмір проби, але, можливо, ви не заважаєте збирати великий зразок у футлярі з окропом). Нарешті, це може бути вузьким, оскільки зразок не представлений. У такому випадку ви, швидше за все, маєте один з 5% інтервалів, який не містить справжнього значення. Це трохи парадокс щодо ширини CI, і щось, що ви повинні перевірити, знаючи літературу та те, наскільки ці дані є змінними. У такому випадку ви, швидше за все, маєте один з 5% інтервалів, який не містить справжнього значення. Це трохи парадокс щодо ширини CI, і щось, що ви повинні перевірити, знаючи літературу та те, наскільки ці дані є змінними. У такому випадку ви, швидше за все, маєте один з 5% інтервалів, який не містить справжнього значення. Це трохи парадокс щодо ширини CI, і щось, що ви повинні перевірити, знаючи літературу та те, наскільки ці дані є змінними.

Далі врахуйте, що інтервал довіри полягає у спробі оцінити справжню середню цінність населення. Якби ви знали про це місце, тоді ви були б ще більш точними (і точними) і навіть не мали б діапазону оцінок. Але ймовірність зустріти спостереження з таким самим значенням буде набагато нижчою, ніж знайти його в будь-якому конкретному інтерфейсі на основі вибірки.

Q2 : Довірчий інтервал 99% ширший, ніж 95%. Тому більш імовірно, що він буде містити справжнє значення. Дивіться відмінність вище між точним і точним, ви плутаєте це два. Якщо я зробить довірчий інтервал вужчим із меншою мінливістю та більшим розміром вибірки, він стане більш точним, ймовірні значення охоплюють менший діапазон. Якщо я збільшую покриття, використовуючи 99% обчислення, воно стає більш точним, справжнє значення швидше буде в межах діапазону.


2
Змінність середнього значення (= те, що ви намагаєтесь оцінити) у сукупності дорівнює нулю.
Нік Саббе

10

Для даного набору даних підвищення рівня довіри інтервалу довіри призведе лише до більших інтервалів (або, принаймні, не менше) ). Йдеться не про точність чи точність, а про те, скільки ризику ви готові взяти на себе, якщо пропустити справжнє значення.

Якщо ви порівнюєте інтервали довіри для одного і того ж параметра з декількох наборів даних, і один менший, ніж інший, ви можете сказати, що менший є більш точним . Я вважаю за краще говорити про точність, а не про точність у цій ситуації (див. Цю відповідну статтю у Вікіпедії ).


Що розуміють під "однаковим параметром" та "кількома наборами даних"? Скажімо, опитування щодо неграмотності та опитування проводиться в різний час, 1995, 1998 рр. Тощо. Тоді чи є такий самий параметр "показник неграмотності" і чи вказують набори даних 1995, 1998 рр. Тощо декілька наборів даних?
користувач 31466

Наприклад, набір довірчих інтервалів, кожен для середньої кількості певної сукупності. Ваш приклад теж підходить, я думаю.
Карл

3

Перш за все, CI для заданого відсотка довіри (наприклад, 95%) означає, що для всіх практичних цілей (хоча технічно це не правильно) ви впевнені, що справжнє значення знаходиться в інтервалі.

Якщо цей інтервал є "вузьким" (зауважте, що це можна розглядати лише відносно, тому, для порівняння з подальшим, скажімо, він є шириною 1 одиниці), це означає, що не так багато місця для гри: залежно від значення вибираєте, що цей інтервал буде близький до справжнього значення (оскільки інтервал вузький), і ви впевнені в цьому (95%).

Порівняйте це із порівняно широким 95% ІС (щоб відповідати прикладу раніше, скажімо, що він шириною 100 одиниць): ось, ви все ще на 95% впевнені, що справжнє значення буде в цьому інтервалі, але це не дуже говорить вам багато, оскільки в інтервалі є відносно багато значень (приблизно коефіцієнт 100 на відміну від 1 - і я знову прошу пуристів ігнорувати спрощення).

Як правило, вам знадобиться більший інтервал, коли ви хочете бути на 99% впевнені, що в ньому справжнє значення, ніж тоді, коли вам потрібно бути впевненим лише на 95% (зверніть увагу: це може бути неправдою, якщо інтервали не вкладені ), отже, чим більше впевненості вам потрібно, тим ширший інтервал вам потрібно буде вибрати.

З іншого боку, ти знаходитеся більш визначеним з більш високим довірчим інтервалом. Отже, якщо я дам вам два інтервали однакової ширини, і я кажу, що один - 95%, а інший - 99%, я сподіваюся, що ви віддасте перевагу 99%. У цьому сенсі 99% ІС є більш точними: у вас менше сумнівів, що ви пропустили правду.


Спасибі! тож тоді, коли вони кажуть, що це нове дослідження нейтрино, швидше, ніж світло, має дуже малий довірчий інтервал (я думаю, це означає вузький), то це означає, що вони, швидше за все, будуть точними, якщо це був широкий довірчий інтервал? (ігноруючи всі інші аспекти)
upabove

10
Нік, ваше перше твердження неправильне. Це не "технічне питання", це просто не правильно. Інтервал довіри - це твердження про те, що відбудеться в повторних експериментах, що вони покриватимуть справжнє значення 95% часу. Заява про впевненість, що справжнє значення знаходиться в моєму заданому діапазоні, знайденому в моєму експерименті, зовсім не таке, як у цьому. Якщо ви видалили "те" у "тій впевненій" та числовій кількості з дужкою, то ви були б ближче до істини. Ви можете просто сказати, що це означає, що ви вірите в справжнє значення, яке може впасти в інтервалі.
Іван,

інакше відповідь досить хороша ...
Джон

4
@John: Я спеціально уникав говорити, що сам інтервал є випадковою величиною, хоча моє речення не означає, що цього не має бути (правда, він так і пропонує). Я знаю проблеми, які стосуються, але визнав їх не важливими для питання. Я ніколи не бачив практичної ситуації, коли різниця мала б значення, отже, "для всіх практичних цілей".
Нік Саббе

4
Ви не стикалися з проблемою? Це як сказати p-значення = ймовірність нуля, а потім сказати, що ви ніколи не стикалися з проблемою. Ви не будете, якщо будете залишатися в потрібних журналах. Просто неправильно говорити, що ви на 95% впевнені, що справжнє значення знаходиться у вашому поточному діапазоні. Трактувати це як деяку езотеричну речовину просто означає, що зараз у нас буде (принаймні) ще одна людина, яка ходить, кажучи: "Я на 95% впевнена, що цінність знаходиться в цьому діапазоні". Навряд чи змінить вашу відповідь, щоб її виправити. Інші проблеми, з якими ви спідницю, можна було б проігнорувати, якби ви змінили це одне твердження.
Джон,

3

Я додаю тут кілька хороших відповідей, на які я відмовився. Я думаю, що є трохи більше, що слід сказати, щоб повністю прояснити висновок. Мені подобаються терміни точні і правильні, оскільки Ефрон їх визначає. Я нещодавно обговорював це питання з іншого питання. Поміркований помах дуже сподобався цій відповіді. Я не піду до того ж lnegth, щоб повторити це тут. Однак точність Efron стосується рівня довіри та правильності ширини або герметичності інтервалу. Але ви не можете говорити про тісність, не враховуючи спочатку точності. Деякі інтервали довіри є точними, які є точними, оскільки вони мають фактичне покриття, яке вони рекламують. Довірчий інтервал 95% також може бути приблизним, оскільки він використовує асимптотичний розподіл. Орієнтовні інтервали на основі асимптотики є для кінцевого розміру вибірки n не матимуть рекламованого покриття, яке є покриттям, яке ви отримали, якби асимптотичний розподіл був точним розподілом. Таким чином, приблизний інтервал може бути прихованим (тобто рекламувати 95%, коли його фактичне покриття становить лише 91%) або в рідкісному, але менш серйозному випадку прикриття (тобто рекламоване покриття становить 95%, але фактичне в 98%). У першому випадку ми турбуємося про те, наскільки фактичне покриття наближене до рекламованого покриття). Міра близькості - це порядок точності, який може бути, наприклад, 1 / √n або 1 / n. Якщо фактичний рівень довіри близький, ми називаємо його точним. Accuray важливий з довірчими інтервалами завантажувальної передачі, які ніколи не є точними, але деякі варіанти є більш точними, ніж інші.

Це визначення точності може відрізнятися від того, про яке йдеться в ОП, але зараз повинно бути зрозуміло, що таке визначення Ефрона, і чому важливо бути точним. Тепер якщо у вас є два точні методи, ми можемо віддавати перевагу одному над іншим, якщо для будь-якого рівня довіри він має меншу очікувану ширину. Інтервал довіри, який найкращий у цьому сенсі (колись називається найкоротшим), був би обраний. Але для цього потрібна точність. Якщо рівень довіри лише приблизний, ми можемо порівнювати яблука та апельсини. Він може бути вужчим за іншого лише тому, що він менш точний і, отже, має менший фактичний рівень покриття, ніж рекламоване покриття.

Якщо два довірчі інтервали одночасно дуже точні або один точний, а інший дуже точний, якщо порівнювати очікувану ширину, може бути добре, оскільки принаймні зараз ми розглядаємо лише два два сорти яблук.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.