Що сказати клієнту, який вважає, що інтервали довіри занадто широкі, щоб бути корисними?


22

Припустимо, я консультант і хочу пояснити своєму клієнту корисність довірчого інтервалу. Клієнт каже мені, що мої інтервали занадто широкі, щоб бути корисними, і він вважає за краще використовувати їх наполовину ширше.

Як я повинен відповісти?


15
виставити їм рахунок, щоб зібрати більше даних.
shabbychef

2
Це нагадує мені обов'язковий читати документ про типи клієнтів у статистичній консультації.

@Procrastinator Ви не хочете опублікувати посилання на PDF-версію документа?
припускаєтьсянормальне

1
@Max, здається, це лише очевидно доступно через JSTOR; розміщення PDF-документа було б порушенням (цілком розумних) умов обслуговування JSTOR ...
Бен Болкер,

@shabbychef - часто це дуже неефективний спосіб підвищення точності, особливо якщо вибірка вже велика. наприклад, щоб удвічі зменшити ширину ci нормальної середньої величини ci, вам потрібно вчетверо збільшити розмір вибірки. краще витратити деякий час на вдосконалення моделі, перш ніж їхати, і збільшити найбільшу вартість у чотири рази!
ймовірністьлогічний

Відповіді:


16

Це залежить від того, що означає клієнт під «корисним». Пропозиція вашого клієнта про те, що ви довільно звужуєте інтервали, здається, відображає непорозуміння, що, звужуючи інтервали, ви якось чарівно зменшили похибку. Якщо припустити, що набір даних вже зібраний і виправлений (якщо це не так, жарт @ shabbychef в коментарях дає вам свою відповідь), будь-яка відповідь вашому клієнту повинна підкреслювати та описати, чому немає "безкоштовного обіду" і що ви які жертвуючи що - то звужуючи інтервали.

Зокрема, оскільки набір даних фіксований, єдиний спосіб зменшити ширину довірчого інтервалу - зменшити рівень довіри. Таким чином, у вас є вибір між більш широким інтервалом, який ви впевненіші, містить справжнє значення параметра або більш вузький інтервал, в якому ви менш впевнені. Тобто, більш широкі інтервали довіри більш консервативні. Звичайно, ви ніколи не можете просто безглуздо оптимізувати або ширину, або рівень довіри, оскільки ви можете вакуумно генерувати довірчий інтервал, дозволяючи йому охопити весь простір параметрів і отримати безмежно вузький інтервал довіри, хоча він буде мати 0 % покриття. 100%0%

Наскільки корисніший менш менш консервативний інтервал чи ні, явно залежить як від контексту, так і від того, як ширина інтервалу змінюється залежно від рівня довіри, але у мене виникають труднощі при розробці програми, де для отримання значно нижчого рівня довіри для отримання більш вузькі інтервали були б кращими. Також варто зазначити, що довірчий інтервал став настільки всюдисущим, що важко буде виправдати, чому ви, наприклад, використовуєте 60 % інтервал довіри. 95%60%


6
Ви не можете просто зменшити довірчий інтервал, не відмовляючись від цього, але є невелика гнучкість, аналогічна різниці між тестом з однохвостим і двосхилим тестом. Крім того, можливо, що краща модель одних і тих же даних дала б різні (і, можливо, менші) довірчі інтервали.
Дуглас Заре

3
Я думаю, що ти продаєш останню частину лише трохи. Повсюдність 95 % ІС - культурне явище. У деяких контекстах поширені інші значення, наприклад, під час побудови графіків смуги помилок часто є стандартними помилками (тобто, 68% CI), як я впевнений, що ви знайомі. (+1, btw)
gung - Відновіть Моніку

2
За духом ця відповідь хороша, але я вважаю, що другий абзац занадто обмежує. Однією з величезних переваг, яку статистик приносить цій стороні, є знання альтернативних процедур, які можуть краще задовольнити потреби клієнта. У багатьох випадках можна звузити ширину ІС, вибравши іншу процедуру CI. Це ні вимагає збору більшої кількості даних (від -1 до @shabbychef), ні зниження рівня довіри. Справді важкою частиною є інтерпретація ІП, де процедура була обрана як пост. Ось чому ми хочемо вести цю розмову, перш ніж аналізувати (або навіть збирати) дані!
whuber

7
Я реагую на це, Макро, бо на практиці це не добре, щоб бути таким негнучким. Ризик полягає в тому, що клієнт проігнорує вашу пораду і звернеться за допомогою до того, хто не знає кращого (але вимагає достатнього досвіду статистики). Сценарій ОП - звичний та поширений: його найкраще сприймати як можливість інформувати та навчати клієнта, а також пропонувати їм альтернативи (разом із відвертим обговоренням їх плюсів та мінусів). Нам потрібно сказати "так, ІС можна зменшити, але ось деякі наслідки цього", а не "ні, ти накручений".
whuber

2
Це хороший момент @whuber (+1) у ситуаціях, коли можуть бути більш ефективні альтернативи - ще одна причина порадитися зі статистиком перед збором / аналізом даних.
Макрос

2

Я б сказав, що це повністю залежить від того, для чого ваш клієнт хоче використовувати інтервали довіри.

  1. Якийсь звіт / публікація / тощо. де зазвичай повідомляється про 95% ІС. Я б дуже міг сказати йому "Це не є статистично виправданим" і залиште його там, залежно від того, чи прагне клієнт відмовитись від вашої експертизи. Якщо вони цього не роблять, вам доведеться судити про власний професійний комфорт із тим, що вони хочуть.
  2. Якийсь внутрішній документ - я б дав зрозуміти, що ви не погоджуєтесь, і ясна зрозуміти, який тип інтервалу довіри читач зараз дивиться, оскільки це не 95%.
  3. Як міру невизначеності оцінки, скажімо, щоб визначити, скільки аналізу чутливості можна зробити? Я б дав їм цифру, що показує повний розподіл як з 95% ІС, так і з на зразок 68% ІС, і нехай вони мають це.

Я був би дуже гордий за себе, якби мені вдалося утримати "Отже, проведіть більшу студію", щоб це не було першим ділом у мене.


1
+1. Я думаю, що ваші коментарі під (2), ймовірно, будуть доречні і в ситуації, описаній (1).
Макрос

0

Використовуйте Стандартне відхилення, як це робить більшість людей. 95% ІС може бути страшним, коли люди звикли до 68% ІС.


4
Мені здається, що в цьому випадку нас просто цікавить показ точності, скажімо, середньої вибірки, а не мінливості окремих значень. Чому саме ви б рекомендували стандартне відхилення ?
chl

Фішер спочатку запропонував 95% ІС як наближення до 2 стандартних відхилень.
Патрік Калдон

1
@Patrick, це здається, що ви пропустили пункт chl (як і неправильно представлений Фішер, який не допустив такої помилки), або ж ви написали "стандартне відхилення", де ви задумали "стандартну помилку ". Більшість ІС базуються на стандартних помилках, звичайно, не на стандартних відхиленнях. 2 SD ні наближають ІС, ні навпаки.
whuber

Звичайно, стандартна помилка - це лише стандартне відхилення середнього значення, тому це просто термінологія. Тобто, сказати, що КІ не базуються на стандартних відхиленнях, насправді не відповідає дійсності. Вони базуються не на стандартному відхиленні вибірки, а на стандартному відхиленні середнього значення.
Аарон - Відновити Моніку

2
Не всі оцінки є засобами. Існують стандартні помилки для оцінок, окрім засобів, і це стандартна помилка оцінки, яка використовується для генерування довірчих інтервалів для параметра, заснованого на мінливості оцінки, як передбачає Уабер.
Майкл Р. Черник

0

Ви надаєте довірчий інтервал на певному стандартному рівні, наприклад, 90% або 95%. Клієнт може судити про те, чи занадто широкий інтервал, щоб бути корисним. Але це, звичайно, не означає, що ви можете скоротити його, щоб зробити його корисним. Можна припустити, що збільшення розміру вибірки зменшить ширину інтервалу на заданому рівні довіри, оскільки воно зменшиться приблизно на коефіцієнт квадратного кореня розміру вибірки.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.