Чи можемо ми відкинути нульову гіпотезу з довірчими інтервалами, отриманими за допомогою вибірки, а не з нульовою гіпотезою?


9

Мене вчили, що ми можемо дати оцінку параметрів у вигляді довірчого інтервалу після вибірки з популяції. Наприклад, 95% довірчі інтервали, без порушених припущень, повинні мати 95% успішність вмісту того, що б істинний параметр, який ми оцінюємо, у сукупності.

Тобто,

  1. Складіть бальну оцінку з вибірки.
  2. Визначте діапазон значень, який теоретично має 95% шансу містити справжнє значення, яке ми намагаємося оцінити.

Однак, коли тема перейшла до тестування гіпотез, кроки були описані наступним чином:

  1. Припустимо якийсь параметр як нульову гіпотезу.
  2. Проведіть розподіл вірогідності ймовірності отримання різних точкових оцінок, враховуючи цю нульову гіпотезу.
  3. Відхиліть нульову гіпотезу, якщо отримана нами точкова оцінка буде вироблена менше 5% часу, якщо нульова гіпотеза вірна.

Моє запитання таке:

Чи потрібно виробляти наші довірчі інтервали, використовуючи нульову гіпотезу, щоб відкинути нуль? Чому б просто не виконати першу процедуру і не отримати нашу оцінку для істинного параметра (не явно використовуючи наше гіпотезоване значення для обчислення довірчого інтервалу), а потім відкинути нульову гіпотезу, якщо вона не потрапляє в цей інтервал?

Мені це здається логічно рівнозначним інтуїтивно, але я побоююсь, що мені не вистачає чогось дуже фундаментального, оскільки, мабуть, є причина, що цього навчають.


Мої вибачення за те, що я неясна, Мартине. Незабаром я відредагую свою публікацію, щоб людям було зрозуміліше в майбутньому ті самі питання. Що я мав на увазі, це те, що ми можемо обчислити оцінку параметра з вибірки, або ми можемо обчислити діапазон оцінок, які ми вважатимемо для підтримки нульової гіпотези, використовуючи нульову гіпотезу. Я не розумів, чому потрібно використовувати null, щоб перевірити, чи є наша оцінка точки в цьому інтервалі, а не просто використовувати нашу оцінку параметрів і перевіряти, чи нуль знаходиться в межах оцінки параметра. Сподіваюся, це має сенс!
Ніклі

Цікавий продуманий експеримент, якщо хтось намагається продати вам зважені кістки. Вони котять їх, а потім заявляють, що вони зважуються в напрямку, який ви спостерігаєте (наприклад, 6 припадає на 20% часу). Чи вони зважені (чи було достатньо виконаних зразків кидків), на скільки і чого варто робити власні (додаткові) тести на кидання кісток? Продавець і покупець мають різні цілі ...
Філіп Оуклі

Відповіді:


5

Проста задача на прикладі задається шляхом тестування на середнє значення нормальної сукупності з відомою дисперсією . Тоді зведене значення - величина, розподіл якої не залежить від параметра, задається . Критичні значення в цьому симетричному випадку задовольняють і .σ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2Φ(zα/2)=1α/2

Отже, щоб - довірчий інтервал рівня .

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

У той же час, подія в першому рядку дисплея - це також подія, коли нульова гіпотеза не відхилена для цього . Оскільки решта просто містить еквівалентні переформулювання, ci дійсно містить усі для яких нуль не відхилено, і посилання на "під нуль" не потрібне.μμ

Ось сюжет, аналогічний візуалізації +1 Мартійна, що має на меті показати, що називається подвійністю між довірчими інтервалами та тестами. позначає інтервал довіри, що належить деякому і область прийняття, що належить до деякої гіпотези .Cx¯A(μ0)μ=μ0

введіть тут опис зображення


10

Так, ви можете замінити тест гіпотези (порівняння вибірки з гіпотетичним розподілом результатів тесту) порівнянням з довірчим інтервалом, обчисленим з вибірки. Але опосередковано інтервал довіри - це вже свого роду тест гіпотези, а саме:

  • Ви можете бачити, що інтервали довіри будуються як діапазон значень, для якого тест гіпотези рівня буде успішним,α а поза діапазоном тест гіпотези рівня не вийде.α

Наслідком створення такого діапазону є те, що діапазон не відповідає лише частці часу.α

Приклад

Я використовую зображення з відповіді на нижченаведене питання: Інтервали довіри: як офіційно боротися зP(L(X)θ,U(X)θ)=1α

Це варіація графіка від Clopper-Pearson . Уявіть випадок 100 випробувань Бернуллі , де ймовірність успіху , і ми спостерігаємо загальне число успіхів .θX

довірна ймовірність

Зауважте, що:

  • У вертикальному напрямку ви бачите тестування гіпотез. Наприклад, для заданого гіпотезованого значення ви відкидаєте гіпотезу, якщо вимірюваний вище або нижче червоних або зелених пунктирних ліній.θX

  • У горизонтальному напрямку ви бачите довірчі інтервали Clopper-Pearson. Якщо для будь-якого даного спостереження X ви використовуєте ці довірчі інтервали, то ви будете помилятися лише 5% часу

    (тому що ви будете спостерігати лише такий X, на якому ви базуєте "неправильний" інтервал, 5% часу)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.