Чи є якісь «езотеричні» статистичні тести з дуже низькою потужністю?


11

Фон

У інформатиці, математиці, а іноді й в інших галузях, "езотеричні" приклади можуть бути не лише розважальними, але й корисними для ілюстрації певних понять, наприклад:

  • Bogosort і Slowort - це дуже неефективні алгоритми сортування, які можна використовувати для розуміння властивостей алгоритмів, зокрема порівняно з іншими алгоритмами сортування.

  • Езотеричні мови програмування демонструють наскільки далекосяжне поняття мови програмування і допомагають оцінити добрі мови програмування.

  • Функція Вайєрштрасса та Діріхле в першу чергу знаходять застосування для ілюстрації певних помилок щодо поняття наступності.

В даний час я готую деякі вчення про використання тестів на гіпотези і думаю, що тест з дуже низькою потужністю (але ніяких інших недоліків) допоможе проілюструвати поняття статистичної потужності. (Звичайно, я все ж маю сам вирішити, чи даний приклад дидактично корисний для моєї аудиторії чи просто заплутаний.)

Актуальне запитання

Чи є якісь статистичні випробування з навмисно низькою потужністю, точніше:

  • Тест вписується в загальні рамки тестів гіпотез, тобто він працює з нульовою гіпотезою, має вимоги та повертає (правильне)  значення p .
  • Він не призначений / запропонований для серйозного застосування.
  • Він має дуже низьку потужність (через навмисний недолік конструкції, а не через низький розмір зразка чи ефекту).

Якщо ви принципово можете стверджувати, що такий тест не може існувати, я також вважаю це вагомою відповіддю на моє запитання. Якщо, з іншого боку, існує безліч таких тестів, мене цікавить найбільш дидактично ефективний, тобто він повинен бути легкодоступним і мати вражаючий ефект.

Зауважте, що я не прошу загального вибору статистичних помилок (збирання вишні тощо) або подібних.

Що я знайшов поки що

Інтернет-пошуки для мене нічого не повернули.

Кожна спроба сконструювати щось подібне закінчувалася або в якомусь (корисному) існуючому тесті, або формат не є звичайним тестом. Наприклад, я подумав про тест, чи є у популяції позитивна медіана, яка повертається лише так, якщо всі вибірки є позитивними; але цей тест не повертає  значення p і, отже, не вписується у звичайні рамки тестування. Якщо я просто зараховую позитивні та негативні ознаки як тестову статистику (і обчислюю відповідно  значення p ), я закінчую тест знаків , який є розумним тестом.


2
Будучи більш математичними, "езотеричні" приклади (яких є багато), як правило, є конкретними контрприкладами до поширених непорозумінь; ряд підручників містять такі приклади. На сьогодні, ваше запитання - це питання типу "великого списку", і це занадто широко (хоча слід зазначити, що декілька користувачів зробили висновок, що питання є незрозумілим); якщо ви можете уточнити своє питання та звузити його обсяг, він може краще підходити до сайту.
Glen_b -Встановіть Моніку

1
Мала потужність порівняно з чим? Леманн навів приклад узагальненого тесту на коефіцієнт ймовірності, який мав меншу потужність у будь-якій альтернативній гіпотезі, ніж під нульовою.
Scortchi

2
Будь-який нерозумний оцінювач, до якого ви застосовуєте Рао-Блеквелізацію, може бути використаний в якості тестової статистики. Наприклад, є перше спостереження у вибірці, яке використовується як оцінювач середнього. Коли Rao-Blackwellized, ви отримуєте середнє значення вибірки. Мені довелося робити багато таких вправ на уроці. У будь-якому разі ця статистика може бути використана замість вибіркового значення в чомусь на зразок тесту. Але ні, я нічого не можу придумати безпосередньо у формі, яку ви шукаєте, або я б писав відповідь, а не коментар. Але має бути щось, що ілюструє невдачу загального методу побудови тесту. т
користувач54038

1
Я розкопаю папір Леманна, коли буду за комп’ютером. Потужність тесту під нулем - це лише розмір тесту.
Scortchi

3
Приклад тесту, використовуваного в класі, в якому я був студентом (багато років тому), був "закатати справедливу 20-сторону штампу і відхилити, якщо прокрутити 1" (як частина обговорення кривих потужності). Це, звичайно, повністю ігнорує дані, але є "правильним" тестом, оскільки він не має вище бажаного показника помилок типу I (який становив 5% у контексті наведеного прикладу).
Glen_b -Встановіть Моніку

Відповіді:


7

Дослідження лемми Неймана – Пірсона (доказ у Гейссері (2006), способи параметричного статистичного умовиводу , гл. 4.4):

Еϕ(Х)=α
ϕ(х)={0 коли f0(х)<кf1(х)1 коли f0(х)>кf1(х)
визначає найменш потужний рівень- αВипробування, ϕ , нульова гіпотеза Н0: щільність f0 проти Н1: щільність f1 з даних х .

З цього результату можна отримати рівномірно найменш потужний, локально найменш потужний, рівномірно найменш потужний подібний, і найменш потужний "абсолютно упереджений" тести (я маю на увазі ті, які мають меншу потужність за будь-якої альтернативи, ніж під нульовою). Якщо у вас вже є рівномірно найпотужніший, & c. тест, просто помножте свою тестову статистику на -1, щоб підтримувати розподіл пробного простору, який він викликає, змінюючи впорядкованість розділів.


Можливо, як підказує @ user54038, "невдача загального методу побудови тесту" може бути цікавішою. Леманн (1950), "Деякі принципи теорії тестування статистичних гіпотез", Енн. Математика. Статист. , 21 , 1, приписує наступний приклад Штейна:

Нехай Х - випадкова величина, здатна приймати значення 0,±1,±2 з імовірностями, як зазначено:

-22-110Гіпотеза Н:α2α212-α12-ααАльтернативи:pС(1-p)С1-С1-α(12-α)1-С1-α(12-α)α1-c1-α
Тутα,С- константи0<α12 ,α2-α<С<α, аp- інтервал[0,1].

Гіпотезу Н бажано перевірити на рівні значущості α . Тест на коефіцієнт ймовірності відхиляє, коли Х=±2 , а отже, його потужність становить С проти кожної альтернативи. Оскільки С<α , цей тест буквально гірший, ніж марний, тому що випробування потужністю α можна отримати, не дотримуючись Х , просто за допомогою таблиці випадкових чисел.

Зверніть увагу, що він розглядає узагальнений тест правдоподібності, при цьому p в ролі неприємного параметра повинен бути максимізований. Так що, коли Х=-2 , або Х=2 , р = 1 , або р = 0 , відповідно, і відношення правдоподібності доходить до 2 Cp^=1p^=02Сα в будь-якому випадку; для будь-якого іншого значенняХце нижнє значення1-С1-α .


5

(Пов'язане з коментарем @Scortchi)

Припустимо, ХN(мк,1) і ми хочемо перевірити гіпотезу

Н0:мк=0Н1:мк0

ZБеrноуллi(p)pαp[α,1]

R={(Х,Z) | z=1 |х|>Φ-1(α2p)}

α

П(ХR | мк=0)=П(Z=1 , |Х|>Φ-1(α2p))=П(Z=1)П(|Х|>Φ-1(α2p))=pαp=α

p(х,z)=(1000000,0)p=αХα

Z


2
(+1) Тісно пов'язані, оскільки маючи одновимірну допоміжну статистику , ви можете відмовитися від монети, відпустивши Z = 1 ( S < F -SZ=1(S<ЖS-1(p))ЖS()S
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.