Який тест для аналізу настільних столів: Boschloo чи Barnard?


11

Я аналізую таблицю 2x2 з невеликого набору даних з 30 пацієнтів. Ми ретроспективно намагаємось знайти деякі змінні, які дають підказку щодо того, яке лікування вибрати. Змінні (нормальні / дивні) та рішення щодо лікування (A / B) представляють особливий інтерес, тому дані виглядають так:

Obs/Tr. Dec.ABnormal121325strange055121830

Очевидно, що в одній клітині бракує записів, що виключає хі-квадратний тест, а точний тест Фішера не дає насичуючого р-значення (але все ж <10%). Тож моя перша ідея полягала в тому, щоб знайти тест з більшою силою, і я читав у блозі та в цій статті про тест Барнара та Бошлооса, що в цілому є три сценарії, які піддаються потужному тесту:

  1. Стовпець і рядки фіксували точний тест Фішера
  2. Стовпець або (xclusive) рядки зафіксовано точний тест Барнарда
  3. Жоден не визначений точний тест Bosghloos

У статті вище вказувалося, що сума лікування А та лікування Б майже ніколи не відома раніше, тому ми можемо виключити точний тест Фішера. А як щодо інших альтернатив? У випадку контролю, де у нас є здорові елементи контролю, ми можемо контролювати групу плацебо та верму, які цифри ми можемо контролювати, тому можна вибрати 2: Barnard. У моєму випадку я не впевнений, оскільки з одного боку у нас є аналогічна математична задача (сума рівнів спостереження, еквівалентна сумі плацебо / вермуму), що призводить до Барнарда, але дизайн інший, тому що ми не можемо контролювати № спостереження нормальне / дивне перед взяттям зразка, що призводить до 3: Boschloo.

Отже, який тест слід використовувати і чому? Я, звичайно, хочу високої потужності.

(Ще одне питання, яке я хотів би знати, це, якби у випадку з chisq.testr це не було б краще використовувати prop.test(x, alternative = "greater")? Теоретичні аспекти пояснюються тут .)


Ви б задали це запитання, якби тест Фішера дав би значення ap нижче вашого рівня значущості?
Майкл М

Оскільки стовпці виправлені (здається, ваша стаття пропонує Барнарду), але я не зміг дійти до нього без оплати :(
MikeP

@Michael: Я думаю, що це взагалі актуальна проблема, але без конкретної проблеми я не міг би розглянути більш глибоке дослідження.
Таз

@Mike: Sry, я був в інституті і не думав про оплату праці. Якщо я знайду безкоштовне рішення, додам його. Однак я думаю, що проблему я не вказав досить чітко. У моєму випадку групи лікування не контролюються, натомість вони є наслідком певної ручної діагностики лікарем, і я хочу з’ясувати, чи рішення щодо лікування А або В пов'язане зі змінною спостереження. А також який тест застосувати та як його застосувати оптимально.
Таз

А-а-а, так що людина, яка вступає до навчання, могла б до кінця потрапити до будь-якої з чотирьох категорій?
MikeP

Відповіді:


13

Може виникнути деяка плутанина щодо тесту терміна "Барнард" або "Бошлу". Точний тест Барнара - безумовний тест у тому сенсі, що він не обумовлює обох переваг. Тому і друга, і третя кулі є випробуванням Барнарда. Натомість нам слід написати:

  1. Обидві поля фіксовані (Гіпергеометричний Dist'n) → точний тест Фішера
  2. Один запас фіксований (подвійний двочленний роз'єм) → точний тест Барнарда
  3. Не встановлено меж (Multinomial Dist'n) → точний тест Барнарда

Точний тест Барнара включає два типи таблиць, тому ми виділяємо дві, кажучи "двочленною" або "багаточленною" моделлю, як це доречно.

Як правило, точний тест Барнарда або використовує Z-об'єднану (aka Score) статистику для визначення таблиць "як або більше". Зауважимо, що в оригінальному папері Барнард (1947) використовується складніший підхід для визначення більш екстремальних таблиць (іменованих як "CSM"). Точний тест Boschloo використовує p-значення Фішера для визначення таблиць "як чи більше". Тест Boschloo однаково потужніший, ніж точний тест Фішера.

Для вашого набору даних це здається, що жодна межа не була визначена, тому рекомендую використовувати точний тест Boschloo з багаточленною моделлю. Я виявив тест Boschloo трохи кращим для незбалансованих коефіцієнтів маржі (хоча, як правило, дуже схожий на точний тест Барнарда із Z-об'єднаною статистикою). Однак, оскільки тестова та мультиноміальна моделі Boschloo набагато більш обчислювально, ви також можете використовувати біноміальну модель (міркування, чому це все-таки було б доречним, є трохи складним; якщо коротко підсумувати, поля є приблизно допоміжною статистикою, так що це нормально, щоб обумовити маржу). Для отримання більш детальної інформації про точні тести та інформацію про реалізацію, будь ласка, використовуйте пакет Exact R ( https://cran.r-project.org/web/packages/Exact/Exact.pdf). Я автор пакету, і це більш оновлена ​​версія коду в блозі.


1
Дякуємо за ваше чітке твердження! Дуже приємно мати це пояснення в декількох рядках. Врешті-решт я зробив це так, як ви писали, прочитавши документ, який дуже хороший, але також дуже довгий ;-)
Taz
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.