Чому коефіцієнти шансів відрізняються від формули та риболовного тесту R? Яку вибрати?


14

У наступному прикладі

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

Я обчислив коефіцієнт шансів (№1) "вручну", 0,600; то (№2) як один із результатів точного тесту Фішера, 0,616.

Чому я не отримав однакового значення?

Чому існує кілька способів обчислення коефіцієнта шансів і як вибрати найбільш відповідний?

Відповіді:


10

На сторінці довідки для fisher.test():

Зверніть увагу, що використовується умовна максимальна ймовірність оцінки (MLE), а не безумовний MLE (коефіцієнт вибіркової шанси).


3

Щоб додати тут обговорення, корисно запитати, що саме зумовлене цією "умовною" ймовірністю. Тест Фішера відрізняється від інших категоричних аналізів тим, що він вважає всі поля таблиці фіксованими, тоді як модель логістичної регресії (і відповідний тест-квадрат Пірсона, який є тестовим балом логістичної моделі) вважають лише один запас фіксованим .

Потім тест Фішера розглядає гіпергеометричний розподіл як модель вірогідності підрахунків, що спостерігаються у кожній з 4 клітин. Гіпергеометричний розподіл має таку особливість, що, оскільки розподіл коефіцієнта вихідних шансів не є безперервним, ви часто отримуєте іншу АБО як максимальну оцінку ймовірності.


2
Я не думаю, що ваша відповідь дає зрозуміти, як може виникнути ця конкретна ймовірність. Якщо ви моделюєте процес генерування даних з продуктом-біноміалом, скажімо, ви отримуєте іншу ймовірність (& MLE), обумовлену граничними підсумками, від тієї, яку ви отримуєте, якщо моделювати її з нецентральним геогеометричним розподілом Валленія - граничним підсумки "вважаються фіксованими" в обох випадках.
Scortchi

1

Щоб відповісти на ваше друге запитання, біостати не є моєю фортецею, але я вважаю, що причина статистики множинних коефіцієнтів полягає в тому, щоб враховувати розробку вибірки та розробку експериментів.

Тут я знайшов три посилання, які дадуть вам трохи розуміння того, чому існує різниця між умовним MLE та безумовним коефіцієнтом шансів, а також іншими типами.

  1. Точкова та інтервальна оцінка коефіцієнта загальних шансів у поєднанні 2 × 2 таблиць із фіксованими полями

  2. Вплив зміщення на оцінювачі відносного ризику для парних і стратифікованих зразків

  3. Порівняльне дослідження умовної максимальної ймовірності оцінки коефіцієнта загальних шансів


3
Було б корисно хоч трохи узагальнити те, що вони мають сказати.
Scortchi

@Scortchi, погодився. Я був зайнятий роботою і мав лише можливість прочитати першу або дві сторінки кожної. Я додам підсумок кожного цього вихідного.
Джон

@Jon Якщо ви можете, було б корисно додати цей короткий підсумок
Glen_b -Встановити Моніку

@Jon Я задав лише одне запитання. Саме Блі додав друге запитання через 4 роки після того, як я опублікував своє первісне питання. Я не обертаю набридливу редакцію Блі, коли ви посилалися на друге питання, але я не впевнений, як більше прийняти відповідь.
winerd
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.