Кілька тестів на чи-квадрат


11

Я перехресні класифіковані дані в таблиці 2 x 2 x 6. Назвемо розміри response, Aі B. Я підхожу до логістичної регресії до даних з моделлю response ~ A * B. Аналіз відхилення цієї моделі говорить про те, що як терміни, так і їх взаємодія є важливими.

Однак, дивлячись на пропорції даних, схоже, що лише 2 або більше рівнів Bвідповідальні за ці значні ефекти. Я хотів би перевірити, які рівні є винуватцями. Наразі мій підхід полягає в тому, щоб виконати 6 тестів у квадраті на 2х2 таблицях response ~ A, а потім відкоригувати значення р із цих тестів для кількох порівнянь (використовуючи регулювання Холма).

Моє запитання - чи є кращий підхід до цієї проблеми. Чи існує більш принциповий підхід до моделювання чи підхід із порівняльного тестування з чистим квадратом?


Одного разу я задав те саме питання у списку розсилки R, і не отримав відповіді. Я б запропонував вам змінити назву, оскільки ваше питання стосується "пост-хок-аналізу квадратів чі - щоб виявити причину значущості" (коротший заголовок, ніж той, який я запропонував, буде кращим :))
Тал Галілі

Подивіться на бета-версію своїх винуватців .... І використовуйте пуассон, лінійну лінійну модель. Потім ви отримуєте те саме, що і тест чі-квадрат, який дає вам, але ви отримуєте всі різні тести одразу.
ймовірністьлогічний

Відповіді:


11

Ви повинні розглянути "розділення чі-квадратом". Це логічно аналогічно виконанню пост-спеціальних тестів в ANOVA. Це дозволить вам визначити, чи є ваш значний загальний тест в першу чергу віднесений до відмінностей у конкретних категоріях або групах категорій.

Швидкий google виявив цю презентацію, в якій наприкінці обговорюються методи розділення чі-квадрата.

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


Цікаво. Ви коли-небудь стикалися з R-реалізацією цього?
Тал Галілі

Ні, не безпосередньо. Однак R надасть вам усе необхідне для цього - наприклад: спостережувані підрахунки, очікувані значення та залишки для кожної комірки. x <- матриця (c (12, 5, 7, 7), ncol = 2) chisq.test (x) спостерігається chisq.test (x) $ залишківexpectedchisq.test(x)
Brett

Я дам вам галочку, оскільки це має бути корисним для мого дослідницького життя. Однак такий підхід застосовний до матриці ixj. Однак моє запитання стосується матриці ixjxk,
JoFrhwld

2
Розділення Chi-квадрата можна розширити до багатосторонніх таблиць на випадок надзвичайних ситуацій. Ось стаття, яку Агресті цитує у своїй книзі, насправді ... ХО Ланкастер (1951) "Складні таблиці обставин надзвичайних ситуацій, оброблені розділом χ2", журнал Королівського статистичного товариства. Серія B (Методологічні), Вип. 13, № 2
Бретт

1

Непринциповий підхід полягає в тому, щоб відкинути непропорційні дані, перевстановити модель і побачити, чи співвідношення шансів logit / умовні коефіцієнти для відповіді та A сильно відрізняються (контроль B). Це може сказати вам, якщо є привід для занепокоєння. Об'єднання рівнів B - ще один підхід. У більш принципових напрямках: Якщо ви переживаєте відносні пропорції, що викликають парадокс Сімпсона, ви можете подивитися на коефіцієнти умовного та граничного шансів на відповідь / А і подивитися, чи вони зворотні.

Щоб уникнути численних порівнянь, єдине, що мені трапляється, - це використовувати ієрархічну модель, яка враховує випадкові ефекти на рівнях.


0

Я точно не знаю, які ваші цілі, чи чому вони є такими, якими вони є. Але замість тестування гіпотез я зазвичай рекомендую зосередити увагу на прогнозах та довірчих інтервалах.


0

Post Hoc тест може відповідати вашій проблемі. chisqPostHoc () функція в тестах R для значних відмінностей між усіма парами сукупностей у тесті на квадрат-хі. Хоча я не користувався цим, але це посилання може бути корисним. https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html

Іншою альтернативою може бути функція chisq.desc () з пакету EnQuireR.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.