Логістична регресія проти чи-квадрата в таблицях на випадок 2х2 та Ix2 (один фактор - двійковий відповідь)?


10

Я намагаюся зрозуміти використання логістичної регресії в таблицях на випадок 2–2 та Ix2. Наприклад, використовуючи це як приклад

введіть тут опис зображення

Яка різниця між використанням тесту чи-квадрата та використанням логістичної регресії? Як щодо таблиці з декількома номінальними коефіцієнтами (таблиця Ix2) на зразок цієї:

введіть тут опис зображення

Існує аналогічне питання тут - але відповідь в основному , що хі-квадрат може обробляти MXN таблиці, але моє запитання , що specificalyl коли є двійковий результат і один номінальний коефіцієнт. (Зв'язаний потік також відноситься до цього потоку , але це стосується незмінних змінних / факторів).

Якщо це лише один фактор (тобто не потрібно контролювати інші змінні) з бінарною відповіддю, у чому полягає різниця цілей логістичної регресії?


+1 для запитання, але вам потрібно полегшити копіювання та вставлення даних для роботи з ним.
Антоні Пареллада

2
Див. Чому мої р-значення відрізняються між результатами логістичної регресії, тестом чи-квадрата та довірчим інтервалом для АБО? . Тест Хі-квадрата Пірсона на асоціацію - це лише тестовий бал для нульової гіпотези про те, що всі нахили дорівнюють нулю. Відповідне випробування на коефіцієнт вірогідності асимптотично еквівалентне. Як каже @Kodiologist, використання, до якого може бути застосовано логістичну регресію, є ширшим, ніж тестування того, що всі нахили дорівнюють нулю.
Scortchi

Відповіді:


12

Зрештою, це яблука та апельсини.

Логістична регресія - це спосіб моделювати номінальну змінну як імовірнісний результат однієї або декількох інших змінних. Встановлення логістично-регресійної моделі може супроводжуватися тестуванням того, чи коефіцієнти моделі значно відрізняються від 0, обчислюючи довірчі інтервали для коефіцієнтів або вивчаючи, наскільки модель може передбачити нові спостереження.

Тест χ² на незалежність - це тест на специфічну значимість, який перевіряє нульову гіпотезу про незалежність двох номінальних змінних.

Чи слід використовувати логістичну регресію або χ² тест, залежить від питання, на яке ви хочете відповісти. Наприклад, χ²-тест може перевірити, чи нерозумно вважати, що зареєстрована політична партія людини не залежить від їхньої раси, тоді як логістичний регрес може обчислити ймовірність того, що людина до певної раси, віку та статі належить до кожної політичної партії .


Дякую. Чи зможете ви надати мені приклад різних типів питань, на які можна відповісти різними методами? Чи є якісь конкретні ресурси, які ви можете порекомендувати для розуміння різних питань, на які можна відповісти двома методами?
L Xandor

Я додав приклади до своєї відповіді. Щодо вашого другого питання, Вікіпедія - це гідне місце для початку. Крім того, більшість вступних підручників з прикладної статистики будуть згадувати як χ² тест на незалежність, так і логістичну регресію.
Кодіолог

Дякую. Мені все ще незрозуміло, у чому різниця в конкретному випадку таблиці сумішшю 2х2? Чі квадрат перевіряє, чи результат не залежить від варіацій фактору, але що тут робить логістична регресія? Я розумію, що LR корисний для прогнозування на основі ряду факторів, але коли мова йде про простий 2x2, я не впевнений, в чому різниця (але це чітко використовується) ... чи не могли б ви (або хтось) використовувати 2x2 таблиця стрес / зворотний відбиток в оригінальній публікації як конкретний приклад того, як їх можна було б використовувати по-різному? Мене найбільше цікавить саме той фактор
L Xandor

або гоночна / політична партія працює так само добре, як приклад, але коли ви використовуєте логістичну регресію, ви використовуєте безліч факторів, і я бачу, як це корисно там ... але те, що я конкретно важко розумію, це чому використовувати LR (або як він відрізняється) у випадку одного фактора. Якщо обидва методи використовуються для дослідження взаємозв'язку між расою та політичною партією, яка різниця між квадратом чи логістичною регресією?
L Xandor

У випадку прикладу напруги та рефлюксу, ви можете використовувати логістичну регресію, щоб перевірити, чи стрес суттєво впливає на ймовірність рефлюксу, або ви могли обчислити довірчий інтервал для коефіцієнта шансів, що виражає цей ефект. Одним із способів, яким це концептуально відрізняється від χ²-тесту, є те, що напруга або рефлюкс розглядаються як залежна змінна. Але в будь-якому випадку логістичну регресію можна вважати надмірною для таблиці 2 на 2.
Кодіолог
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.