Постійна залежна змінна з порядковою незалежною змінною


17

З огляду на безперервно залежну змінну y та незалежні змінні, включаючи порядкову змінну X 1 , як мені вписати лінійну модель R? Чи є документи про цей тип моделі?

Відповіді:


29

@ Scortchi вас накрив цією відповіддю на кодування для замовленого коваріату . Я повторив рекомендацію щодо своєї відповіді на Ефект двох демографічних ІV на відповіді опитування (шкала Лікерта) . В Зокрема, рекомендація використовувати Gertheiss ' (2013) ordPens пакет , і звернутися до Gertheiss і Tutz (2009a) для теоретичної підготовки і дослідження моделювання.

Конкретна функція, яку ви, мабуть, хочете, - ordSmooth* . Це, по суті, згладжує коефіцієнти фіктивних змін на рівні порядкових змінних, щоб вони були менш різними від тих, що знаходяться для суміжних рангів, що зменшує перевищення рівня якості та покращує прогнози. Зазвичай, це робить, а також (або іноді набагато) кращою, ніж максимальна ймовірність (тобто звичайні найменші квадрати в даному випадку) оцінки регресійної моделі для безперервних (або, з їхнього боку, метричних) даних, коли дані фактично є порядковими. Він здається сумісним із усілякими узагальненими лінійними моделями та дозволяє вводити номінальні та безперервні предиктори як окремі матриці.

Кілька додаткових посилань від Gertheiss, Tutz та колег доступні та перелічені нижче. Деякі з них можуть містити альтернативи - навіть Гертейс та Тутц ( 2009a ) обговорюють ревіювання хребта як іншу альтернативу. Я ще не все це переробив, але достатньо, щоб сказати, що це вирішує проблему Еріка надто мало літератури про порядкових провісників!

Список літератури

- Гертейс, Дж. (2013, 14 червня). ordPens: Вибір та / або згладжування порядкових предикторів , версія 0.2-1. Отримано з http://cran.r-project.org/web/packages/ordPens/ordPens.pdf .
- Gertheiss, J., Hogger, S., Oberhauser, C., & Tutz, G. (2011). Вибір звичайних масштабів незалежних змінних із застосуванням до міжнародної класифікації функціонуючих ядерних наборів. Журнал Королівського статистичного товариства: Серія C (Прикладна статистика), 60 (3), 377–395.
- Gertheiss, J., & Tutz, G. (2009a). Штрафний регрес із порядковими предикторами. Міжнародний статистичний огляд, 77 (3), 345–365. Отримано з http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf .
- Gertheiss, J., & Tutz, G. (2009b). Контрольований вибір особливостей у протеомічному профілюванні на основі мас-спектрометрії шляхом блочного підвищення. Біоінформатика, 25 (8), 1076–1077.
- Gertheiss, J., & Tutz, G. (2009c). Методи змінного масштабування та найближчого сусіда. Журнал хіміометрії, 23 (3), 149–151. - Gertheiss, J. & Tutz, G. (2010). Рідке моделювання категоріальних пояснювальних змінних. Аннали прикладної статистики, 4 , 2150–2180.
- Hofner, B., Hothorn, T., Kneib, T., & Schmid, M. (2011). Структура для об'єктивного вибору моделі, заснованої на прискоренні. Журнал обчислювальної та графічної статистики, 20 (4), 956–971. Отримано з http://epub.ub.uni-muenchen.de/11243/1/TR072.pdf .
- Oelker, M.-R., Gertheiss, J., & Tutz, G. (2012). Регуляризація та вибір моделі за допомогою категоричних предикторів та модифікаторів ефектів у узагальнених лінійних моделях. Управління статистики: Технічні звіти, № 122 . Отримано з http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf .
- Oelker, M.-R., & Tutz, G. (2013). Загальна група покарань за поєднання різних видів покарань у узагальнених структурованих моделях. Управління статистики: Технічні звіти, № 139 . Отримано з http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf .
- Petry, S., Flexeder, C., & Tutz, G. (2011). Парне плавлення ласо. Управління статистики: Технічні звіти, № 102. Отримано з http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf .
- Руфібах, К. (2010). Алгоритм активного набору для оцінки параметрів у узагальнених лінійних моделях із упорядкованими прогнокторами. Обчислювальна статистика та аналіз даних, 54 (6), 1442–1456. Отримано з http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail .
- Тутц, Г. (2011, жовтень). Методи регуляризації категоріальних даних. Мюнхен: Людвіг-Максиміліанс-Університет. Отримано з http://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdf .
- Tutz, G., & Gertheiss, J. (2013). Шкала оцінювання як предиктори - старе питання про рівень масштабу та деякі відповіді.Психометріка , 1-20.


15

Коли є кілька предикторів, і прогноз інтересу є порядковим, часто важко вирішити, як кодувати змінну. Кодування його як категоричне втрачає інформацію про замовлення, тоді як кодування як числове значення накладає лінійність на ефекти впорядкованих категорій, що може бути далеко від їх справжнього ефекту. Для першої, ізотонічна регресія була запропонована як спосіб подолання немонотонності, але це процедура вибору моделі, керована даними, яка, як і багато інших процедур, керованих даними, вимагає ретельної оцінки остаточної пристосованої моделі та значущості його параметрів. Для останнього сплайни можуть частково пом'якшити припущення про жорстку лінійність, але числа все ж повинні бути присвоєні упорядкованим категоріям, і результати чутливі до цих варіантів. У нашому документі (Лі та Пастух, 2010, Вступ, параграфи 3-5),

YХZYZХZYХ

ХZ

Ми розробили пакет R, PResiduals , який доступний у CRAN. Пакет містить функції для виконання нашого підходу для лінійних та порядкових типів результатів. Ми працюємо над тим, щоб додати інші типи результатів (наприклад, підрахунок) та функції (наприклад, дозволяючи взаємодіями). Пакет також містить функції для обчислення нашого залишку, який є залишком масштабу ймовірності, для різних моделей регресії.

Список літератури

Li, C. & Shepherd, BE (2010). Тест на зв'язок між двома порядковими змінними під час коригування коваріатів. JASA, 105, 612–620.

Li, C. & Shepherd, BE (2012). Нова залишка для порядкових результатів. Біометріка 99, 473–480.


7

Як правило, є багато літератури про порядкові змінні як залежні та мало їх використання як предикторів. У статистичній практиці їх зазвичай вважають нескінченними або категоричними. Ви можете перевірити, чи виглядає лінійна модель з предиктором як безперервною змінною, як добре підходить, перевіривши залишки.

Вони іноді також кодуються кумулятивно. Прикладом може бути порядкова змінна x1 з рівнями 1,2 і 3, щоб мати фіктивну бінарну змінну d1 для x1> 1, а макетну бінарну змінну d2 для x1> 2. Тоді коефіцієнт d1 - це ефект, який ви отримуєте, коли збільшуєте свою порядкову величину на 2 до 3, а коефіцієнт для d2 - ефект, який ви отримуєте, коли ви порядкову від 2 до 3.

Це робить інтерпретацію часто простішою, але еквівалентно використанню її як категоричної змінної для практичних цілей.

Гельман навіть припускає, що можна використовувати порядковий предиктор і як категоричний фактор (для основних ефектів), і як безперервна змінна (для взаємодій) для підвищення гнучкості моделей.

Моя особиста стратегія зазвичай полягає в тому, щоб зрозуміти, чи сприймати їх як нескінченне має сенс і приводити до розумної моделі та використовувати їх лише категорично, якщо необхідно.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.