Чому в дослідженні генетичної асоціації можна використовувати вік і квадратик як коваріати? Я можу зрозуміти використання віку, якщо він був визначений як значний коваріат, але я втрачаю з точки зору використання вікового квадрата.
Чому в дослідженні генетичної асоціації можна використовувати вік і квадратик як коваріати? Я можу зрозуміти використання віку, якщо він був визначений як значний коваріат, але я втрачаю з точки зору використання вікового квадрата.
Відповіді:
Наближення ряду Тейлора говорять нам, що майже будь-яка гладка функція може бути наближена поліномом, тому, включаючи такі терміни, як або (де x - вік для вашого прикладу), давайте оцінимо коефіцієнти для наближення для відомого або невідома нелінійна функція або вік у вашому випадку. Тестування цих коефіцієнтів також є простим способом перевірити, чи відношення є досить лінійним чи якщо нелінійні умови дадуть кращу відповідність.
Залежно від кінцевої мети аналізу, нелінійні терміни можуть бути збережені для прогнозування, або сюжети прогнозування можуть бути використані для того, щоб запропонувати фактичну функціональну залежність. Є й інші інструменти, такі як кубічні сплайни, які можуть бути використані замість поліноміальних термінів для досягнення подібних цілей, але додавання терміна в квадрат - це швидкий і простий спосіб зробити це.
Простіше: додавання квадрата змінної дозволяє більш точно моделювати ефект віку, який може мати нелінійний зв’язок із незалежною змінною. Наприклад, ефект від віку може бути позитивним до, скажімо, 50-річного віку, а потім негативного.
Додавання віку у квадрат до віку дозволяє моделювати ефект у різних віках, а не припускати, що ефект лінійний для всіх віків.
Дивіться мій пост у блозі про просте покрокове керівництво та інтерпретацію змінної віку та віку у квадраті.
http://www.excel-with-data.co.uk/blog-1/how-to-regression-analysis-in-excel/
Можливо, трансформація була здійснена задля задоволення припущень моделі. Можливо, це також було зроблено через наявність якогось квадратичного відношення.