Філогенетично залежні змінні: ANOVA?


13

Я розумію, що виводити коваріаційну матрицю з філогенетичних даних, щоб зробити для двох змінних, на яких ви робите регресію. Але що станеться, якщо у вас є одна безперервна змінна, яка раніше виявляла себе залежною від філогенезу, та одну порядкову змінну? Останнє є порядковим, я не впевнений, як ставити це до того, як філогенетична залежність призводить до упередженої статистики тестів.cov(X,Y)=0

Чи є сенс обчислити філогенштейнські незалежні філогенетичні контрасти на постійній змінній та використовувати їх для ANOVA?

Значення PIC дорівнює:

Cij=(XiXj)dij

Де - X для видів i , X j - X для видів j , а d i j - попарна відстань між видами i та j на філогенетичному дереві.XiXi,XjXjdijij


1
У CrossValided є достатньо прикладних статистиків, щоб ми могли розглянути можливість перенесення цього сайту на статистику.
Деніел Даніель

2
Я рекомендую список розсилки r-sig- phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Навіть якщо ви не використовуєте R для свого аналізу, ви отримаєте дуже хороші відповіді на своє запитання.
кмм

Відповіді:


1

Перший крок, який я рекомендував би, - ввести змінну фіктивних даних для кожного порядкового класу (див. Коментарі на веб- сайті https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta .edu / факультет / kunovich / Soci5304_Handouts / тема% 25208_Dummy% 2520Variables.doc & кд = 2 & веди = 0CCAQFjAB & USG = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ & Sig2 = 9hkDU6Y2mpKcGzBTIK8jog ) і побудувати відповідні кошти з фіктивних змінних регресійного аналізу. Ви також можете перевірити, чи є тенденція в самих змінних змінних. Ви також можете переупорядкувати категорію порядкових змінних відповідно до оціночної величини фіктивних змінних для подальшого аналізу, якщо для цього є попереднє (бачити поточні дані) обґрунтування.

Якщо припустити, що в попередньому аналізі не спостерігається зростаючого ефекту тренду (не обов'язково лінійного) та включення будь-якого впорядкованого впорядкування в саму порядкову змінну, цікавим підходом, який також стосується можливих проблем нормальності, є проведення регресійного аналізу, в якому всім змінним присвоєні ранги, включаючи порядкову змінну. Обґрунтування цього божевілля, цитувати з Вікіпедії про коефіцієнт кореляції рейтингу Spearman's (посилання: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):

"Коефіцієнт Спірмена, як і будь-який розрахунок кореляції, підходить як для безперервних, так і для дискретних змінних, включаючи порядкові змінні. [1] [2]"

У Вікіпедії представлений приклад і кілька способів оцінки стандартної похибки обчисленої кореляції рангів для тестування. Зауважте, якщо він статистично не відрізняється від нуля, то масштабована версія, як і в обчислюваній регресії на основі рангів, аналогічно, не суттєва.

Я б ще більше нормалізував ці ранги (поділяючи на кількість спостережень), даючи можливу вибіркову кількісну інтерпретацію (зауважте, можливі уточнення при побудові емпіричного розподілу для даних, про які йдеться). Я також здійснив би просту кореляцію між y та заданою перетвореною порядковою змінною, щоб напрямок обраного вами ранжирування (наприклад, 1 до 4 проти 4 до 1) давав знак для рангової кореляції, що має інтуїтивне значення в контексті вашого дослідження.

[Редагувати] Зверніть увагу, що моделі ANOVA можуть бути представлені у форматі регресії з відповідною матрицею дизайну, а в будь-якій стандартній регресійній моделі, яку ви досліджуєте, центральною темою є аналіз на основі середнього значення Y, що дається X. Однак у деяких дисциплінах, таких як екологія, різний фокус на регресійних відносинах, що мається на увазі в різних квантилах, включаючи медіану, виявився плідним. Очевидно, що в екології середній вплив може бути невеликим, але це не обов'язково так, як у інших квантових елементів. Це поле називається квантильною регресією. Я б запропонував вам використати його для доповнення вашого поточного аналізу. В якості довідки вам може бути корисна стаття 213-30 "Вступ до кількісної регресії та процедури QUANTREG" Коліна (Ліна) Чену в Інституті SAS.

Ось також джерело про використання рангових перетворень: "Використання рангових перетворень в регресії" Рональда Л. Імана та У. Дж. Коновер, опубліковані в "Technometrics", т. 21, № 4, листопад 1979 р. У статті зазначається, що регресії використання перетворень рангів, як видається, працює досить добре на монотонних даних. Такої думки поділяють також фахівці з надійності, які заявляють в інтернет-журналі, цитуючи: "Метод оцінки регресії рейтингу досить хороший для функцій, які можуть бути лінеаризовані". Джерело: "Надійність Hotwire, випуск 10, грудень 2010 року.


анонімний користувач намагається внести досить великі зміни (IMO) до вашої публікації. Якщо ви не згодні з ними, ви можете їх відкатати, натиснувши посилання "відредаговано __ тому", знайшовши останню вподобану вами версію, та натиснувши "відкат".
gung - Відновіть Моніку

0

Філогенетичний тест ANOVA був розроблений Garland та ін. (1993) і реалізується у phy.anovaфункції в geigerпакеті. Метод створює р-значення, виправлене на філогенетичну незалежність, генеруючи нульовий розподіл на основі моделювання еволюції в філогенезі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.