Чому тест Мантеля віддається перевазі порівняно з Моранським І?


37

Тест Мантеля широко застосовується в біологічних дослідженнях для вивчення кореляції між просторовим розподілом тварин (положення в просторі) з, наприклад, їх генетичною спорідненістю, швидкістю агресії або яким-небудь іншим ознакою. Використовують безліч хороших журналів ( PNAS, поведінка тварин, молекулярна екологія ... ).

Я сфабрикував деякі зразки, які можуть траплятися в природі, але здається, що тест Мантеля виявляється досить марним для їх виявлення. З іншого боку, у Морана я мав кращі результати (див. Значення p під кожним графіком) .

Чому вчені не використовують замість нього Морана? Чи є якась прихована причина, яку я не бачу? І якщо є якась причина, як я можу знати (як гіпотези повинні бути побудовані по-різному), щоб належним чином використати тест Мантеля чи Морана? Корисний приклад із реального життя.

Уявіть собі таку ситуацію: на кожному дереві сидить сад (17 х 17 дерев) з вороною. Рівні "шуму" для кожної ворони доступні, і ви хочете знати, чи просторовий розподіл ворон визначається шумом, який вони видають.

Є (принаймні) 5 можливостей:

  1. "Рибалка рибалку бачить здалеку." Чим більше схожих ворон, тим менша географічна відстань між ними (одиночний скупчення) .

  2. "Рибалка рибалку бачить здалеку." Знову ж таки, чим більше схожих ворон, тим менша географічна відстань між ними, (кілька скупчень), але одна кластер галасливих ворон не знає про існування другого кластера (інакше вони б зрослися в одне велике скупчення).

  3. "Монотонна тенденція".

  4. "Протилежності притягуються." Подібні ворони не витримують одна одну.

  5. "Випадкова картина." Рівень шуму не має істотного впливу на просторовий розподіл.

Для кожного випадку я створив графік точок і використав тест Мантеля для обчислення кореляції (не дивно, що його результати є незначними; я б ніколи не намагався знайти лінійну асоціацію серед таких моделей точок).

введіть тут опис зображення


Приклад даних: (стислий, наскільки це можливо)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Створення матриці географічних відстаней (для I Морана перевернуто):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Створення сюжету:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS в прикладах за статистикою допомоги веб - сайті Каліфорнійського університету, обидва тести використовуються на точно такі ж дані і ту ж саму гіпотезу, що не дуже корисно (див, тест Mantel , Морана I ).

Відповідь на чат Ви написали:

... він [Mantel] перевіряє, чи спокійні ворони розташовані поблизу інших тихих ворон, тоді як галасливі ворони мають галасливих сусідів.

Я думаю, що така гіпотеза НЕ могла бути перевірена тестом Мантеля . На обох сюжетах гіпотеза справедлива. Але якщо ви гадаєте, що один кластер не галасливих ворон може не мати знань про існування другого кластера галасливих ворон - тест Мантела знову марний. Такий поділ повинен мати дуже ймовірний характер (головним чином, коли ви займаєтеся збиранням даних у більшому масштабі).

введіть тут опис зображення

Відповіді:


19

Тест Мантеля і Моран я посилаюся на дві дуже різні концепції.

Причиною використання I Морана є питання просторової автокореляції: співвідношення змінної із собою через простір. Один використовує I Морана, коли хоче дізнатись, в якій мірі виникнення події в ареальній одиниці робить більш імовірним або малоймовірним виникнення події в сусідній ареальній одиниці. Іншими словами (використовуючи ваш приклад): якщо на дереві є галаслива ворона, наскільки ймовірно чи малоймовірно інші галасливі ворони по сусідству? Нульова гіпотеза I Морана - це не просторова автокореляція в цікавій змінній.

Причиною використання тесту Мантеля є питання подібності чи відмінності між змінними. Один використовує тест Мантеля, коли хоче дізнатись, чи є зразки, подібні за змінними провісника (простору), також схожі за залежною від (змінної) змінною. Простіше кажучи: Чи зразки, близькі один до одного, також композиційно схожі та є зразки, які просторово віддалені один від одного, також композиційно не відрізняються? Використовуючи ваш приклад: він перевіряє, чи розташовані спокійні ворони біля інших тихих ворон, тоді як галасливі ворони мають галасливих сусідів. Нульова гіпотеза не стосується просторового розташування та DV.
Крім цього, частковий тест Mantel дозволяє порівнювати дві змінні, контролюючи третю.
Наприклад, для порівняння потрібен тест Mantel

  • Дві групи організмів, які утворюють однаковий набір одиниць вибірки;
  • Структура громади до і після порушення;
  • Генетична / екологічна відстань та географічна відстань.

Ось хороша дискусія про тест Mantel та його застосування.

(Відредаговано у відповідь на нові приклади Ладіслава Надо)

Якщо я можу здогадатися, причина вашої плутанини полягає в тому, що ви продовжуєте думати про простір і шум у своїх прикладах як про дві безперервні змінні, так і про одну матрицю відстані (положення в просторі) та одну суцільну змінну (шум). Насправді, щоб проаналізувати подібність двох таких змінних, слід розглядати їх обох як матриці відстані . Це є:

  • одна матриця (наприклад, для простору) описує відмінності для кожної пари географічних координат. Значення для 2 ворон, що сидять поруч, нижче, ніж для ворон, що сидять далеко один від одного;
  • інша матриця (для екологічної, генетичної чи будь-якої іншої структури) описує відмінності між виміряними результатами в заданих точках. Значення для 2 ворон з однаковим рівнем шуму (не має значення, тихо чи шумно - це лише міра подібності!) Нижче, ніж для пари ворон з різними рівнями шуму.

Тоді тест Mantel обчислює поперечний добуток відповідних значень у цих двох матрицях. Дозвольте мені ще раз підкреслити, що статистика Mantel - це кореляція між двома матрицями відстані і не еквівалентна кореляції між змінними , що використовуються для формування цих матриць.

Тепер давайте візьмемо дві структури, які ви показали на малюнках A і B.
На малюнку A відстань у кожній парі ворон відповідає подібності за рівнем їх шуму. Ворони з невеликими різницями за рівнем шуму (кожна тиха ворона проти іншої тихої ворони, кожна шумна ворона проти іншої галасливої ​​ворони) залишаються поруч, а кожна пара ворон з великою різницею в рівні свого шуму (тиха ворона проти галасливої ​​ворони) тримайтеся подалі одне від одного. Тест Мантел правильно показує, що між двома матрицями існує просторова кореляція.
У картині B, проте, відстань між воронами робить НЕвідповідають подібності за рівнем шуму. Поки всі галасливі ворони залишаються разом, тихі ворони можуть або не можуть перебувати поруч. Насправді відстань у деяких пар несхожих ворон (одна тиха + одна галаслива) менша, ніж відстань для деяких пар подібних ворон (коли обидві тихі).
На малюнку В немає ніяких доказів того, що якщо дослідник збирає навмання дві подібні ворони, вони були б сусідами. Немає доказів, що якби дослідник підхопив навмання дві сусідні (чи не такі далекі) ворони, вони були б подібними. Отже, початкова претензія, яка On both plots the hypothesis validє неправильною. Структура, як на малюнку B, не відображає просторової кореляції між двома матрицями і, відповідно, не відповідає тесту Мантеля.

Звичайно, в реальності існують різні типи структур (з одним або декількома кластерами подібних об'єктів або взагалі без чітких кластерних меж). І тест Mantel цілком застосовний і дуже корисний для тестування того, що він тестує. Якщо я можу порекомендувати ще одне хороше прочитання, ця стаття використовує реальні дані та досить просто та зрозуміло висловлює тест Морану Я, Гірі та тест Мантеля.

Сподіваюсь, усе зараз трохи зрозуміліше; однак я можу розширити це пояснення, якщо відчуваєте, що все-таки щось не вистачає.


1
дякую за вашу відповідь, але я вважаю, що написана вами гіпотеза (з гіпотези про тест Мантеля) не є корисною для реальних даних. Додаю свою відповідь до вас вище, буду дуже рада, якщо ви відповісте на неї. Можливо, я помиляюся.
Ladislav Naďo

@Ladislav Nado Я оновив відповідь. Будь ласка, не соромтеся просити більше пояснень, якщо потрібно.
ІМ

Велике спасибі, коли я "пережував" статті, які ти рекомендував, я нарешті зрозумів.
Ladislav Naďo

1
@LadislavNado Чудово! Радий допомогти.
IM
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.