Чи достовірно спостерігається частота алелів, ніж прогнозована?


10

Питання : Як я можу побудувати тест, щоб визначити, чи спостерігається "гірська" -аллельна частота (рис. 1) значно нижча в центральних та південних горах, ніж прогнозована (рис. 2) за моделлю екологічного відбору (детальніше див. Нижче )?

Проблема : Моя початкова думка полягала в тому, щоб регресувати модель залишків щодо широти: довготи та висоти (в результаті чого лише взаємодія між широтою та довготою як важлива). Проблема полягає в тому, що залишки (рис. 3) можуть відображати зміни, не пояснені моделлю, та / або що відбувається щось біологічне, наприклад, алель не встиг поширитися на південь до свого потенціалу або існує певний бар'єр для потоку генів. Якщо порівнювати спостережувані (Фіг1) та очікувані (Фіг.2) частоти гірських алелей, очевидна різниця, особливо в центральних та південних горах Швеції та Норвегії. Я погоджуюсь, що модель може пояснити не всі зміни, але чи можу я створити розумний тест, щоб дослідити думку про те, що гірський алель не досяг свого потенціалу в центральних і південних горах?

Фон: У мене є біаллельний маркер AFLP, розподіл частоти якого, схоже, асоціюється з гірським (і широтою: довготою) проти низинних місць існування на Скандинавському півострові (рис. 1). "Гірський" -алель майже закріплений на півночі, який є гірським. Він майже відсутній або закріплений за "низинним" -алелем на півдні, якому не вистачає гір. Коли людина рухається з півночі на південь у горах, "гірський" аллель зустрічається з меншою частотою. Ця різниця в "гірській" -алельній частоті з півночі на південь може бути просто пов'язана з філологіографією або історичними процесами, оскільки регіон був колонізований і з півночі, і з півдня. Наприклад, якщо гірський алель походить від північного населення, можливо, він не встиг повністю розширитися на південне населення,

Моя робоча гіпотеза полягає в тому, що частота «гірська» - аллеля є результатом екологічного відбору (нульова гіпотеза - це нейтральний відбір).

Для моєї екологічної селекційної моделі я використав узагальнену модель добавок (GAM) з частотою біномальної алелі як змінну відповіді (129 ділянок, відібраних у Fennoscandinavia, що зазвичай від 10 до 20 особин, відібраних на кожному місці) та кілька змінних кліматичних та вегетаційних сезонів, як змінних предиктора Результати моделі такі (TMAX04-06 = максимальна температура в квітні-червні, Phen_NPPMN = середня продуктивність вегетації сезону вегетації, PET_HE_YR = річна потенційна випароперекладка, Dist_Coast = відстань до узбережжя):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

введіть тут опис зображення

Рисунок 1. Спостережена "гірська" -аллельна частота для біаллельного маркера AFLP. Контурні лінії 0,1 інтервалу частот, кольоровим відтінком є ​​висота з блюзом для найнижчих та червоних найвищих.

введіть тут опис зображення

Малюнок 2. Прогнозована "гірська" -аллельна частота для біаллельного маркера AFLP. Контурні лінії 0,1 інтервалу частот, кольоровим відтінком є ​​висота з блюзом для найнижчих та червоних найвищих.

введіть тут опис зображення

Малюнок 3. Екологічна модель відбору (з використанням GAM) залишків з усією досліджуваною територією (Fennoscandinavia) та окремо для Норвегії, Швеції та Фінляндії. Червоні пунктирні лінії являють собою вторинну зону контакту між популяцією північного та південного походження від інших маркерів AFLP та стабільний ізотопний аналіз пір'я, вирощеного на їх окремих територіях зимівлі в Африці. Тонка чорна пунктирна лінія є центром зони.


1
Дякую за велику кількість деталей. Як нульова модель виникає в питанні? Схоже, що лише порівняльна модель екологічного відбору має значення для порівняння спостережуваного та очікуваного.
gui11aume

Які ваші фактичні дані тут? Вихід моделі каже "n = 129", але це 129 осіб, або 129 локацій на кожній з яких у вас частота алелів, або ...?
onestop

Вибачте, що я хотів надати якомога більше підстав, щоб ви могли найкраще зрозуміти логіку (або нелогічність) мого підходу до рукопису, який я розробляю. Моє питання стоїть у верхній частині, я хотів би знайти причину, щоб визначити, чи різниця між спостережуваним та очікуваним значно відрізняється. Це може повідомити мене про те, чи алель все ще поширюється чи існує якийсь бар'єр для досягнення очікуваного значення. Що стосується "N = 129", оскільки це частота алелів, це означає, що 129 сайтів мають, як правило, від 10 до 20 осіб, відібраних на кожній ділянці.
Кіт Ларсон

Ви згадуєте, що люди виявляються пальміктичними для материнських та аутосомних локусів. Чи маєте ви доступ до цих даних? Як ви оцінили панміксію?
Самер

Відповіді:


1

Це питання може бути мертвим, але графіки тут чудові, і відповідь тут відчувається інтуїтивно очевидною. Якщо ви шукаєте "гірський" алель, очевидним вибором буде використання висоти (або якогось сурогату) як свого прогноктора. Якби це показало значну асоціацію з частотою алелів, це могло б дати вагомі докази вашої гіпотези.

Ви можете додати більше змінних прогнозів, що описують інші аспекти гори, ніж її висота - наприклад, "нерівність місцевості" або тип рослинності - які є унікально гірськими і можуть також бути пов'язані з частотою алелів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.