Це насправді гаряча тема в дослідженнях геномного аналізу (GWAS)! Я не впевнений, що метод, про який ви думаєте, є найбільш підходящим у цьому контексті. Об'єднання р-значень було описано деякими авторами, але в іншому контексті (дослідження реплікації чи мета-аналіз, див., Наприклад, (1) для останнього огляду). Об'єднання рН-значень SNP методом Фішера, як правило, використовується, коли хочеться отримати унікальне значення р для даного гена; це дозволяє працювати на генному рівні та зменшити величину розмірності наступного тестування, але, як ви вже сказали, незалежність між маркерами (що виникає через просторової колокації або нерівноваги зв’язку, LD) вводить зміщення. Більш потужні альтернативи покладаються на процедури перекомпонування,
Моя основна проблема при завантаженні (із заміною) полягає в тому, що ви вводите штучну форму спорідненості, або іншими словами, ви створюєте віртуальних близнюків, отже, змінюючи рівновагу Харді-Вайнберга (але також мінімальну частоту алелів та швидкість дзвінка). Це не було б при перестановковому підході, коли ви переставляєте окремі мітки та зберігаєте дані генотипування такими, які є. Зазвичай програмне забезпечення планки може давати вам сирі та перестановлені р-значення, хоча воно використовує (за замовчуванням) адаптивну стратегію тестування з розсувним вікном, що дозволяє зупинити виконання всіх перестановок (скажімо, 1000 за SNP), якщо виявиться, що SNP під розгляд не "цікавий"; він також має можливість для обчислення maxT, дивіться онлайн-довідку .
Але, враховуючи низьку кількість SNP, які ви розглядаєте, я б запропонував покластися на тести, засновані на FDR або maxT, як реалізовано в пакеті багатодоступних R (див. mt.maxT
), Але остаточним керівництвом щодо стратегій перекомпонування в геномному застосуванні є кілька процедур тестування з додатками до Геноміка , з Dudoit & van der Laan (Springer, 2008). Дивіться також книгу Андреа Фолкеса про генетику з R , яка розглядається в JSS. У неї є чудовий матеріал про безліч процедур тестування.
Подальші примітки
Багато авторів вказували на той факт, що прості методи корекції багаторазового тестування, такі як Bonferroni або Sidak, є надто суворими для коригування результатів для окремих SNP. Більше того, жоден із цих методів не враховує кореляцію, яка існує між SNP за рахунок LD, який позначає генетичну варіацію в різних областях генів. Інші альтернативи бджоли запропонували, як похідне методу Холма для багаторазового порівняння (3), прихованої моделі Маркова (4), умовного або позитивного FDR (5) або його похідного (6), щоб назвати декілька. Так звана статистика розривів або розсувне вікно в деяких випадках виявилися успішними, але ви знайдете хороший огляд у (7) та (8).
Я також чув про методи, які ефективно використовують структуру гаплотипу або ЛД, наприклад (9), але я ніколи їх не використовував. Однак вони, мабуть, більше пов'язані з оцінкою кореляції між маркерами, а не значенням p, як ви мали на увазі. Але насправді, ви можете краще подумати з точки зору структури залежності між послідовними статистичними тестами, ніж між співвіднесеними р-значеннями.
Список літератури
- Cantor, RM, Lange, K і Sinsheimer, JS. Пріоритетність результатів GWAS: огляд статистичних методів та рекомендацій щодо їх застосування . Am J Hum Genet. 2010. 86 (1): 6–22.
- Corley, RP, Zeiger, JS, Crowley, T et al. Асоціація кандидатних генів із антисоціальною залежністю від наркотиків у підлітків . Залежність від наркотиків та алкоголю 2008: 96: 90–98.
- Dalmasso, C, Génin, E і Trégouet DA. Процедура зваженого Холма, що враховує частоти аллелів у дослідженнях асоціацій генома . Генетика 2008 180 (1): 697–702.
- Вей, Z, Сонце, W, Ван, К і Хаконсон, Х. Багаторазові випробування в дослідженнях асоціацій з широким геномом за допомогою прихованих моделей Маркова . Біоінформатика 2009 25 (21): 2802-2808.
- Броберг, П. Порівняльний огляд оцінок пропорції генів, що не змінюються, та швидкості виявлення помилок . BMC Bioinformatics 2005 6: 199.
- Потрібно, AC, Ge, D, Weale, ME та ін. Геномне дослідження SNP та CNV у шизофренії . PLoS Genet. 2009 р. 5 (2): e1000373.
- Хан, В, Канг, ХМ та Ескін, Е. Швидке та точне багаторазове виправлення корекції та оцінка потужності для мільйонів корельованих маркерів . PLoS Генетика 2009
- Лян, Я і Келемен, А. Статистичний прогрес і проблеми для аналізу корельованих даних високих розмірів snp при геномному дослідженні складних захворювань . Статистичні опитування 2008 2: 43–60. - найкращий останній огляд за будь-який час
- Nyholt, DR. Проста корекція для багаторазового тестування однонуклеотидних поліморфізмів у взаємозв'язку взаємозв'язку між собою . Am J Hum Genet. 2004 р. 74 (4): 765–769.
- Нікодим, К.К., Лю, Ш, Чейз, Г.А., Цай, Ю.Й., і Фоллін, доктор медицини. Порівняння помилок типу I для багаторазових виправлень випробувань у великих дослідженнях одноядерного поліморфізму з використанням основних компонентів проти алгоритмів блокування гаплотипів . BMC Genetics 2005; 6 (Доп. 1): S78.
- Peng, Q, Zhao, J та Xue, F. PCA-тести на основі впевненого завантаження на основі PCA для асоціації генів-хвороб із залученням декількох SNP . BMC Genetics 2010, 11: 6
- Li, M, Romero, R, Fu, WJ та Cui, Y (2010). Картографування взаємодій гаплотипу та гаплотипу з адаптивним LASSO . BMC Genetics 2010, 11:79 - хоча безпосередньо не пов'язане з питанням, воно охоплює аналіз на основі гаплотипу / епістатичний ефект