Який статистичний тест слід використовувати для тестування на збагачення списку генів?


10

Я провів експеримент, щоб перевірити клітинну чутливість до певного агента пошкодження ДНК. Ми знайшли 270 генів, які були особливо чутливими до препарату, і загальна кількість аналізованих генів становила 3668. 38 з 270 чутливих генів класифікуються як "гени відновлення ДНК". Якщо кількість "генів відновлення ДНК", що містяться в геномі, становить 112, а загальна кількість генів у геномі становить 3668, чи збагачуються чутливі гени в репараційних генах ДНК? Який статистичний тест слід використовувати? Буду вдячний, якщо ви також можете сказати мені якийсь інструмент для розрахунку значення р в Інтернеті.

Відповіді:


17

Стандартна практика для перевірки на збагачення списків генів - це зробити гіпергеометричний тест або, що рівнозначно, однобічний точний тест Фішера . У вас є дій у випадку :2×2

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

Ви можете провести тест Rнаступним чином:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

Що дає дуже значний результат:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Зауважте, що при тестуванні на предмет надмірного представлення (а не на недостатнє представлення) alternativeпараметр встановлюється "greater".


1
Дякую за вашу відповідь. Я також вважаю, що тест Фішера може бути хорошим методом для аналізу. У мене немає жодного статистичного програмного забезпечення для виконання результатів для інших функціональних класів, які я також хотів би перевірити. Чи знаєте ви який-небудь "онлайн" інструмент для отримання значень усіх десяткових знаків?
Лора

1
Ви можете завантажити R безкоштовно. Дивіться r-project.org Отже, відсутність програмного забезпечення є рішучим (і думати, що вам потрібен спосіб обчислення в Інтернеті, невірно). Але прошу трохи пошукати, щоб з’ясувати ці речі для себе. Подивіться поради на сайті stats.stackexchange.com/help/how-to-ask щодо задавання гарного питання.
Нік Кокс

@Nick Ваша порада хороша, але, будь ласка, не сприймайте це як характеристику афіші: таке фразування занадто легко зрозуміти як напад, який, я сумніваюся, ви мали намір. Тому я видалив попередню фразу у вашому коментарі (яка не додала до неї ніякої інформації).
whuber

Чудовим онлайн-інструментом для цього є: mathcelebrity.com/fishers_exact_test.php

Чи можете ви пояснити додатково, завищена інформація про те, що саме обчислюється?
sdgaw erzswer
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.