Я займаюсь дослідженнями асоціацій GWAS SNP щодо захворювань, використовуючи програмне забезпечення під назвою plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ).
За результатами асоціації я отримую p-значення для всіх SNP, які були проаналізовані. Тепер я використовую QQ-графік цих p-значень, щоб показати, чи дуже низьке p-значення відрізняється від очікуваного розподілу p-значень (рівномірний розподіл). Якщо р-значення відхиляється від очікуваного розподілу, "може" називати це p значення статистичним значенням.
Як видно з QQ-сюжету, у верхньому кінці хвоста останні 4 пункти дещо важко інтерпретувати. Два останніх пункту сірого кольору свідчать про те, що ці р-значення знаходяться у очікуваному розподілі p-значень, тоді як інші два - ні.
Тепер, як інтерпретувати це, останні два бали мають нижчі значення p, але не є "значущими" згідно QQ-графіку, тоді як інші два пункти з більш високими p-значеннями "значущі"? Як це може бути правдою?