Яка формула коригуваного р-значення Бенджаміні-Хохберга?


14

Я розумію процедуру і те, що вона контролює. Отже, яка формула для скоригованого р-значення в процедурі BH для кількох порівнянь?


Щойно я зрозумів, що оригінальний BH не виробляє відрегульованих p-значень, лише коригував умову (не) відхилення: https://www.jstor.org/stable/2346101 . Гордон Сміт все одно ввів коригувані показники рН в 2002 році, тому питання все ще стосується. Він реалізований в R, як p.adjustі метод BH.

Відповіді:


6

У відомому документі Benjamini & Hochberg (1995) описана процедура прийняття / відхилення гіпотез на основі коригування рівня альфа. Ця процедура має однозначне еквівалентне переформулювання з точки зору скоригованих значень, але вона не обговорювалася в початковій роботі. За словами Гордона Сміта , він представив відрегулювати -значення в 2002 році при реалізації в R. На жаль, немає відповідного Цитування, тому він завжди був для мене незрозумілим , що слід процитувати , якщо один використовує BH-скориговані -значення.pp ppp.adjustp

Виявляється, процедура описана у Бенджаміні, Геллер, Єкутіелі (2009) :

Альтернативний спосіб представлення результатів цієї процедури - це подання скоригованих значень. Налагоджені BH значення визначаються якpp

p(i)BH=min{minji{mp(j)j},1}.

Ця формула виглядає складніше, ніж є насправді. Він говорить:

  1. По-перше, упорядкуйте всі -значення від малого до великого. Потім помножте кожен -значення на загальну кількість тестів і розділіть на його ранговий порядок.ppm
  2. По-друге, переконайтесь, що отримана послідовність не зменшується: якщо вона коли-небудь почне зменшуватися, зробіть попереднє -значення рівним наступному (повторно, поки вся послідовність не стане зменшується).p
  3. Якщо будь-яке значення значення закінчиться більшим за 1, зробіть його рівним 1.p

Це прямо переформулювання оригінальної процедури БХ з 1995 року. Можливо, існував більш ранній документ, в якому явно було введено концепцію значень, скоригованих БГ, але я не знаю жодної.p


Оновлення. @Zenit виявив, що Yekutieli & Benjamini (1999) описали те саме, що було ще в 1999 році:

введіть тут опис зображення


Таку відповідь я очікував, +1. Я пам'ятаю, як читав про виконання Гордоном Смітом коригуваного значення p і не знаю, кого цитувати, класно, щоб побачити, що в цьому є "канон".
Firebug

1
Я вважаю, що існує ще більш рання посилання: Єкутіелі та Бенджаміні (1999) (версія PDF тут доступна ). Визначення 2.4 описує, як можна перефразовувати оригінальну процедуру FDR 1995 року з урахуванням скоригованих p-значень. Завдяки цій публікації в блозі, де я дізнався про це.
Зеніт

@ Зеніт О, вау! Чудова знахідка! Я повинен оновити свою відповідь.
амеба каже:

Дякуємо за джерело @Zenit! Легко дивно, що такий всюдисущий статистичний метод не має добре відомого посилання.
Firebug

8

Спочатку відповідь на точку. Вважайте, що - значення (одиночного тесту) пов'язане зі значенням статистики тесту. FDR Benjamini-Hochberg обчислюється в два етапи ( = # pvalues , = # pvalues): p z 0 N 0p0pz0N0 Нp0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


Тепер давайте розберемося з цим. Основна ідея (байєсів) полягає в тому, що спостереження виходять із суміші двох розподілів:

  • f 0 ( z )π0N спостережень від нульової щільностіf0(z)
  • f 1 ( z )(1π0)N спостережень з альтернативної щільності .f1(z)

Спостерігається суміш цих двох:

  • f(z)=π0f0(z)+(1π0)f1(z)

введіть тут опис зображення

Визначення (баєсівські):

  • Fdr=π0(1F0(z0))(1F(z)) (частка хвостових областей)
  • fdr=π0f0(z0)f(z) (частка щільності хвоста)

Як показано нижче, Fdr еквівалентний FDR Benjamini hocherg при (що має місце в більшості досліджень з біоінформатики)π01

введіть тут опис зображення

(На основі статистичних висновків Efron & Tibshirani про комп'ютерну епоху )

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.