Чи корекція Бенджаміні-Хохберга більш консервативна, оскільки кількість порівнянь збільшується?


19

Наскільки консервативна корекція багаторазового тестування Бенджаміні-Хохберга щодо загальної кількості порівнянь? Наприклад, якщо у мене є список з 18000 функцій для двох груп і я виконую тест Вілкоксона, щоб отримати p-значення. Я коригую це значення p за допомогою Бенджаміні-Хохберга і майже нічого не виходить настільки значним.

Я знаю, що корекція Бонферроні може бути досить консервативною, оскільки кількість порівнянь збільшується, чи має Бенджаміні-Хохберг однакову властивість?


1
Ви справді маєте на увазі консервативність в тому сенсі, що фактичний показник I типу набагато менший, ніж номінальний? Або ви маєте на увазі «низьку потужність»?
shabbychef

Він сказав "консервативно", не "занадто консервативно". Якщо метод консервативний, він має низьку потужність ...
Елвіс

Відповіді:


31

По-перше, вам потрібно зрозуміти, що ці дві багаторазові процедури тестування не контролюють одне і те ж. Використовуючи ваш приклад, ми маємо дві групи з 18000 спостережуваних змінних, і ви робите 18 000 тестів, щоб виявити деякі змінні, які відрізняються від однієї групи до іншої.

  • Корекція Bonferroni контролює коефіцієнт помилок Familywise , тобто ймовірність, якщо припустити, що всі 18000 змінних мають однаковий розподіл у двох групах, що ви помилково стверджуєте, "тут у мене є суттєві відмінності". Зазвичай ви вирішили, що якщо ця ймовірність <5%, ваша претензія є достовірною.

  • Корекція Бенджаміні-Хохберга контролює показник помилкового виявлення , тобто очікувану частку помилкових позитивних змінних змінних, для яких ви заявляєте про існування різниці. Наприклад, якщо з контролем FDR до 5% 20 тестів є позитивними, "в середньому" лише 1 з цих тестів буде хибнопозитивним.

Тепер, коли кількість порівнянь збільшується… ну, це залежить від кількості граничних нульових гіпотез, які є істинними. Але в основному, з обох процедур, якщо у вас є кілька, скажімо, 5 або 10, по-справжньому пов'язаних змінних, у вас є більше шансів виявити їх серед 100 змінних, ніж серед 1 000 000 змінних. Це повинно бути досить інтуїтивним. Цього не уникнути.


2
Це було приємне пояснення. Дякую за продуману відповідь.
user4673

2
Приємна відповідь (+1), можливо, це може вас зацікавити stats.stackexchange.com/questions/166323/…
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.