коригування значення p для статистики I Лорану (LISA)


10

Я працюю з дослідницьким просторовим аналізом в R за допомогою пакету spdep.

Я натрапив на варіант коригування p- значень локальних показників просторової асоціації (LISA), обчислених за допомогою localmoranфункції. Відповідно до документів він спрямований на:

... коригування значення ймовірності для декількох тестів.

Далі в документах p.adjustSPпрочитав, що доступні варіанти:

Методи коригування включають корекцію Bonferroni ("" bonferroni ""), в якій p-значення множать на кількість порівнянь. Чотири менш консервативні виправлення включаються також Холм (1979) ("" холм "), Хохберг (1988) (" "хохберг" "), Хоммель (1988) (" "хоммель" ") і" Бенджаміні і Хохберг "(1995) ('"fdr"') відповідно. Опція проходу ("" немає ") також включена.

Перші чотири методи розроблені для того, щоб забезпечити сильний контроль над рівнем помилок у сімейному режимі. Здається, немає підстав використовувати немодифіковану корекцію Бонферроні, оскільки в ній переважає метод Холма, який також діє при довільних припущеннях.

Методи Хохберга та Хоммеля справедливі, коли тести гіпотез є незалежними або коли вони не є негативно пов'язаними (Sarkar, 1998; Sarkar and Chang, 1997). Метод Хоммеля є більш потужним, ніж метод Хохберга, але різниця зазвичай невелика, і p-значення Хохберга швидше обчислити.

Метод "BH" (він же "fdr") і "BY" Бенджаміні, Хохберга та Єкутіелі контролюють швидкість виявлення помилок, очікувану частку помилкових відкриттів серед відкинутих гіпотез. Помилкова частота виявлення є менш жорсткою умовою, ніж помилка сімейної помилки, тому ці методи є більш потужними, ніж інші.

Кілька питань, що з’явилися:

  1. Простими словами - яка мета цього коригування?
  2. Чи потрібно використовувати такі виправлення?
  3. Якщо так - як вибрати з доступних варіантів?

1
Я мігрував це питання, тому що багатьом дуже подобається це було розглянуто тут у CV. Наприклад, подивіться, що можна дізнатися з пошуку .
whuber

@whuber Хороша ідея. Я не думав про резюме, але це, здається, є кращим домом для нього. Дякую.
radek

Відповіді:


1

коротко, проблема, з якою ви стикаєтесь, називається тестуванням численних гіпотез . Він виникає, коли ви тестуєте, як вказує ім’я, багато гіпотез одночасно.

Скажімо, у вас є задана ймовірність неправильного відхилення нульової гіпотези (хибнопозитивної) для тесту, скажімо, 5%. Зі збільшенням кількості наборів даних, які ви тестуєте (у цьому випадку для кожного з наборів, де ви застосовуєте локальну статистику Морана), вірогідність спостереження у будь-якому наборі даних помилкового додатника зростатиме незалежно від того, що ймовірність спостереження хибний позитив для одного набору даних однаковий.

Існує багато можливих "виправлень", які ви знайшли, щоб виправити цю проблему; якщо вам дійсно потрібна локальна статистика, ви не можете ухилитися від неї. В іншому випадку ви можете використовувати глобальну статистику як єдину гіпотезу.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.