Це відмінне запитання, гідне того, хто є чітким статистичним мислителем, оскільки він визнає тонкий, але важливий аспект багаторазового тестування.
Існують стандартні методи коригування р-значень множинних коефіцієнтів кореляції (або, що еквівалентно, для розширення їх довірчих інтервалів), такі як методи Бонферроні та Сідака ( qv ). Однак вони є занадто консервативними з великими кореляційними матрицями через властиві їм математичних зв’язків, які взагалі повинні містити коефіцієнти кореляції. (Деякі приклади таких взаємозв'язків див. Недавнє запитання та витікаюча з них нитка .) Один з найкращих підходів для вирішення цієї ситуації - це проведення перестановки (або перекомпонування) тесту. Це легко зробити за допомогою кореляцій: у кожній ітерації тесту просто випадковим чином скресліть порядок значень кожного з полів (знищуючи тим самим будь-яку притаманну кореляцію) та перерахуйте повну кореляційну матрицю. Зробіть це для декількох тисяч ітерацій (або більше), а потім підведіть підсумки розподілу записів кореляційної матриці, наприклад, вказавши їх 97,5 і 2,5 процентилі: вони будуть слугувати взаємними симетричними двосторонніми 95-відсотковими інтервалами довіри під нулем гіпотеза про відсутність кореляції. (Перший раз, коли ви зробите це з великою кількістю змінних, ви здивуєтеся, наскільки високими можуть бути деякі коефіцієнти кореляції, навіть коли немає властивої кореляції.)
Звітуючи про результати, незалежно від того, якими обчисленнями ви займаєтесь, слід включити наступне:
Розмір кореляційної матриці ( тобто скільки змінних ви переглянули).
Як ви визначили p-значення або "значущість" будь-якого з коефіцієнтів кореляції ( наприклад , залишили їх такими, як є, застосували корекцію Бонферроні, зробили тест на перестановку чи інше).
Чи дивились ви на альтернативні заходи кореляції, такі як співвідношення рейтингів Спірмена . Якщо ви це зробили, також вкажіть, чому ви вибрали метод, про який ви фактично звітуєте та використовуєте.