Контекст
Група соціологів та статистиків ( Benjamin et al., 2017 ) нещодавно висловили припущення, що типовий хибнопозитивний показник ( = .05), який використовується як поріг для визначення "статистичної значущості", повинен бути пристосований до більш консервативного порогу ( α = .005). Конкуруюча група соціологів та статистиків ( Lakens et al., 2018 ) відповіла, аргументуючи використання цього - або будь-якого іншого - довільно вибраного порогу. Далі йде цитата Lakens et al. (стор. 16), що допомагає пояснити тему мого питання:
В ідеалі рівень альфа визначається шляхом порівняння витрат і вигод від функції корисності з використанням теорії рішення. Цей аналіз витрат і вигод (і, отже, альфа-рівень) відрізняється при аналізі великих існуючих наборів даних у порівнянні зі збиранням даних з важкодоступних зразків. Наука різноманітна, і вчені повинні виправдати рівень альфа, який вони вирішили використовувати. ... Дослідження повинні керуватися принципами суворої науки, а не евристикою та довільними порогами.
Питання
Мені цікаво, як можна було б виправдовувати обрану альфу способом, який "керується принципами суворої науки", як Лакенс та ін. припускають, у більшості суспільно-наукових контекстів (тобто поза окремими випадками, коли оптимізація має більш конкретну якість, наприклад прибуток)?
Після розповсюдження Lakens et al., Я почав бачити циркулятори в Інтернеті, щоб допомогти дослідникам прийняти це рішення. При їх використанні дослідникам потрібно вказати "коефіцієнт витрат" помилково-позитивних та помилково-негативних помилок. Однак, як цей калькулятор тут передбачає, визначення такого співвідношення з точки зору витрат може включати в себе багато кількісних навмання:
У той час як деякі витрати на помилки легко оцінити у грошовому вираженні (прямі витрати), іншим важко поставити долярну суму (непрямі витрати). ... Незважаючи на те, що важко визначити їх кількість, вам слід докласти зусиль, щоб додати число до них.
Наприклад, хоча Lakens та ін. пропонуємо вивчити важкодоступні зразки як фактор, який можна врахувати при виправданні альфа, здається, що все ще залишається здогадуватися, наскільки важкодоступний цей зразок, і, отже, як відповідно відкоригувати вибір альфа. Як інший приклад, мені здається складно оцінити витрати на публікацію помилково-позитивного, з точки зору того, скільки часу / грошей інші згодом взятимуть на проведення досліджень, виходячи з помилкового висновку.
Якщо визначення цього коефіцієнта витрат є значною мірою питанням суб'єктивного прийняття найкращих здогадок, я залишаюсь цікавим, чи можуть ці рішення колись (знову ж таки, поза оптимізацією чогось на зразок прибутку) бути "виправданими". Тобто таким чином, що існує поза припущень, зроблених щодо вибірки, компромісів, впливу тощо.? Таким чином, визначення співвідношення витрат помилково-позитивних / помилково-негативних помилок здається мені чимось подібним до вибору пріоритету в байєсівському висновку - рішення, яке може бути дещо суб'єктивним, впливати на результати, а тому обговорюється, - хоча я не впевнений, що це розумне порівняння.
Підсумок
Щоб зробити моє запит конкретним:
- Чи можуть помилково-позитивні / хибно-негативні ставки та їх співвідношення витрат коли-небудь "жорстко" виправдовуватися в більшості соціальних контекстів?
- Якщо так, то які узагальнюючі принципи можна було б дотримуватися для обґрунтування цих аналітичних виборів (і, можливо, приклад або два з них у дії)
- Якщо ні, чи є моя аналогія потенційної суб'єктивності у виборі співвідношення витрат - як такою, що схожа на попередній відбір Байесія - розумною?
Список літератури
Бенджамін, DJ, Бергер, Дж., Йоханнессон, М., Носек, BA, Wagenmakers, E., ... Джонсон, В. (2017, 22 липня). Перевизначення статистичної значущості. Отримано з psyarxiv.com/mky9j
Lakens, D., Adolfi, FG, Albers, CJ, Anvari, F., Apps, MA, ... Zwaan, RA (2018, 15 січня). Обґрунтуйте свою альфа. Отримано з psyarxiv.com/9s3y6