Я читаю Гельмана та Карліна "Поза межами обчислень потужності: Оцінка помилок типу S (знак) та типу M (величина)" (2014). Я намагаюся зрозуміти головну ідею, основний зліт, але я розгублений. Хтось може допомогти мені перегнати суть?
У статті йде щось подібне (якщо я правильно це зрозумів).
- Статистичні дослідження в психології часто зазнають невеликих зразків.
- За умови статистично значущого результату в даному дослідженні,
(1) справжній розмір ефекту, ймовірно, буде сильно завищений, і
(2) ознака ефекту може бути протилежною з великою ймовірністю - якщо тільки розмір вибірки не буде досить великим. - Вищезазначене показано, використовуючи попередню здогадку про розмір ефекту в популяції, і зазвичай цей ефект вважається невеликим.
Моя перша проблема полягає в тому, чому умова на статистично значущий результат? Чи слід відображати упередженість видання? Але це, мабуть, не так. То чому ж тоді?
Друга моя проблема - якщо я роблю дослідження самостійно, чи слід ставитися до своїх результатів інакше, ніж я звикла (я займаюсь частою статистикою, не дуже знайома з байесівською)? Наприклад, я б взяв зразок даних, оцінив модель і записав би бальну оцінку для деякого ефекту інтересу та довіри навколо нього. Чи варто мені тепер довіряти своєму результату? Або я повинен недовіряти йому, якщо він є статистично значущим? Як будь-яка задана попередня зміна цього?
Що є основним виводом (1) для "виробника" статистичних досліджень та (2) для читача прикладних статистичних робіт?
Список літератури:
- Гельман, Ендрю та Джон Карлін. "Поза межами обчислень потужності: Оцінка помилок типу S (знак) та типу M (величина)." Перспективи психологічної науки 9.6 (2014): 641-651.
PS Я думаю, що для мене новим елементом є включення попередньої інформації, до якої я не впевнений, як ставитися (виходячи з парадигми частолістів).