Розрахунок статистичної потужності


22

Як я це розумію, мені потрібно знати щонайменше три аспекти (із чотирьох) запропонованого нами дослідження, щоб провести аналіз потужності, а саме:

  • тип тесту - я маю намір використати r Пірсона та ANCOVA / Regression - GLM
  • рівень значущості (альфа) - я маю намір використовувати 0,05
  • очікуваний розмір ефекту - я маю намір використовувати середній розмір ефекту (0,5)
  • обсяг вибірки

Чи може хтось порекомендувати хороший онлайн-калькулятор потужності, який я можу використовувати для апріорного розрахунку потужності. (Чи може SPSS робити апріорний розрахунок потужності?)

Я натрапив на GPower, але шукаю більш простий інструмент!


На жаль, пакет SPSS не включає модуль для аналізу потужності. Компанія IBM SPSS продає окрему програму для аналізу потужності.
ttnphns

6
Я б дав шанс GPower. Ознайомившись з цим 20 або 30 хвилин, ви, мабуть, виявите це дуже керованим - принаймні для таких процедур, як кореляція, не обов'язково для складної моделі регресії.
rolando2

Спасибі! Чи є в GPower зручне керівництво?
Аджеш Джош

Схоже, це стосується заявки на отримання гранту. Це неприємності виробляти та оцінювати. Для добре використовуваних експериментальних конструкцій (наприклад, дослідження генома асоціацій) можуть бути добре задокументовані спеціалізовані калькулятори. В іншому випадку я думаю, що відповідь Г. Джея Кернса - це правильний шлях із наступним доповненням: поки ви знаходитесь у цьому, ви повинні імітувати діапазон найважливіших параметрів та представляти графік.
Лев Шальквик

Відповіді:


43

Це не відповідь, яку ви хочете почути, боюся, але я все одно скажу це: спробуйте протистояти спокусі онлайн-калькуляторів (і заощадите свої гроші перед придбанням фірмових калькуляторів).

Ось кілька причин, чому: 1) Інтернет-калькулятори використовують різні позначення і часто погано задокументовані. Це марна трата часу. 2) SPSS пропонує калькулятор потужності, але я ніколи навіть не пробував цього, оскільки це було занадто дорого, щоб дозволити собі мій відділ! 3) Фрази на зразок "середнього розміру ефекту" в кращому випадку вводять в оману, а в гіршому - просто неправильно для всіх, окрім найпростіших проектів дослідження. Занадто багато параметрів і занадто багато взаємозв'язку, щоб можна було відхилити розмір ефекту до одного числа в [0,1]. Навіть якщо ви могли б скласти це в одне число, немає гарантії, що 0,5 Коена відповідає "середньому" в контексті проблеми.

Повірте - краще в перспективі кусати кулю і навчити себе використовувати імітацію на вашу користь (і на користь того, кого ви консультуєте). Сядьте з ними і виконайте наступні дії:

1) Визначте модель, відповідну контексту проблеми (звучить так, як ви вже працювали над цією частиною).

2) Зверніться до них, щоб визначити, якими мають бути нульові параметри, поведінку контрольної групи, що б це не означало в контексті проблеми.

3) Проконсультуйтеся з ними, щоб визначити, якими мають бути параметри, щоб різниця була практично значущою . Якщо є обмеження щодо розміру вибірки, то це також слід визначити.

4) Моделюйте дані відповідно до двох моделей у 2) та 3) та запустіть свій тест. Зробити це можна за допомогою програмного забезпечення - виберіть улюблену та йдіть за цим. Подивіться, відхилили ви її чи ні.

нp^p^(1-p^)/н

Якщо ви зробите свій аналіз потужності таким чином, ви знайдете кілька речей: А) бігало набагато більше параметрів, ніж ви коли-небудь передбачали. Це змусить вас замислитись, як у світі можливо згорнути їх усіх на одне число, як-от "середнє", - і ви побачите, що це неможливо, принаймні, не прямо-таки. Б) ваша потужність буде набагато меншою, ніж рекламує багато інших калькуляторів. C) Ви можете збільшити потужність, збільшуючи розмір зразка, але стежте! Ви можете виявити, як у мене, що для того, щоб виявити різницю, яка "практично значима", вам потрібен розмір вибірки, який надмірно великий.

Якщо у вас виникли проблеми з будь-яким з перерахованих вище кроків, ви можете зібрати свої думки, добре сформулюйте питання для CrossValidated, і люди, які тут вам допоможуть.

РЕДАКТИРУЙТЕ: Якщо ви виявите, що ви абсолютно повинні користуватися онлайн-калькулятором, найкращим, який я знайшов, є сторінка " Можливість і розмір вибірки" Русса Лента . Це вже давно, у нього є відносно повна документація, це не залежить від розмірів ефекту консервованих ефектів, а також є посилання на інші документи, які є актуальними та важливими.

ІНШИЙ РЕДАКТ: Випадково, коли виникло це запитання, я опинився прямо в середині написання публікації в блозі, щоб сформулювати деякі з цих ідей (інакше я, можливо, не відповів би так швидко). У всякому разі, я закінчив це минулими вихідними, і ви можете їх знайти тут . Це не написано з урахуванням SPSS, але я б обміняв, що якщо людина розумна, вони, можливо, зможуть перекласти її частини в синтаксис SPSS.


8
+1 Гарна відповідь. Варто вказати на недоліки моделювання. (Альтернативою є те, що криві потужності можна обчислити математично.) Моделювання стає непростим, коли потрібно керувати багатьма параметрами (такими як розмір ефекту та розмір вибірки) або коли ви шукаєте якесь порогове значення, наприклад мінімальний розмір вибірки. Навіть приблизний точний вираз потужності може бути корисним для вказівки в цілому, як влада веде себе, і для визначення початкових рішень, які можна відполірувати за допомогою трохи моделювання.
whuber

2
@whuber Спасибі, і ви абсолютно праві. Ваш коментар нагадує мені, що часто існує додаткова невизначеність параметрів нуля / альт (мізерна інформація, пілотні дослідження пілотів тощо), що додає ще один рівень складності підходу до моделювання. Це ще одна перевага математичного підходу.

2
Замість фіксації значень невідомих параметрів корисно моделювати їх, призначивши попередній розподіл за цими параметрами, а потім отримати "попередню потужність" (це не баєсовський підхід, незважаючи на концепцію попереднього розподілу, оскільки ми змоделюємо результат тесту
частотизму

6
Існує дві проблеми з моделюванням: навчитися (це є рішучим) та виконати крок 3. На мій досвід, жоден з моїх клієнтів не хотів би цього зробити 3). У багатьох виникають проблеми із визначенням будь-якого розміру ефекту. Попросити їх вказати параметри у (скажімо) множині регресійного рівняння було б .... ну, вони б не знали, як відповісти, навіть якщо знають значення, вони не бажають вказувати.
Пітер Флом - Відновити Моніку

2
Стефане, так, ти маєш рацію, і саме це я мав на увазі під зайвим шаром, який я намагався спілкуватися. @ Петер зітхне ! так, я теж стикався з цим. Я намагаюся поговорити про засоби, стандартні помилки тощо, а потім відпрацьовую стільки математики, скільки можу потім. Частина його - комунікаційний бар'єр, який іноді є викликом. Хоча частина небажання ще жорсткіша. Раніше я здавався і намагався сам заповнити заготовки, але це рідко виходило добре. Тобто відповідь - це по суті постріл у темряві із зав'язаними очима та стоячи назад.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.