SD більше середньої, негативної шкали


9

Мені було надано статтю, в якій повідомлялося про дослідження, дуже схоже на те, яке я хочу провести в лабораторії. Але я помітив, що для змінної, що цікавить, Тривалість, значення SD більше, ніж середнє значення ... оскільки ця тривалість вимірюється в хвилинах, вона ніколи не може бути негативною, і це здається мені дуже дивним. Це трапилось у двох дослідженнях, поданих нижче.

Крім цього, це змішана конструкція. Контроль v Лікування (між групами) та Час1, Час2, Час3 (повторні заходи). Ось засоби (СД), N> 200

                       Time1                Time2                  Time3 
Control               15.1 (14.6)          14.4 (14.8)            13.3 (15.7)
Treatment             14.8 (13.2)          10.0 (12.2)            8.2 (9.9)

... вони запустили ANOVA і повідомили про p <.001.

Мене попросили використати це як основу для аналізу потужності для визначення розміру вибірки для нашого дослідження. Я майже впевнений, що це вказує на те, що дані є ненормальними або мають інші люди, і мені не комфортно визначати розмір вибірки на основі цього. Я просто від бази?


Ви впевнені, що це SD, а не 95% довірчі інтервали, які можуть бути схожі на 3 * SD. Схоже, ці SD приблизно такого ж розміру, як і засоби. Насправді важко сказати, що таке розмір вибірки, оскільки ми не знаємо, які ефекти були включені в ці помилки чи навіть які статистичні дані. Якби це було лише підрахунок статистики, тобто розподіл Пуассона, включене середнє значення для SD повинно бути як 1 / Sqrt (N). Однак це означає, що N = 1 (або декілька максимум). Чи можете ви надати більше інформації про те, що таке статистика?
Dave31415

Також нормальний розподіл має середнє значення і SD, які повністю незалежні один від одного. Я думаю, можливо, ви мали на увазі розподіл Пуассона.
Dave31415

2
За тривалості, яка не є негативною, я зазвичай сподіваюся на перекошений розподіл. SD, порівнянні із середнім рівнем, цілком можливі і ні в чому не дивні. Який розподіл найкраще припускати для інших обчислень, неможливо повідомити без додаткової інформації, але я не вибрав би Пуассона як свою першу здогадку, а скоріше гамму чи лонормальність.
Нік Кокс

Як зазначає @NickCox, з / тривалістю я був би здивований, якби SD не була більшою за середню (якби не було цензури). Ви також можете врахувати дистрибуцію Weibull. Аналіз потужності, ймовірно, повинен базуватися на моделюванні. З іншого боку, я б припустив, що ANOVA недійсний з такими даними.
gung - Відновіть Моніку

1
Для набору даних ннегативні числа, коефіцієнт варіації - відношення стандартного відхилення до середнього - може приймати значення великі, якО(н) з максимальним значенням, що виникає в крайньому випадку, коли всі числа є 0крім однієї (детальніше див. це питання ). Таким чином, стандартне відхилення, що перевищує середнє, не слід розглядати як винятковий випадок, що вимагає багато пояснень.
Діліп Сарват

Відповіді:


5

Стандартне відхилення легко перевищити середнє значення при негативних або строго позитивних даних

Я б описав випадок для ваших даних, оскільки стандартне відхилення близьке до середнього (не кожне значення більше, а значення, яке більше, як правило, близько). Для негативних даних це досить чітко вказує на те, що дані перекошені (наприклад, розподіл гами з коефіцієнтом варіації = 1 було б експоненціальним розподілом, тому якби дані були гамма, вони виглядали б десь поблизу експоненціальної)

Однак при такому типі розміру вибірки ANOVA може не зазнати особливого впливу на це; невизначеність в оцінці об'єднаної дисперсії буде досить невеликою, тому ми можемо вважати, що між CLT (про засоби) та теоремою Слуцького (для оцінки дисперсії на знаменник) ANOVA, ймовірно, буде працювати досить добре, оскільки ви ' У вас буде асимптотичний квадрат-хі, для якого ANOVA-F з великим знаменником-градусами свободи буде хорошим наближенням. (тобто він повинен мати розумний рівень стійкості, і оскільки засоби не так вже й далекі від постійних, потужність не повинна надто сильно впливати на гетероскедастичність)

Це означає, що якщо ваше дослідження матиме менший розмір вибірки, вам, можливо, буде краще переглянути інший тест (можливо, тест на перестановку, або інший, що підходить для перекошених даних, можливо, на основі GLM). Для зміни тесту може знадобитися дещо більший розмір вибірки, ніж ви отримаєте для прямої ANOVA.

За допомогою оригінальних даних ви могли б зробити аналіз потужності за відповідною моделлю / аналіз. Навіть за відсутності вихідних даних можна зробити більш правдоподібні припущення щодо розподілу (можливо, їх різноманітність) та дослідити всю криву потужності (або, простіше кажучи, лише коефіцієнт помилок типу I та потужність при будь-якому розмірі ефекту представляє інтерес). Можуть бути використані різноманітні обґрунтовані припущення, які дають певне уявлення про те, яка потужність може бути досягнута за правдоподібних обставин та наскільки більшим може бути розмір вибірки.


4

Ви вірно зробите висновок, що дані ненормальні. Якби дані були нормальними, ми очікували б, що приблизно 16% спостережень будуть меншими за середнє мінус стандартне відхилення. Якщо SD більше, ніж середнє, це число від’ємне, і ви заявляєте, що не може бути від’ємних чисел, тому те, що ви бачите, не узгоджується з нормально розподіленими даними. Значення SD можливі, але лише в тому випадку, якщо розподіл є дуже правильним перекосом (що є загальним для тривалості).

Я погоджуюся, що вибір розміру вибірки на основі припущення даних буде нормальним - це не дуже гарна ідея, але якщо ви можете дізнатися більше про процес і знайти правильний перекошений розподіл (гамма-розподіл як одна можливість), це розумне припущення, тоді ви можете використовувати це, щоб допомогти визначити розмір вибірки.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.