Якщо у мене є багато позитивних, незначних результатів, чи можу я перевірити "принаймні з цих результатів позитивні"?


9

Скажімо, я провів однакову регресію для 100 різних осіб окремо. Мої коефіцієнти інтересу позитивні (і зовсім відрізняються один від одного), але статистично незначні у всіх 100 результатах (давайте скажемо, кожне p-значення = 0,11).

Чи існує спосіб поєднання цих p-значень, щоб зробити висновок «щонайменше 80 з цих результатів є позитивними» з більшою значимістю, ніж p = 0,11? Мої пошуки в Інтернеті лише показали мені, як сказати «принаймні 1 з цих результатів є позитивним» за допомогою тесту Фішера або подібного тесту, але я не зміг узагальнити цей результат. Я хочу перевірити "H0 = всі 100 ефектів однакові при 0" проти "HA = принаймні 80 ефектів позитивні".

Моя мета не сказати, що в середньому є позитивний коефіцієнт, і конкретно не вимірювати коефіцієнт. Моя мета - продемонструвати, що важливо, щонайменше 80 людей стикалися з деяким позитивним ефектом, незалежно від 80, і незалежно від величини ефекту, що відчувається кожною людиною.


2
Що ви хочете сказати, "ведучи однакову регресію для 100 осіб окремо"? - це означає, що у вас є 100 наборів даних, кожен з якими має кілька спостережень за одним і тим же набором змінних відповідей та пояснювальних змінних? Не знаєте, як це працює, наприклад, якщо вам цікаво порівняти зріст та вагу людей, у вас є лише одне спостереження за кожним індивідом, тож як підходити до регресії? Чи є у вас, мабуть, часовий ряд для кожної людини - і тоді вам потрібні більш складні методи. Це буде формою поздовжнього аналізу, якщо ви шукаєте пошукові терміни.
Пітер Елліс

Відповіді:


8

Ви повинні виконати всі 100 аналізів як єдину модель змішаних ефектів із самими вашими коефіцієнтами цікавих випадкових величин. Таким чином, ви можете оцінити розподіл за тими коефіцієнтами, включаючи їх загальну середню величину, яка дасть вам таке тлумачення, як я думаю, ви шукаєте.

Зауваживши, що якщо я підозрюю, у вас є часовий ряд для кожної людини, вам також потрібно буде виправити автокореляцію залишків.


Дякую за ваш час, дуже вдячний. Якщо я можу уточнити, це часовий ряд. Скажімо, я маю дані для всіх 100 осіб протягом 5 років, а на третій рік фіктивна змінна (незалежна змінна, яка мене цікавить) змінюється на 1 одночасно для всіх 100 осіб. Мене не хвилює точний вплив цієї зміни на кожну людину, або середній ефект. Швидше, я хочу лише встановити, що постраждали щонайменше 80 людей. Коефіцієнт позитивний на всі 100, але кожен незначний. Я не впевнений, що вимірювання розподілу коефіцієнта це досягне.
користувач28239

1
Це я здогадався у вас. Я думаю, що мій рекомендований підхід є правильним. Потім ви можете використовувати модель, щоб робити передбачення або будь-яку іншу інтерпретаційну річ, яку ви хочете.
Пітер Елліс

4

Найпростіше , що потрібно зробити, ймовірно , буде тест знаком. Нульова гіпотеза полягає в тому, що кожен результат має однакову ймовірність бути позитивним чи негативним (наприклад, гортаючи справедливу монету). Ваша мета - визначити, чи спостережувані результати були б малоймовірними за цією нульовою гіпотезою, що ви можете її відхилити.

Яка ймовірність отримати 80 і більше голів із 100 обертів справедливої ​​монети? Ви можете обчислити це за допомогою біноміального розподілу. В R, викликається відповідна функція pbinom, і ви можете отримати (однобічне) p-значення, використовуючи наступний рядок коду:

pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)

Згідно з цим тестом, ваша інтуїція правильна, ви навряд чи випадково отримаєте 80 позитивних результатів, якби лікування не мало ефекту.

Тісно пов'язаним варіантом було б використовувати щось на кшталт тестування з підписанням Вілкоксоном .


Краще підхід, якщо ви на справді хочете , щоб оцінити величину ефекту (а не просто визначити , як правило , є чи може це бути більше нуля чи ні), ймовірно , буде ієрархічна ( «змішаний») модель.

Тут модель говорить про те, що результати ваших 100 осіб походять від розподілу, і ваша мета - побачити, де знаходиться середнє значення для цього розподілу (разом з інтервалами довіри).

Змішані моделі дозволяють вам сказати трохи більше про розміри ефекту: після встановлення моделі ви можете сказати щось на кшталт "ми вважаємо, що наше лікування має тенденцію до покращення результатів в середньому на три одиниці, хоча дані відповідають справжньому середньому розмір ефекту становить від 1,5 до 4,5 одиниць. Також серед осіб є певна різниця, тому дана людина може побачити ефект десь від -0,5 до +6,5 одиниць ".

Це дуже точний і корисний набір тверджень - набагато краще, ніж просто "ефект, мабуть, в середньому позитивний", саме тому такому підходу, як правило, прихильні статистики. Але якщо вам не потрібна вся ця деталь, перший підхід, який я згадав, теж може бути добре.


0

Можливо, я цілком помиляюся, але мені здається, що ви намагаєтесь зробити повторні заходи ANOVA. Просто визначте цю "манекен" як фактор всередині предмета, а модель зробить все інше. Сама значимість не дуже інформативна; це потрібно, але недостатньо; будь-яка модель отримала б вагоме значення при досить великій кількості спостережень. ви можете отримати розмір ефектів, як (частковий) Eta-Squared, щоб зрозуміти, наскільки "великий" ваш ефект. Мої 2 копійки.


0

Це може бути таким же простим, як звичайний розрахунок ANCOVA, але відповідний спосіб аналізу ваших даних залежатиме від фізичної ситуації, і ви не надали ці дані.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.