Як обчислити довірчий інтервал середнього засобу?


19

Уявіть, що ви повторите експеримент тричі. У кожному експерименті ви збираєте триразові вимірювання. Триплітники, як правило, досить близькі між собою, порівняно з відмінностями трьох експериментальних засобів. Обчислити велику середню досить просто. Але як можна обчислити довірчий інтервал для великого значення?

Приклад даних:

Експеримент 1: 34, 41, 39

Експеримент 2: 45, 51, 52

Експеримент 3: 29, 31, 35

Припустимо, що значення реплікації в експерименті відповідають гауссовому розподілу, як і середні значення кожного експерименту. Зміни SD в експерименті менше, ніж SD серед експериментальних засобів. Припустимо також, що в кожному експерименті немає упорядкування трьох значень. Порядок зліва направо від трьох значень у кожному рядку абсолютно довільний.

Простий підхід полягає в тому, щоб спочатку обчислити середнє значення кожного експерименту: 38,0, 49,3 та 31,7, а потім обчислити середнє значення та його 95% довірчий інтервал з цих трьох значень. Використовуючи цей метод, величина середньої величини становить 39,7 з довірчим інтервалом 95% від 17,4 до 61,9.

Проблема такого підходу полягає в тому, що він повністю ігнорує різницю між трійками. Цікаво, чи не існує хорошого способу обліку цієї зміни.


1
Не відповідь, просто інтуїтивне спостереження. CI для об'єднаних даних середнього значення (всі дев'ять одиниць) становить , CI на основі лише середнього рівня ( 39,7 ± 12,83 ) . Не впевнений, що робить ваш КІ (помилка? 17 не 27, а 51 не 61?), Я отримую 2,98 за std помилки з трьох засобів, і 4,30 як 0,975 квантил T dist з 2 df. Я думаю, що ІС, яку ви шукаєте, лежатиме десь між цими двома - оскільки у вас часткове об'єднання. Можна також думати з точки зору дисперсії формули V ( Y ) = E [ V ( Y)(39.7±2.13)(39.7±12.83)2.984.300.975 , кожен CI використовує половину формулиV(Y)=Е[V(Y|Yг)]+V[Е(Y|Yг)]
ймовірністьлогічного

2
@probabilityislogic: SEM трьох експериментальних засобів становить 5,168 (не 2,98, як ви писали), і довірчий інтервал, який я дав у початковій публікації (17,4 - 61,9), є правильним. SEM обчислюється з SD (8,95) шляхом ділення на квадратний корінь на n (квадратний корінь на 3). Ви натомість розділили на n (3).
Харві Мотульський

моя помилка, також слід замінити на 6.40 в об'єднаному інтервалі (така ж помилка і там)2.136.40
ймовірністьлогічний

Чи відповідає наступне посилання «це? talkstats.com/showthread.php/11554-mean-of-means

@TST, Схоже, немає нічого, окрім посилання на Вікіпедію на Об'єднаній дисперсії . Хочете допрацювати?
chl

Відповіді:


6

Існує природний точний довірчий інтервал для grandmean в збалансованої випадковому односторонній ANOVA моделі Дійсно, легко перевірити, що розподіл спостережуваних засобів ˉ y i дорівнює ˉ y i iid N ( μ , τ 2 ) при τ 2 = σ 2 b + σ 2 w

(уijмкi)iidN(мкi,σш2),j=1,,J,мкiiidN(мк,σб2),i=1,,Я.
у¯iу¯iiidN(мк,τ2)τ2=σб2+σш2JSSб
SSбJτ2χЯ-12
у¯N(мк,τ2Я)
у¯-мк1ЯSSбJ(Я-1)
тЯ-1мк

у¯i

Простий підхід полягає в тому, щоб спочатку обчислити середнє значення кожного експерименту: 38,0, 49,3 та 31,7, а потім обчислити середнє значення та його 95% довірчий інтервал з цих трьох значень. Використовуючи цей метод, величина середньої величини становить 39,7 з довірчим інтервалом 95% від 17,4 до 61,9.

правильно. І ваша інтуїція щодо ігнорованої варіації:

Проблема такого підходу полягає в тому, що він повністю ігнорує різницю між трійками. Цікаво, чи не існує хорошого способу обліку цієї зміни.

невірно. Я також зазначу правильність такого спрощення в /stats//a/72578/8402

Оновлення 12.04.2014

Зараз у моєму блозі написано деякі подробиці: Скорочення моделі для отримання інтервалів довіри .


Будь-яка допомога в реалізації цього рішення в python? stackoverflow.com/questions/45682437 / ...
Блехман

7

Це питання оцінки в рамках лінійної моделі змішаних ефектів. Проблема полягає в тому, що дисперсія великої середньої величини - це зважена сума двох компонентів дисперсії, яку необхідно окремо оцінювати (за допомогою ANOVA даних). Оцінки мають різну ступінь свободи. Отже, хоча можна спробувати побудувати довірчий інтервал для середнього за допомогою звичайних формул малої вибірки (Student t), навряд чи досягне його номінального покриття, оскільки відхилення від середнього не будуть точно слідувати розподілу Student t.

Недавня стаття Єви Яросової ( Оцінка за допомогою лінійної моделі змішаних ефектів у 2010 році) обговорює це питання. (Станом на 2015 рік він більше не доступний в Інтернеті.) У контексті "невеликого" набору даних (навіть так, приблизно втричі більший за цей) вона використовує моделювання для оцінки двох приблизних обчислень CI (колодязь -невідоме наближення Satterthwaite та "метод Кенварда-Роджера"). Її висновки включають

Симуляційне дослідження показало, що якість оцінки параметрів коваріації та, відповідно, коригування довірчих інтервалів у малих зразках може бути досить поганим .... Погана оцінка може впливати не тільки на справжній рівень довіри звичайних інтервалів, але також може зробити неможливим коригування. Очевидно, що навіть для збалансованих даних три типи інтервалів [звичайний, Satterthwaite, KR] можуть істотно відрізнятися. Коли спостерігається разюча різниця між звичайними та скоригованими інтервалами, слід перевірити стандартні похибки оцінок параметрів коваріації. З іншого боку, коли відмінності між [трьома] типами інтервалів невеликі, коригування здається непотрібним.

Коротше кажучи, здається , хороший підхід

  1. Обчисліть звичайний CI, використовуючи оцінки дисперсійних компонентів і роблячи вигляд, що застосовується розподіл t.

  2. Також обчисліть щонайменше один із скоригованих КІ.

  3. Якщо обчислення "близькі", прийміть звичайний CI. В іншому випадку повідомте, що недостатньо даних для створення надійного ІС.


Використання компонентів дисперсії призводить до того ж довірчого інтервалу, який я обчислював у початковій публікації. У таблиці ANOVA є SS між стовпцями 480,7 з 2 df, що означає, що MS становить 240,3. SD - sqrt (MSbetween / n) = sqrt (240,3 / 3) = 8,95, що призводить до того самого CI, який я спочатку розміщував (17,4 - 61,9). Мені було дуже важко слідувати документу Ярасової, який ви цитували, і я не зовсім впевнений, що це актуально тут (мабуть, йдеться про проекти повторних заходів). ???
Харві Мотульський

@Harvey Ваш опис впевнено звучить як повторні заходи для мене! Я вважаю, що папір Ярасової не вдається.
whuber

1
Я маю на увазі поширену ситуацію в лабораторіях, де трикратники - це просто три різні пробірки (або лунки). Порядок трьох, представлених у таблиці, є довільним. Немає зв'язку або кореляції між репліками №2 у першому експерименті з репліками №2 у другому чи третьому експериментах. Кожен експеримент має лише три вимірювання. Тож насправді не повторювані заходи. Правильно?
Харві Мотульський

Білий, тут є точний розподіл студентів. Дивіться мою відповідь.
Стефан Лоран

@whuber посилання, яке ви надаєте для статті Єви Ярасової, мертве, а пошук у Google нічого не дав. Чи можете ви виправити посилання?
Placidia

0

Ви не можете мати один довірчий інтервал, який вирішує обидві ваші проблеми. Ви повинні вибрати один. Ви можете вивести його із середнього квадратичного помилки в межах варіації експерименту, що дозволяє сказати щось про те, як точно ви можете оцінити значення в експерименті, або ви можете це зробити між, і це буде приблизно між експериментами. Якби я щойно зробив перший, я схильний би хотіти побудувати його навколо 0, а не навколо великої середньої величини, тому що він нічого не розповідає про фактичне середнє значення, лише про ефект (у даному випадку 0). Або ви могли просто скласти план обох і описати, що вони роблять.

У вас є ручка між одним. Для всередині це просто, як обчислити термін помилки в ANOVA, щоб змусити MSE працювати, а звідти SE для CI просто sqrt (MSE / n) (у цьому випадку n = 3).


Насправді у вас може бути достовірний інтервал для кожної середньої і для великої середини. Просто використовуйте байєсівську багаторівневу модель. Іноді такий вид оцінки називають частковим об'єднанням. Проблема полягає в невеликому зразку, я думаю.
Маноел Галдіно

У вас може бути інтервал довіри для кожного середнього і великого значення теж ... але вони різні речі ... так само, як і достовірні інтервали. Я інтерпретував це питання як те, що стосується КІ стосовно до дисперсії в межах дослідження та між як до сукупності. Це все ще залишає у вас різні речі CI, які означають різні речі. (Я також не сприймав російську буквально)
Джон

1
Крім того, те, що я мав на увазі, не може насправді "не вміє". Можна якось придумати єдине рівняння, яке обчислює один довірчий інтервал для всього. Це просто не означало б нічого розумного. Це те, що я мав на увазі не може.
Джон

Через кілька хвилин після того, як я написав свій коментар, я зрозумів, що ми не повинні приймати російську буквально. Але редагувати це було пізно =).
Маноел Галдіно

0

Я думаю, що показник CI для великої середньої величини занадто широкий [17,62] навіть для діапазону вихідних даних.

Ці експерименти ДУЖЕ поширені в хімії. Наприклад, при сертифікації довідкових матеріалів ви повинні забрати кілька пляшок з усієї партії випадковим чином, і ви повинні провести повторний аналіз на кожній пляшці. Як ви обчислюєте опорне значення та його невизначеність? Існує багато способів зробити це, але найскладнішим (і правильним, я вважаю) є мета-аналіз або ML (Dersimonian-Laird, Vangel-Rukhin тощо)

А що з оцінками завантажувальної програми?


1
Моделювання (10 000 випробувань з нормально розподіленими основними ефектами та помилками) вказує [21, 58] - симетричний двосторонній 95% ІС для середнього.
whuber

whuber: Мені було б цікаво дізнатися, як ви робили ці симуляції. Завантаження із початкових даних? Або справді симуляції? Якщо останнє, яке значення середнього та SD ви використовували для моделювання даних ??
Харві Мотульський
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.