Статистичні тести, що містять невизначеність вимірювання


11

Припустимо, мені дано дві групи вимірювань маси (у мг), які називаються y1 та y2. Я хочу зробити тест, щоб визначити, чи брали два зразки з популяцій різними способами. Щось подібне, наприклад (в R):

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

Я отримую p-значення 0,3234, і при рівні значущості 0,05 не відкидайте нульову гіпотезу про те, що дві групи виведені з популяцій з однаковим середнім значенням. Тепер мені дано невизначеність для кожного вимірювання:

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

де u1 [1] - комбінована стандартна невизначеність при вимірюванні y1 [1] (і так далі). Як я включаю ці невизначеності до статистичного тесту?


Це парні вимірювання чи ні? (Я припускаю, що це не так.) Невизначеності можуть бути використані для отримання ваг, які могли б покращити ваш висновок, але розбіжність у невизначеностях досить мала, тому виграшів не буде багато, навіть якщо невизначеності є точними.
Glen_b -Встановіть Моніку

Це підмножина реальних непарних даних. Приклад насамперед мав на меті з’ясувати питання. Те, що я насправді шукаю, - це загальні вказівки щодо того, як найкраще включити вимірювальну невизначеність у тест гіпотези (як на тесті). Мені здається, ми витрачаємо багато цінної інформації, якщо не використовуємо невизначеності вимірювань, але я не зміг знайти чітких рекомендацій з цього приводу в літературі.
Том

Для повного їх використання потрібно включити їх до ймовірнісної моделі спостережень; що насправді являють вимірювання невизначеності ? (Ви не можете помахати рукою, тому будьте обережні.)
Glen_b -Встановіть Моніку

Відповіді:


1

Здається, ви хочете провести зважений аналіз. Дивіться "Приклад зваженої статистики" в розділі "Концепції" документації SAS.


Отже, ми просто робимо t-тест із зваженими засобами та зваженими стандартними відхиленнями, де u1 та u1 - ваги?
Том

Так. Ви можете припустити, що дисперсія i-го спостереження - Var / w_i, де w_i - вага для i-го спостереження, а Var> 0.
Рік

1

Чому б не змоделювати його? Тобто, додайте у свою непевність як реалізацію шуму до кожного спостереження. Потім повторіть тест гіпотези. Зробіть це приблизно 1000 разів і подивіться, скільки разів нульове значення було відхилено. Вам потрібно буде вибрати розподіл для шуму. Звичайне здається одним із варіантів, але це може призвести до негативних спостережень, що не реально.


1

Ви можете перетворити це на проблему регресії і використовувати невизначеності як ваги. Тобто передбачити групу (1 або 2?) Від вимірювання в регресії.

Але

Невизначеності приблизно постійні, тому, мабуть, нічого особливого не зміниться, використовуючи їх.

У вас легкий показник на 10,5, що ускладнює питання, зменшуючи різницю між засобами. Але якщо ви можете повірити невизначеності, ця цінність є не більш підозрілою, ніж будь-які інші.

Т-тест не знає, що ваша альтернативна гіпотеза полягає в тому, що два зразки беруть з різних популяцій. Все, що вона знає, - це порівняння засобів під певними припущеннями. Ранкові тести є альтернативою, але якщо ви зацікавлені в цих даних як вимірювання, вони не здаються кращими для ваших цілей.


Точка взята. Я змінив питання, щоб висловити його з точки зору засобів.
Том

0

У звичайних найменших квадратах (наприклад, lm (y ~ x)) ви дозволяєте змінювати (невизначеність) навколо значень y, задаючи значення x. Якщо повернути регресію навколо (lm (x ~)), ви мінімізуєте помилки навколо x. В обох випадках помилки вважаються досить однорідними.

Якщо ви знаєте величину дисперсії навколо кожного спостереження за вашою змінною відповіді, і ця дисперсія не є постійною при впорядкуванні x, ви хочете використовувати найменш зважені квадрати. Можна зважити значення y за коефіцієнтами 1 / (дисперсія).

У випадку, коли ви стурбовані тим, що і x, і y мають невизначеність і що невизначеність неоднакова між двома, ви не хочете просто мінімізувати залишки (невизначеність адреси) перпендикулярно до однієї з осей. В ідеалі ви б мінімізували невизначеність, яка перпендикулярна встановленій лінії тренду. Для цього можна скористатися регресією PCA (також відомою як ортогональна регресія, або загалом найменші квадрати. Є пакети R для регресії PCA , і раніше на цій веб-сайті були публікації на цю тему , які також були обговорені в іншому місці Крім того, я думаю (тобто я можу помилятися ...) ви все одно можете зробити зважену версію цього регресу, використовуючи свої знання про відхилення.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.