t-тест на частково парні та частково непарні дані


28

Слідчий хоче зробити комбінований аналіз декількох наборів даних. У деяких наборах даних є парні спостереження щодо лікування A і B. В інших є непарні дані A та / або B. Я шукаю посилання на адаптацію t-тесту, або на тест коефіцієнта ймовірності, для таких частково парних даних. Я готовий (поки що) вважати нормальність з однаковою відмінністю, і те, що сукупність засобів для A однакова для кожного дослідження (і аналогічно B).


2
Привіт Френку. Можливо, було б корисно зробити припущення щодо моделювання більш явними. Зазвичай, коли я думаю про парні конструкції, я думаю про одне з наступних: (i) намагання усунути фіксовані непомітні ефекти на рівні одиниці, (ii) зменшення варіабельності випадкового ефекту в експериментальних одиницях, або (iii) коригування для ненормальності відповіді, приймаючи відмінності між парами, отримуючи тим самим кращу апроксимацію. Зокрема, я не одразу бачу жодної користі у збірних парах, якщо припущення під нульове значення полягає в тому, що всі спостереження є нормальними.
кардинал

4
Кардинал, я фактично маю багато даних, які також виглядають так. Ми намагалися зібрати повністю парні дані, але через технічні проблеми або невдачу деякі вимірювання зразків під А або В іноді псуються. Два очевидних, але незадовільних рішення - це 1) викинути всі неповні пари і зробити парний t-тест, або 2) проігнорувати спарювання і зробити непарний тест для всіх даних. Я думаю, що плакат просить способу скористатись сполученням там, де він існує (з вашої причини №1 та №2), при цьому рятуючи все, що він може, від інших, неспарених точок даних.
Метт Крауз

2
Я ціную всі коментарі. Для відповідних пар піддослідних випробовували як на А, так і на В. Одним із способів використання спарювання є використання завантажувального непараметричного перцентильного інтервал довіри для різниці між засобами в А і В. Це передбачало б використання кластерної завантажувальної програми, вибірку із заміною на предметів. У суб'єкта, який не має парних даних, одне спостереження зберігатиметься або видаляється у повторному зразку, а в парних даних зберігаються або видаляються дві записи. Це, мабуть, поважає парування, але оцінку потрібно визначити, і ми не знаємо про оптимальність.
Френк Харрелл

1
Байєсівський підхід легко здійснити.
Стефан Лоран

2
Хані М. Самаві та Роберт Фогель, Журнал прикладної статистики (2013): Примітки до двох вибіркових тестів для частково корельованих (парних) даних, dx.doi.org/10.1080/02664763.2013.830285
Суреш,

Відповіді:


6

Го і Юань пропонують альтернативний метод, який називається оптимальним об'єднаним t-тестом, що випливає з об'єднаного t-тесту Samawi і Vogel.

Посилання на посилання: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.865.734&rep=rep1&type=pdf

Чудово читати з декількома варіантами для цієї ситуації.

Новий коментар, тому, будь ласка, повідомте мене, чи потрібно мені щось додати.


8

Добре, якби ви знали відхилення в парних і в парних (що, як правило, було б набагато меншим), оптимальною вагою для двох оцінок різниці у групах означає, що б ваги були обернено пропорційними дисперсії особи. оцінки різниці в засобах.

[Редагувати: виявляється, що коли оцінюються дисперсії, це називається оцінкою Graybill-Deal. Про це було досить багато паперів. Ось один]

Необхідність оцінювати дисперсію спричиняє певні труднощі (результуюче співвідношення оцінок дисперсії дорівнює F, і я думаю, що отримані ваги мають бета-розподіл, а результуюча статистика є якоюсь складною), але оскільки ви розглядаєте питання про завантаження, це може бути менше турбот.

Альтернативна можливість, яка в певному сенсі може бути приємнішою (або, принаймні, трохи більш стійкою до ненормативності, оскільки ми граємо з коефіцієнтами дисперсії) з дуже невеликою втратою ефективності в нормі, - це базувати комбіновану оцінку зсуву парні та непарні парні тести - у кожному випадку свого роду оцінка Ходжеса-Леманна, у непарному випадку засновані на медіанах парних перехресних різниць вибірки та у парному випадку від медіанів парних середніх та парних різниць. Знову ж таки, мінімальна лінійна комбінація, зважена на дисперсію, повинна бути з вагами, пропорційними зворотам дисперсій. У цьому випадку я, мабуть, схиляюся до перестановки (/ рандомізації), а не до завантажувальної стрічки - але залежно від того, як ви реалізуєте свій завантажувальний інструмент, вони можуть опинитися там же.

В будь-якому випадку ви, можливо, захочете зменшити коефіцієнт дисперсії / зменшити співвідношення. Отримати правильний м'яч для ваги добре, але ви втратите дуже низьку ефективність при нормі, зробивши його трохи міцним. ---

Деякі додаткові думки, які я раніше не досить чітко розібрав у голові:

Ця проблема має чітку схожість із проблемою Беренса-Фішера, але ще складніше.

Якби ми фіксували ваги, ми могли б просто вдаритись у наближенні типу Вельха-Саттертвайта; структура проблеми однакова.

Наше питання полягає в тому, що ми хочемо оптимізувати ваги, що фактично означає, що зважування не є фіксованим - і справді, як правило, максимізувати статистику (принаймні приблизно і більше майже у великих зразках, оскільки будь-який набір ваг є випадковою величиною, що оцінює однакову чисельник, і ми намагаємось мінімізувати знаменник; два не є незалежними).

Це, на мій погляд, погіршить наближення чі-квадрата і майже напевно вплине на df-наближення ще далі.

[Якщо ця проблема є можливою, також може виявитися хороше правило, яке б сказало, що "ви можете зробити майже так само добре, якщо ви використовуєте лише парні дані за цих наборів обставин, лише непоєднані в цих інших наборах В інших умовах ця фіксована вагова схема, як правило, дуже близька до оптимальної ", - але я не затримаю дихання, чекаючи цього шансу. Таке правило рішення, безсумнівно, мало би вплинути на справжнє значення у кожному конкретному випадку, але якби цей ефект був не таким великим, таке правило виконувало б простий спосіб для людей використовувати існуюче застаріле програмне забезпечення, тому було б бажано спробуйте визначити таке правило для користувачів у такій ситуації.]

---

Edit: Зверніть увагу на себе - потрібно повернутися і заповнити в деталях роботи на «перекриваються зразки» тести, особливо перекриваються зразки Т-тести

---

Мені здається, що тест рандомізації повинен працювати добре -

  • де дані спарені, ви випадковим чином перетворюєте мітки групи в парах

  • де дані є непарними, але передбачається, що вони мають спільний розподіл (під нулем), ви перестановите групові завдання

  • тепер ви можете базувати ваги до двох оцінок зсуву за відносними оцінками дисперсії ( w1=1/(1+v1v2)), обчисліть зважену оцінку зсуву кожної рандомізованої вибірки і подивіться, де вибірка вписується в розподіл рандомізації.


(Додано набагато пізніше)

Можливо, релевантний папір:

Derrick, B., Russ B., Toher, D., and White, P. (2017),
"Статистика тестів для порівняння засобів для двох зразків, що включають як парні, так і незалежні спостереження",
Журнал сучасних прикладних статистичних методів , травень , Вип. 16, № 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm


1
+1. У мене питання про останню частину вашої відповіді. Які оцінки дисперсії (тобто які ваги) ви б використали в тесті перестановки - фактичні, обчислені на фактичному зразку, або ви обчислили б ваги для кожної перестановки на основі даних цієї перестановки?
амеба каже, що повернеться в Моніку

@amoeba, щоб належним чином врахувати характер обчислення на основі вибірки, ви б базували його саме на цій перестановці.
Glen_b -Встановіть Моніку

@amoeba Я повинен порівняти це з деякими іншими підходами до проблеми.
Glen_b -Встановіть Моніку

1
До речі, я натрапив на цю тему, тому що хтось звернувся до мене з такими даними: два суб'єкти з парними даними плюс два суб'єкти з непарними даними (тобто 3 вимірювання в групі A, 3 вимірювання в групі B, з цих 6 значень 2+ 2 спарені, а решта - парні). У цьому випадку недостатньо даних, щоб оцінити дисперсію оцінки непарного зсуву, тому я не міг запропонувати нічого, крім ігнорування спарювання та проведення непарного тесту ... Але це, звичайно, досить екстремальна ситуація.
амеба каже, що відновіть Моніку

6

Ось кілька думок. Я в основному просто приходжу до висновку Грега Сноу, що ця проблема має чітку схожість з проблемою Беренса-Фішера . Щоб уникнути рукоділля, я спочатку ввожу деякі позначення та оформлюю гіпотези.

  • nxipAxipBi=1,,n
  • nAnBxiAi=1,,nAxiBi=1,,nB
  • кожне спостереження - це сума ефекту пацієнта та ефекту лікування. Відповідні випадкові величини є

    • XipA=Pi+TiAXipB=Pi+TiB
    • XiA=Qi+UiAXiB=Ri+ViB

    Pi,Qi,RiN(0,σP2)Tiτ,Uiτ,ViτN(μτ,σ2)τ=A,B

    • μA=μB

Xi=XipAXipBXiN(μAμB,2σ2)

XiнXiAnAXiBnB

  • XN(μAμB,2nσ2)
  • XAN(μA,1nA(σP2+σ2))
  • ХБN(мкБ,1нБ(σП2+σ2))

Наступний природний крок - це розглянути

  • Y=Х+ХА-ХБN(2(мкА-мкБ),2нσ2+(1нА+1нБ)(σП2+σ2))

σ2н-1σП2+σ2нА-1нБ-1(1нА+1нБ)(σП2+σ2)нА+нБ-2Y

На даний момент я думаю, що можна вирішити будь-яке рішення, запропоноване проблемою Берена Фішера, щоб вирішити вашу проблему.


1
Я зафіксував декілька помилок у формулах. Будь ласка, перевірте!
kjetil b halvorsen

5

Моя перша думка - це модель змішаних ефектів, але це вже обговорювалося, тому я більше не буду про це говорити.

Моя інша думка полягає в тому, що якщо теоретично можливо, ви могли б виміряти парні дані по всіх предметах, але через вартість, помилки або іншу причину у вас немає всіх пар, то ви могли б лікувати невимірний ефект для неспарених суб'єктів як відсутні дані та використовуйте такі інструменти, як алгоритм ЕМ або Множинна імпутація (відсутня навмання, здається розумною, якщо причина, за якою суб'єкт вимірювались лише за 1 обробку, не пов’язана з тим, яким буде їхній результат під час іншого лікування).

Можливо, навіть простіше просто встановити двовимірне нормальне до даних, використовуючи максимальну ймовірність (з врахуванням ймовірності, виходячи з наявних даних про кожного випробуваного), а потім зробити тест коефіцієнта ймовірності, порівнюючи розподіл із засобами, рівними проти різних засобів.

З моїх теоретичних занять минуло багато часу, тому я не знаю, як вони порівнюють по оптимальності.


1
Спасибі Грег. Я схиляюся до налаштованого максимально можливого підходу.
Френк Харрелл

4

можливо, змішане моделювання з пацієнтом, оскільки випадковий ефект може бути способом. При змішаному моделюванні кореляційна структура в парному випадку і часткові пропуски в непарному випадку можуть бути враховані.


2
Оскільки жоден набір даних, що аналізується окремо, не призведе до використання випадкових ефектів, я не бачу, чому тут корисні випадкові ефекти. Але можливо використовувати узагальнені найменші квадрати, щоб кожен суб'єкт мав власну кореляційну структуру. Непарні спостереження мали б кореляційний нуль. Варто подумати. Спасибі.
Френк Харрелл

так, ви праві, набори даних не потребують змішаного моделювання, якщо вони використовуються окремо. Але якщо ви додасте їх до одного єдиного набору даних, ви можете використовувати підхід для включення кореляції в парні дані та одночасно використовувати неспарені дані, вказавши нульову кореляцію.
psj

1
Так; моя думка полягала в тому, що змішана модель може бути надмірною, оскільки ви можете легко вказати залежну структуру кореляції, використовуючи узагальнені найменші квадрати (використовуючи, наприклад, glsфункцію R в nlme4пакеті.
Френк Харрелл

3

Один із методів, запропонованих у Hani M. Samawi & Robert Vogel (Journal of Applied Statistics, 2013), складається із зваженої комбінації T-балів від незалежних та залежних вибірок таким чином, що нова оцінка T дорівнює

То=γ(мкY-мкХSх2/нХ+Sу2/нY)+(1-γ)мкDSD2/нD

Dγγ


1
T0
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.