Добре, якби ви знали відхилення в парних і в парних (що, як правило, було б набагато меншим), оптимальною вагою для двох оцінок різниці у групах означає, що б ваги були обернено пропорційними дисперсії особи. оцінки різниці в засобах.
[Редагувати: виявляється, що коли оцінюються дисперсії, це називається оцінкою Graybill-Deal. Про це було досить багато паперів. Ось один]
Необхідність оцінювати дисперсію спричиняє певні труднощі (результуюче співвідношення оцінок дисперсії дорівнює F, і я думаю, що отримані ваги мають бета-розподіл, а результуюча статистика є якоюсь складною), але оскільки ви розглядаєте питання про завантаження, це може бути менше турбот.
Альтернативна можливість, яка в певному сенсі може бути приємнішою (або, принаймні, трохи більш стійкою до ненормативності, оскільки ми граємо з коефіцієнтами дисперсії) з дуже невеликою втратою ефективності в нормі, - це базувати комбіновану оцінку зсуву парні та непарні парні тести - у кожному випадку свого роду оцінка Ходжеса-Леманна, у непарному випадку засновані на медіанах парних перехресних різниць вибірки та у парному випадку від медіанів парних середніх та парних різниць. Знову ж таки, мінімальна лінійна комбінація, зважена на дисперсію, повинна бути з вагами, пропорційними зворотам дисперсій. У цьому випадку я, мабуть, схиляюся до перестановки (/ рандомізації), а не до завантажувальної стрічки - але залежно від того, як ви реалізуєте свій завантажувальний інструмент, вони можуть опинитися там же.
В будь-якому випадку ви, можливо, захочете зменшити коефіцієнт дисперсії / зменшити співвідношення. Отримати правильний м'яч для ваги добре, але ви втратите дуже низьку ефективність при нормі, зробивши його трохи міцним. ---
Деякі додаткові думки, які я раніше не досить чітко розібрав у голові:
Ця проблема має чітку схожість із проблемою Беренса-Фішера, але ще складніше.
Якби ми фіксували ваги, ми могли б просто вдаритись у наближенні типу Вельха-Саттертвайта; структура проблеми однакова.
Наше питання полягає в тому, що ми хочемо оптимізувати ваги, що фактично означає, що зважування не є фіксованим - і справді, як правило, максимізувати статистику (принаймні приблизно і більше майже у великих зразках, оскільки будь-який набір ваг є випадковою величиною, що оцінює однакову чисельник, і ми намагаємось мінімізувати знаменник; два не є незалежними).
Це, на мій погляд, погіршить наближення чі-квадрата і майже напевно вплине на df-наближення ще далі.
[Якщо ця проблема є можливою, також може виявитися хороше правило, яке б сказало, що "ви можете зробити майже так само добре, якщо ви використовуєте лише парні дані за цих наборів обставин, лише непоєднані в цих інших наборах В інших умовах ця фіксована вагова схема, як правило, дуже близька до оптимальної ", - але я не затримаю дихання, чекаючи цього шансу. Таке правило рішення, безсумнівно, мало би вплинути на справжнє значення у кожному конкретному випадку, але якби цей ефект був не таким великим, таке правило виконувало б простий спосіб для людей використовувати існуюче застаріле програмне забезпечення, тому було б бажано спробуйте визначити таке правило для користувачів у такій ситуації.]
---
Edit: Зверніть увагу на себе - потрібно повернутися і заповнити в деталях роботи на «перекриваються зразки» тести, особливо перекриваються зразки Т-тести
---
Мені здається, що тест рандомізації повинен працювати добре -
де дані спарені, ви випадковим чином перетворюєте мітки групи в парах
де дані є непарними, але передбачається, що вони мають спільний розподіл (під нулем), ви перестановите групові завдання
тепер ви можете базувати ваги до двох оцінок зсуву за відносними оцінками дисперсії ( w1=1/(1+v1v2)), обчисліть зважену оцінку зсуву кожної рандомізованої вибірки і подивіться, де вибірка вписується в розподіл рандомізації.
(Додано набагато пізніше)
Можливо, релевантний папір:
Derrick, B., Russ B., Toher, D., and White, P. (2017),
"Статистика тестів для порівняння засобів для двох зразків, що включають як парні, так і незалежні спостереження",
Журнал сучасних прикладних статистичних методів , травень , Вип. 16, № 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm