У мене виникають певні труднощі в розумінні інтерпретації тесту 2-х зразків KS і чим він відрізняється від звичайного t-тесту між двома групами.
Скажімо, у мене чоловіки і жінки роблять якесь завдання, і я збираю кілька балів з цього завдання. Моя кінцева мета - визначити, чи виконують чоловіки та жінки по-різному в цьому завданні
Тож одне, що я міг би зробити, це запустити на тесті між двома групами. Інша річ, яку я міг би зробити, це підрахувати ECDF для чоловіків і жінок, побудувати їх та провести тест на 2 зразки KS. Я отримаю щось подібне:
Тест KS
Нульова гіпотеза тесту на KS полягає в тому, що два набори безперервного розподілу балів походять від однієї сукупності
Під час проведення тесту на KS я отримую: D = 0,18888, p-значення = 0,04742
По-перше, я хочу перевірити правильність моєї інтерпретації результатів. Тут я б відкинув нульову гіпотезу і сказав, що розподіл балів серед чоловіків та жінок походить з різних груп населення. Або іншими словами, розподіл балів чоловічої та жіночої статі відрізняється один від одного.
Більш конкретно, чоловіки, як правило, мають більшу ймовірність досягнення нижчих балів у цьому завданні, і це різниця між двома статями, як я тлумачу з сюжету
Т-тест
Тепер на тесті перевіримо різницю між чоловічими та жіночими засобами на бальній змінній.
Давайте уявимо випадок, коли в цьому завданні чоловіки є гіршими, ніж жінки. У такому випадку розподіл балів серед чоловіків буде орієнтований на низький середній показник, тоді як розподіл балів серед жінок буде зосереджено навколо високого середнього. Цей сценарій відповідав би наведеному вище сюжету, оскільки у чоловіків більша ймовірність досягнення нижчих балів
Якщо t-випробування виявиться вагомим, я б зробив висновок, що у жінок в середньому оцінка значно вище, ніж у чоловіків. Або з точки зору популяції, жінки оцінюються з населення, середнє значення якого перевищує чоловіче населення, що дуже схоже на висновок KS, що вони походять з різних груп населення.
Яка різниця?
Тож висновок, який би я зробив, і в KS, і в тестових випадках є однаковим. Самці виходять погано відносно жінок. То яка користь від використання одного тесту над іншим? Чи є якісь нові знання, які ви можете отримати, скориставшись тестом KS?
Як я це бачу, самці з розподілом, орієнтованим на низьку середню, а жінки, що центрируються навколо високої середньої, - це те, що спричиняє суттєве випробування. Але цим самим фактом у самців буде більша ймовірність забивати більш низькі значення, що призведе до того, що сюжет виглядає вище і дасть значну перевірку KS. Тож результати обох тестів мають однакову основну причину, але, можливо, можна стверджувати, що тест KS враховує більше, ніж просто засоби розподілу, а також враховує форму розподілу, але чи можна розібрати причину значущого тесту KS лише з результатів тесту?
Отже, яке значення має тест KS на тесті? І давайте припустимо, що я можу виконати припущення t тесту для цього питання