Тест Колмогорова – Смірнова проти t-тесту

У мене виникають певні труднощі в розумінні інтерпретації тесту 2-х зразків KS і чим він відрізняється від звичайного t-тесту між двома групами.

Скажімо, у мене чоловіки і жінки роблять якесь завдання, і я збираю кілька балів з цього завдання. Моя кінцева мета - визначити, чи виконують чоловіки та жінки по-різному в цьому завданні

Тож одне, що я міг би зробити, це запустити на тесті між двома групами. Інша річ, яку я міг би зробити, це підрахувати ECDF для чоловіків і жінок, побудувати їх та провести тест на 2 зразки KS. Я отримаю щось подібне:

Тест KS

Нульова гіпотеза тесту на KS полягає в тому, що два набори безперервного розподілу балів походять від однієї сукупності

Під час проведення тесту на KS я отримую: D = 0,18888, p-значення = 0,04742

По-перше, я хочу перевірити правильність моєї інтерпретації результатів. Тут я б відкинув нульову гіпотезу і сказав, що розподіл балів серед чоловіків та жінок походить з різних груп населення. Або іншими словами, розподіл балів чоловічої та жіночої статі відрізняється один від одного.

Більш конкретно, чоловіки, як правило, мають більшу ймовірність досягнення нижчих балів у цьому завданні, і це різниця між двома статями, як я тлумачу з сюжету

Т-тест

Тепер на тесті перевіримо різницю між чоловічими та жіночими засобами на бальній змінній.

Давайте уявимо випадок, коли в цьому завданні чоловіки є гіршими, ніж жінки. У такому випадку розподіл балів серед чоловіків буде орієнтований на низький середній показник, тоді як розподіл балів серед жінок буде зосереджено навколо високого середнього. Цей сценарій відповідав би наведеному вище сюжету, оскільки у чоловіків більша ймовірність досягнення нижчих балів

Якщо t-випробування виявиться вагомим, я б зробив висновок, що у жінок в середньому оцінка значно вище, ніж у чоловіків. Або з точки зору популяції, жінки оцінюються з населення, середнє значення якого перевищує чоловіче населення, що дуже схоже на висновок KS, що вони походять з різних груп населення.

Яка різниця?

Тож висновок, який би я зробив, і в KS, і в тестових випадках є однаковим. Самці виходять погано відносно жінок. То яка користь від використання одного тесту над іншим? Чи є якісь нові знання, які ви можете отримати, скориставшись тестом KS?

Як я це бачу, самці з розподілом, орієнтованим на низьку середню, а жінки, що центрируються навколо високої середньої, - це те, що спричиняє суттєве випробування. Але цим самим фактом у самців буде більша ймовірність забивати більш низькі значення, що призведе до того, що сюжет виглядає вище і дасть значну перевірку KS. Тож результати обох тестів мають однакову основну причину, але, можливо, можна стверджувати, що тест KS враховує більше, ніж просто засоби розподілу, а також враховує форму розподілу, але чи можна розібрати причину значущого тесту KS лише з результатів тесту?

Отже, яке значення має тест KS на тесті? І давайте припустимо, що я можу виконати припущення t тесту для цього питання

— Саймон
джерело

Класичний t-тест значною мірою поступається байєсівському аналізу даних, перегляньте "Байєсівська оцінка Дж. Крушке замінює тест t" indiana.edu/~kruschke/BEST/BEST.pdf

— Владислав Довгалеч

Я не впевнений, як тест на KS стосується методів Байєса ...?

— Саймон

Просто перестаньте використовувати KS та t-test

— Владислав Довгалець

@xeon Якщо ви збираєтесь робити такі наполегливі заяви, вам краще їх підтримати. Ваша порада буде не корисною, коли ви знайдете різницю в прикладі моєї відповіді. Чому варто відмовитися від підходу, який чітко працює при виявленні цієї різниці в розподілах на користь того, який не має?

— Glen_b -Встановити Моніку

@Glen_b Ось чому написав коментар, а не відповідь. Можливо, ОП не прочитав статтю, яка є великою BTW; Я просто хотів це запропонувати. Але я згоден, що я зробив занадто сильну заяву і трохи поводився сноб. Прошу вибачення за те, що я був трохи грубим. Більше не станеться

— Владислав Довгалеч

Як приклад, чому ви хочете використовувати два зразка тесту Колмогорова-Смірнова:

Уявіть, що популяційні засоби були подібними, але відхилення були дуже різними. Тест Колмогорова-Смірнова міг би змінити цю різницю, але t-тест не може.

Або уявіть, що розподіли мають подібні засоби та sd, але самці мають бімодальний розподіл (червоний), тоді як жінки (сині) не:

Діють чоловіки та жінки по-різному? Так - самці, як правило, набирають десь 7,5-8 або 12,5-13, тоді як жінки частіше забивають більше до середини (близько 10 або більше), але набагато менше кластеризовано щодо цього значення, ніж два значення чоловіки, як правило, забивають близько до.

Тож Колмогоров-Смірнов може знайти набагато більш загальні види різниці в розподілі, ніж тест-тест.

— Glen_b -Встановити Моніку
джерело

Ах, має сенс. Чи можу я розширити цю логіку і сказати, що якщо t-тест є значущим, тест KS також буде, ймовірно, значущим, однак це може бути пов'язано із середньою різницею та / або будь-якою іншою різницею в розподілі, таким чином роблячи інтерпретацію KS тест складний? Тож тест на KS справді корисний лише в тому випадку, якщо середньої групи немає різниці?

— Саймон

T-тест більш чутливий до середніх відмінностей (особливо, якщо розподіли популяцій близькі до нормальних із аналогічним стандартним відхиленням). Тест на KS може бути важче інтерпретувати, але я не погодився би з вашим останнім реченням. Ви могли мати невелику різницю в засобах, що супроводжуються іншими відмінностями; t-тест має лише різницю в засобах його інформування, тоді як тест KS може бути інформований за іншими видами відмінностей. Уявіть наведений вище приклад, але там, де також є невеликі зрушення в засобах; t-тест може не набрати різницю так легко, як тест KS.

— Glen_b -Встановити Моніку

@Glen_b: чи правильно сказати, що KS перевіряє, чи розподіли рівні, тоді як t-test тести, чи розподіли мають однакове значення?

@fcop Так і ні; зважаючи на припущення, і під нулем звичайний t-тест з рівною дисперсією насправді також перевіряє ідентичність розподілів - саме спільність альтернативи (у поєднанні з припущеннями) насправді робить їх різними. Звичайно, ми можемо (і як правило) використовувати тести, коли їхні припущення не зовсім застосовні, і тоді ми більше дивимось на їх поведінку під нульове та альтернативне; t-тест буде, як правило, чутливим до зміни середнього рівня в альтернативному варіанті, тоді як KS дещо чутливий до дуже широкого класу альтернатив.

— Glen_b -Встановити Моніку