Якщо я правильно обчислив, логістична регресія асимптотично має ту саму потужність, що і t-тест. Щоб побачити це, запишіть її ймовірність журналу та обчисліть очікування його Гессіана на його глобальному максимумі (його негативні оцінки матриці дисперсії та коваріації рішення ML). Не турбуйтеся зі звичайною логістичною параметризацією: простіше просто параметризувати її за допомогою двох імовірностей. Деталі залежатимуть від того, як саме ви перевірите значення коефіцієнта логістичної регресії (існує кілька методів).
Те, що ці тести мають подібні потужності, не повинно бути занадто дивним, оскільки теорія хі-квадрата для оцінок ML заснована на нормальному наближенні до ймовірності журналу, а t-тест базується на нормальному наближенні до розподілів пропорцій. Суть у тому, що обидва методи роблять однакові оцінки двох пропорцій, і обидві оцінки мають однакові стандартні помилки.
Фактичний аналіз може бути більш переконливим. Візьмемо загальну термінологію для значень у певній групі (А або В):
- p - ймовірність a 1.
- н - розмір кожного набору малюнків.
- м - кількість наборів малюнків.
- N= m n - кількість даних.
- 0 1 j th i thкi j (дорівнює або ) - це значення результату у наборі набору малюнків.01jгоiго
- i thкi - загальна кількість одиниць у наборі малюнків.iго
- к - загальна кількість одиниць.
Логістична регресія - це, по суті, Оцінювач ML з . Його логарифм поданоp
журнал( L ) = k журнал( p ) + ( N- к ) журнал( 1 - р ) .
Його похідні щодо параметра єp
∂журнал( L )∂p= kp- N- к1 - с і
- ∂2журнал( L )∂p2= kp2+ N- к( 1 - р )2.
Встановлення першого до нуля дає оцінку ML і підключення цього до зворотного другого виразу дає дисперсію , що є квадратом стандартної помилки. р (1 - р )/Нp^= k / Np^( 1 - с^) / N
Т статистика буде отримана з оцінок , заснованих на даних , згрупованих наборами дро; а саме як різниця засобів (один із групи А, а інший із групи В) ділиться на стандартну похибку цієї різниці, яку отримують із стандартних відхилень засобів. Давайте тоді розглянемо середнє та стандартне відхилення для даної групи. Середнє значення дорівнює , що ідентично оцінювачу ML . Розглянуте стандартне відхилення - це стандартне відхилення засобів тяги; тобто це стандартне відхилення множини . Тут суть справи, тому давайте вивчимо деякі можливості.р до я / пк / нp^кi/ н
Припустимо , що дані не згруповані в дро взагалі: тобто, і . є нічиїми кошти. Їх вибіркова дисперсія дорівнює разів . З цього випливає, що стандартна помилка ідентична стандартній помилці ML, крім фактора , який по суті є коли . Тому - окрім цієї крихітної різниці - будь-які тести, засновані на логістичній регресії, будуть такими ж, як t-тест, і ми досягнемо по суті тієї ж потужності.м = N K I N / ( N - 1 ) р ( 1 - р ) √n = 1m = NкiN/ (N- 1 )p^( 1 - с^) 1N=1800N/ (N- 1 )---------√1N= 1800 рік
Коли дані групуються, (справжня) дисперсія дорівнює оскільки статистика являє собою суму змінних Бернуллі ( ), кожна з дисперсією . Тому очікувана стандартна похибка середнього значення цих значень є квадратним коренем , як і раніше.p ( 1 - p ) / n k i n p p ( 1 - p ) m p ( 1 - p ) / n / m = p ( 1 - p ) / Nкi/ нp ( 1 - p ) / nкiнpp ( 1 - p )мp ( 1 - p ) / n / m = p ( 1 - p ) / N
Число 2 вказує, що потужність тесту не повинна помітно відрізнятися від розподілу нічиїх (тобто від того, як змінюються і залежно від ), крім, можливо, від досить малого ефекту від коригування дисперсії вибірки (якщо ви не були такими нерозумними, щоб використовувати надзвичайно мало наборів розіграшів у кожній групі).n m n = Nмнm n = N
Обмежене моделювання для порівняння до (з 10 000 ітерацій за штуку), що включає (по суті логістична регресія); ; і (максимізація коригування дисперсії вибірки) це випливає: потужність (при , однобічна) у перших двох випадках становить 0,59, тоді як у третьому, де коефіцієнт коригування становить a зміна матеріалу (зараз є лише два ступені свободи замість 1798 чи 58), вона знижується до 0,36. Ще один тест, порівнюючи доp = 0,74 m = 900 , n = 1 m = n = 30 m = 2 , n = 450 α = 0,05 p = 0,50 p = 0,52р = 0,70р = 0,74m = 900 , n = 1m=n=30m=2,n=450α=0.05p=0.50p=0.52 дає потужності відповідно 0,22, 0,21 та 0,15: знову ж таки, ми спостерігаємо лише незначне падіння від не групування до розіграшів (= логістичний регрес) до згрупування в 30 груп і істотного падіння лише до двох груп.
Моралі цього аналізу:
- Ви не втрачаєте багато, розділяючи свої даних на велику кількість відносно невеликих груп "малюнків".мNm
- Ви можете втратити помітну потужність, використовуючи невелику кількість груп ( невелика, - кількість даних на групу - велика).нmn
- Вам найкраще взагалі не групувати свої даних у "малюнки". Просто проаналізуйте їх як є (використовуючи будь-який розумний тест, включаючи логістичну регресію та t-тестування).N