Я залишаю цей параграф для коментарів, щоб мати сенс: Мабуть, припущення про нормальність у вихідних сукупностях є занадто обмежуючим, і його можна пропустити, зосередившись на розподілі вибірки, завдяки центральній граничній теоремі, особливо для великих зразків.
Застосування тесту, ймовірно, є хорошою ідеєю, якщо (як це зазвичай буває) ви не знаєте дисперсії сукупності, а замість цього використовуєте вибіркові дисперсії в якості оцінювачів. Слід зазначити , що припущення про однакових відхиленнях може знадобитися тестування з тестом F дисперсій або тестом Lavene перед нанесенням об'єднаної дисперсії - У мене є кілька заміток на GitHub тут .т
Як ви згадували, t-розподіл збігається до нормального розподілу в міру збільшення вибірки, оскільки цей швидкий R-графік демонструє:
Червоним кольором є pdf звичайного розповсюдження, а фіолетовим кольором можна побачити прогресивну зміну "жирових хвостів" (або більш важких хвостів) pdf розподілу міру збільшення ступенів свободи, поки остаточно не змішаться з нормальний сюжет.т
Таким чином, застосувати z-тест, ймовірно, буде добре для великих зразків.
Вирішення питань з моєю початковою відповіддю. Дякую, Glen_b за допомогу в роботі з ОП (ймовірні нові помилки в інтерпретації - цілком мої).
- СТАТИСТИЧНІ ПОСЛІДКИ ПРИ РАЗПРЕДЕЛЕННІ ЗА ПЕРЕДБАЧЕННЯМ НОРМАЛЬНОСТІ:
Не залишаючи складностей у формулах для одного зразка проти двох зразків (парних і непарних), загальна t статистика, орієнтована на випадок порівняння вибіркової середньої середньої сукупності :
t-тест = X¯- мксн√= X¯- мкσ/ н√с2σ2---√= X¯- мкσ/ н--√∑нх = 1( X- X¯)2n - 1σ2--------√(1)
Якщо слід за нормальним розподілом із середнім та дисперсією :μ σ 2Хмкσ2
- Чисельник .∼ N ( 1 , 0 )( 1 ) ∼ N( 1 , 0 )
- Знаменником буде квадратний корінь (масштабований chi квадрат), оскільки як похідне тут .s 2 / σ 2(1)s2/σ2n−1∼1n−1χ2n−1(n−1)s2/σ2∼χ2n−1
- Чисельник і знаменник повинні бути незалежними.
За цими умовами .t-statistic∼t(df=n−1)
- ЦЕНТРАЛЬНА ОГРАНІЧНА ТЕОРЕМА:
Тенденція до нормальності розподілу вибірки для вибірки означає, що розмір вибірки збільшується, може обґрунтувати припущення про нормальний розподіл чисельника, навіть якщо сукупність не є нормальною. Однак це не впливає на дві інші умови (розподіл чи знаменника квадратів чи та незалежність чисельника від знаменника).
Але не все втрачено, в цій публікації обговорюється, як теорема Слуцького підтримує асимптотичну конвергенцію до нормального розподілу, навіть якщо розподіл чи в знаменнику не дотримано.
- РОБОЧІСТЬ:
На статті "Більш реалістичний погляд на властивості помилок надійності та типу II тесту на тест до відхилення від нормальності населення" Савіловського С.С. і Блера РК у " Психологічному віснику", 1992, т. 111, № 2, 352-360 , де вони перевіряли менш ідеальні чи більш "реальні" (менш нормальні) розподіли за потужністю та помилками I типу, можна знайти такі твердження: "Незважаючи на консервативний характер щодо типу Я помилка t-тесту для деяких із цих реальних розподілів, мало вплинуло на рівні потужності для різноманітних обробних умов та розмірів зразків, які вивчалися. Дослідники можуть легко компенсувати невеликі втрати потужності, вибравши трохи більший розмір зразка " .
" Здається, що переважає думка, що t-тест незалежних зразків є досить надійним, якщо стосується помилок типу I, до форми популяції, що не є Гауссом, до тих пір, поки (a) розміри вибірки рівні або майже такі, (b) вибірка розміри досить великі (Boneau, 1960, згадує розміри вибірки від 25 до 30), і (c) тести є двохвостими, а не однохвостими. Зауважте також, що при дотриманні цих умов різниці між номінальною альфаю і фактичною альфа виникають, розбіжності, як правило, мають більш консервативний характер, ніж ліберальний характер ".
Автори наголошують на суперечливих аспектах теми, і я з нетерпінням чекаю роботи над деякими моделюваннями, заснованими на лонормальному розподілі, як згадував професор Гаррелл. Я також хотів би придумати декілька порівнянь Монте-Карло з непараметричними методами (наприклад, тест Манна – Вітні U). Тож це незавершена робота ...
МОДЕЛЮВАННЯ:
Відмова від відповідальності: Далі йде одна з цих вправ «доказувати себе» так чи інакше. Результати не можуть бути використані для узагальнення (принаймні, не мною), але, мабуть, можу сказати, що ці два (ймовірно, хибні) симуляції МС не здаються занадто обескуражуючими щодо використання тесту t в обставинах описано.
Помилка I типу:
У питанні помилок типу I я запустив моделювання Монте-Карло, використовуючи розподіл Lognormal. Витягуючи те, що вважалося б більшими зразками ( ) багато разів з лонормального розподілу з параметрами і , я обчислював значення t і p-значення, які були б результатом, якщо ми порівнювали б кошти цих зразків, усі вони походять від однієї і тієї ж сукупності, і всі однакового розміру. Логоритм був обраний виходячи з коментарів та поміченої косості розподілу праворуч:n=50μ=0σ=1
Встановивши рівень значущості фактичний показник помилок типу I становив би , не дуже погано ...5%4.5%
Насправді графік щільності отриманих t-тестів, здавалося, перекривав фактичний pdf t-розподілу:
Найцікавішою була дивлячись на «знаменник» тесту t, на частину, яка мала слідувати розподілу чи-квадрата:
(n−1)s2/σ2=98(49(SD2A+SD2A))/98(eσ2−1)e2μ+σ2
.
Тут ми використовуємо загальне стандартне відхилення, як у цій статті у Вікіпедії :
SX1X2=(n1−1)S2X1+(n2−1)S2X2n1+n2−2−−−−−−−−−−−−−−−−−−−−−−√
І дивно (чи ні) сюжет був надзвичайно несхожим на накладений PDF-файл із чи-квадратом:
Помилка та потужність II типу:
Розподіл артеріального тиску можна логнормального , який приходить дуже зручно , щоб створити синтетичний сценарій , в якому група порівняння роздільність в середніх значеннях на відстані клінічної значущості, наприклад , в клінічному дослідженні тестування ефекту кров'яного тиску Орієнтація препарату на діастолічний АД, вагомим ефектом можна вважати середнє падіння на мм рт.ст. ( обрано СД приблизно мм рт.ст.):9109
Виконуючи порівняльні t-тести на інакше подібному моделюванні Монте-Карло, як і для помилок типу I між цими вигаданими групами, і з рівнем значущості ми отримуємо помилки типу II та потужність лише .0,024 % 99 %5%0.024%99%
Код тут .