Як перевірити нормальний розподіл за допомогою Excel для проведення t-тесту?


21

Я хочу знати, як перевірити набір даних на нормальність в Excel, просто щоб переконатися, що вимоги щодо використання t-тесту виконуються .

Для правильного хвоста, чи доцільно просто обчислити середнє та стандартне відхилення, додайте 1, 2 та 3 стандартних відхилення від середнього, щоб створити діапазон, а потім порівняйте його з нормальним 68/95 / 99,7 для стандартного нормального розподілу після використання функція norm.dist в excel для перевірки кожного значення стандартного відхилення.

Або є кращий спосіб перевірити на нормальність?


Відповіді:


15

Ви маєте правильну ідею. Це можна зробити систематично, всебічно і порівняно з простими розрахунками. Графік результатів називається звичайним графіком ймовірності (або іноді графіком ПП). З нього ви можете побачити набагато більше деталей, ніж це показано в інших графічних зображеннях, особливо в гістограмах , і з невеликою практикою ви навіть можете навчитися визначати способи повторного вираження своїх даних, щоб наблизити їх до Нормального в ситуаціях, коли це є виправданим.

Ось приклад:

Електронна таблиця з графіком ймовірності

Дані містяться у стовпці A(та названі Data). Решта - це всі розрахунки, хоча ви можете керувати значенням "шарнірного рангу", яке використовується для пристосування опорної лінії до графіку.

Цей графік являє собою розсіювач, який порівнює дані зі значеннями, які були б отримані числами, отриманими незалежно від стандартного нормального розподілу. Коли точки вирівнюються вздовж діагоналі, вони близькі до Нормального; горизонтальні відхилення (вздовж осі даних) означають відхилення від нормальності. У цьому прикладі точки надзвичайно близькі до опорної лінії; найбільший відхід відбувається за найвищою величиною, яка становить близько 1.5 одиниці зліва від лінії. Таким чином, ми з першого погляду бачимо, що ці дані дуже близькі до нормально розподілених, але, можливо, мають трохи "легкий" правий хвіст. Це абсолютно добре для застосування t-тесту.

Значення порівняння по вертикальній осі обчислюються в два етапи. Спочатку кожне значення даних ранжирується від 1 до н , кількість даних (відображається в Countполі в комірці F2). Вони пропорційно перетворюються на значення в діапазоні від 0 до 1 . Гарна формула для використання є (rank1/6)/(n+2/3). (Див. Http://www.quantdec.com/envstats/notes/class_02/characterizing_distributions.htm, звідки це походить.) Потім вони перетворюються на стандартні нормальні значення черезNormSInvфункція. Ці значення відображаються у Normal scoreстовпці. Сюжет праворуч - це XY розсіювач даних Normal Scoreпроти даних. (У деяких посиланнях ви побачите транспозицію цього сюжету, що, можливо, є більш природним, але Excel вважає за краще розміщувати крайній лівий стовпчик на горизонтальній осі та крайній правий стовпчик на вертикальній осі, тому я дав йому змогу робити те, що йому зручно. )

Електронна таблиця: нормальний розрахунок балів

(Як ви можете бачити, я моделюється ці дані з незалежних випадковим черпає з нормального розподілу із середнім 5 і стандартним відхиленням 2 . Тому не дивно , що ймовірність сюжет виглядає так красиво.) Там на самому ділі тільки дві формула для введення, який ви поширюєте вниз, щоб відповідати даним: вони з'являються в клітинках B2:C2і покладаються на Countзначення, обчислене в комірціF2 . Це дійсно все, крім сюжету.

Решта цього аркуша не потрібна, але це корисно для судження про сюжет: він забезпечує надійну оцінку еталонної лінії. Це робиться шляхом вибору двох точок однаково далеко ліворуч та праворуч від ділянки та з'єднання їх лінією. У прикладі ці точки третій найнижчий і третє місце, як визначено 3 в Hinge Rankклітці, F3. Як бонус, його нахил та перехоплення є надійними оцінками стандартного відхилення та середнього значення даних відповідно.

Для побудови еталонної лінії обчислюються і додаються до графіка дві крайні точки: їх обчислення відбувається в стовпцях I:J, позначених позначками Xта Y.

Електронна таблиця: розрахунок опорної лінії


Для формул у стовпці B ви б пояснили причину додавання 1 та ділення на 6 і 3 ("+ 1/6" та "+ 1/3")? Також є причина, яку ви вирішили розділити на 6 у клітинці Hinge Rank?

1/6100×1/6100×5/601/21/40,16

Формула (ранг + 1/6) / (n + 1/3) не здається симетричною, як ми могли б передбачити. наприклад, із середнім спостереженням 3 ранг становить 2, і це дозволило б запропонувати відповідний перцентил 0,65, а не те, що, здавалося б, природним було взяти для середнього спостереження (0,5). Я пропустив щось очевидне? [Я бачив, як Тукі використовує кілька різних формул у різних місцях, включаючи (i-1/3) / (n + 1/3). Формула на вашому посиланні вписується у загальну схему (ia) / (n + 1-2a), але формула, яку ви даєте у своїй відповіді, не відповідає]
Glen_b -Встановіть Моніку

r-ан+1-2а
r1на011/6(r-1/6)/(н+2/3)а=1/3
whuber

5

Ви можете побудувати гістограму, використовуючи пакет інструментів аналізу даних в Excel . Графічні підходи, швидше за все, повідомляють ступінь ненормативності, що, як правило, більш актуально для тестування припущення (див. Це обговорення нормальності ).

Пакет інструментів для аналізу даних в Excel також надасть вам косості та куртозу, якщо ви попросите описову статистику та обрали варіант "зведена статистика". Наприклад, ви можете вважати, що значення косості вище плюс-мінус один є суттєвою нестандартністю.

Однак, при t-тестах припущення полягає в тому, що залишки зазвичай розподіляються, а не змінна. Крім того, вони також досить надійні, що навіть при досить великих кількостях ненормативності, значення p все ще є досить валідними.


4

Це питання межує з теорією статистики - тестування на нормальність з обмеженими даними може бути сумнівним (хоча ми все це робимо час від часу).

Як альтернативу можна розглянути коефіцієнти куртозу та косості. З Хан та Шапіро: Статистичні моделі в інженерії певні відомості надаються щодо властивостей Beta1 та Beta2 (стор. 42 - 49) та Рис.

В основному вам потрібно обчислити так звані властивості Beta1 і Beta2. A Beta1 = 0 і Beta2 = 3 говорить про те, що набір даних наближається до нормальності. Це приблизний тест, але з обмеженими даними можна стверджувати, що будь-який тест можна вважати грубим.

Beta1 пов'язаний з моментами 2 і 3, або дисперсією та косою відповідно. В Excel це VAR і SKEW. Де ... ваш масив даних, формула така:

Beta1 = SKEW(...)^2/VAR(...)^3

Beta2 пов'язаний з моментами 2 та 4, або дисперсією та куртозом відповідно. В Excel це VAR і KURT. Де ... ваш масив даних, формула така:

Beta2 = KURT(...)/VAR(...)^2

Потім ви можете перевірити їх відповідно до значень 0 і 3 відповідно. Це має перевагу в потенційному виявленні інших розподілів (включаючи розподіли Пірсона I, I (U), I (J), II, II (U), III, IV, V, VI, VII). Наприклад, багато розповсюджених дистрибутивів, таких як Уніформа, Нормальний, Студентський t, Бета, Гамма, Експоненціальна та Лога-Нормальна, можуть бути вказані з цих властивостей:

Where:   0 <= Beta1 <= 4
         1 <= Beta2 <= 10 

Uniform:        [0,1.8]                                 [point]
Exponential:    [4,9]                                   [point] 
Normal:         [0,3]                                   [point]
Students-t:     (0,3) to [0,10]                         [line]
Lognormal:      (0,3) to [3.6,10]                       [line]
Gamma:          (0,3) to (4,9)                          [line]
Beta:           (0,3) to (4,9), (0,1.8) to (4,9)        [area]
Beta J:         (0,1.8) to (4,9), (0,1.8) to [4,6*]     [area]
Beta U:         (0,1.8) to (4,6), [0,1] to [4.5)        [area]
Impossible:     (0,1) to (4.5), (0,1) to (4,1]          [area]
Undefined:      (0,3) to (3.6,10), (0,10) to (3.6,10)   [area]

Values of Beta1, Beta2 where brackets mean:

[ ] : includes (closed)
( ) : approaches but does not include (open)
 *  : approximate 

Вони проілюстровані на Фіг 6-1 Хана та Шапіро.

Зрозуміло, що це дуже груба перевірка (з деякими питаннями), але ви можете розглянути це як попередню перевірку, перш ніж перейти до більш жорсткого методу.

Існують також механізми коригування для обчислення Beta1 та Beta2, де дані обмежені - але це вже поза цією посадою.


Багато цього матеріалу може добре працювати для великих наборів даних, і я погоджуюся з вашою початковою оцінкою, що тестування на нормальність може бути обмеженим або сумнівним при малих наборах даних. Але враховуючи величезну мінливість косості та куртозу, здається, що будь-які зусилля щодо визначення типу базового розподілу на основі цих статистичних даних будуть ще більш сумнівними та менш певними. Отже, чи не був би такий підхід (у кращому випадку) оманливим навіть як попередня перевірка?
whuber

1
Можливо, найкраще кваліфікувати метод далі: Хан і Шапіро (як згадувалося вище) радять дотримуватися обережності, особливо коли розмір вибірки менше 200 - і рекомендують після цього дотримуватися подальшої перевірки, наприклад, таблиці частот що порівнює пристосований розподіл з фактичними даними. Але на мій погляд, це корисний метод, який може підказати, де дані можуть лежати в межах спектра можливостей. Я використовував це на наборах даних не менше ніж приблизно 3000 і вбудував його в програмне забезпечення комп'ютерного моделювання, де це виявилося корисним.
AsymLabs

Я бачу ваш метод надання корисної інформації з наборами даних 3000 або більше. Однак тоді немає необхідності проводити дистрибутивне тестування для оцінки застосованості t-тесту середнього.
качан

Якщо ви вважаєте це корисним прийомом, як я, чи іншим способом, як здається вашому погляду, проте, це швидка і давно встановлена ​​(від Пірсона) альтернатива тестуванню на нормальність (та застосуванню студентів-t) у програмі контекст цієї нитки. Будь ласка, не зрозумійте мене неправильно, я визнаю і згоден з вашими проблемами. Але ми б обоє погодилися, чи не так, що без попередньої інформації спроба встановити, чи може ціла популяція змоделювати моделювання гаусса з дуже малого зразка даних - це вистріл у темряві в кращому випадку будь-яким методом, а в гіршому - небезпечний.
AsymLabs

1
Це вірно. Все, що я говорю, - якщо небезпечно спробувати з невеликого зразка перевірити, чи є населення Гауссом, то, мабуть, принаймні настільки небезпечно використовувати косості та куртоси, щоб визначити, яким може бути базовий розподіл! Насправді, здається, така спроба насправді була б гіршою, оскільки вона спирається на нестабільну статистику, як куртоз. Хоча система Пірсона може бути потужним посібником, який допомагає людям ідентифікувати можливі розподіли, він дає менший огляд, ніж навіть обмежені графічні дисплеї, як гістограми.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.