Як візуалізувати, що робить ANOVA?


60

Який спосіб (способи?) Візуально пояснити, що таке ANOVA?

Будь-які посилання, посилання (R-пакети?) Будуть вітатися.


У своєму блозі «Намагання психолога в галузі статистичного програмування» Крістофер Магнуссон наводить чудовий приклад однобічної візуалізації анової системи
Epifunky

Я знайшов цю приємну візуалізацію того, що таке дисперсійний аналіз. Це не так точно, як попередні відповіді, але ви можете інтерактивно грати з візуалізацією. Знайшов це досить цікаво: students.brown.edu/seeing-theory/regression/index.html#third
Майк

Відповіді:


51

Особисто мені подобається вводити лінійну регресію та ANOVA, показавши, що це все однаково і що лінійні моделі складають розділення на загальну дисперсію: у нас є якась дисперсія в результаті, яку можна пояснити факторами, що цікавлять, плюс незрозумілі частина (називається «залишковою»). Я зазвичай використовую таку ілюстрацію (сіра лінія для загальної мінливості, чорні лінії для групової чи індивідуальної певної змінності):

alt текст

Я також як heplots R пакет, від Майкла дружньому і Джона Фокса, але також побачити візуальні тести гіпотези в багатовимірної лінійної моделі: heplots пакет для R .

Стандартні способи пояснення того, що насправді робить ANOVA, особливо в рамках лінійної моделі, справді добре пояснені Крістенсеном у відповідях Плана на складні запитання , але ілюстрацій дуже мало. Статистичні методи Савіля та Вуда : Геометричний підхід має деякі приклади, але в основному щодо регресії. У проектуванні та аналізі експериментів Монтгомері , який в основному зосереджувався на DoE, є ілюстрації, які мені подобаються, але дивіться нижче

alt текст

(це мої :-)

Але я думаю, що вам потрібно шукати підручники на лінійних моделях, якщо ви хочете побачити, як сума квадратів, помилок тощо перетворюється у векторний простір, як показано у Вікіпедії . Оцінка та висновки в економетриці Девідсона та Маккіннона, здається, мають гарні ілюстрації (1-й розділ насправді охоплює геометрію OLS), але я переглядаю лише французький переклад (доступний тут ). Геометрія лінійної регресії також має хороші ілюстрації.

Редагувати :

Ну, і я просто пам'ятаю цю статтю Роберта Прузека, нова графіка для однобічної ANOVA .

Редагувати 2

А тепер пакет granova (згаданий @ gd047 та пов'язаний з вищезгаданим документом) перенесений на ggplot, див. GranovaGG із ілюстрацією для одностороннього ANOVA нижче.

введіть тут опис зображення


Перша ілюстрація зроблена за допомогою R?
Джордж Донтас

@ gd047 Так. Якщо ви хочете десь мати некрасивий вихідний код. Другий робиться в Metapost.
chl

3
@ gd047 Добре, як завжди, коли ми шукаємо старий код, ми не можемо його знайти (незважаючи на мої найкращі зусилля з grep / find), тому я переписав для цього швидкий (все ще потворний) R-скрипт . Я також приклав код MP .
chl


23

Як щодо чогось подібного? alt текст

Слідом за Кроулі (2005). Статистика. Вступ із використанням R: Wiley.


1
(+1) Я нагадую про це plot.design()(але ваше у покращеній версії :-)
chl

Це найкраще.
Цікаво

13

Дякую за чудову відповідь на даний момент. Хоча вони там, де дуже освітять, я відчув, що використовувати їх для курсу, який я зараз викладаю (ну, ТА'інг), буде занадто багато для моїх студентів. (Я допомагаю викладати курс біостатистики для студентів вищих ступенів медичних наук)

Тому я закінчив створити два зображення (обидва на основі моделювання), які я вважаю корисним прикладом для пояснення ANOVA.

Я був би радий прочитати коментарі чи пропозиції щодо їх вдосконалення.

Перше зображення показує моделювання 30 точок даних, розділених на 3 графіки (показує, як MST = Var розділяється на дані, що створюють MSB та MSW:

  • Лівий графік показує графік розкиду даних по групі.
  • Середній показує, як виглядають дані, які ми будемо використовувати для MSB.
  • Правильне зображення показує, як виглядають дані, які ми будемо використовувати для ТПВ.

alt текст

На другому зображенні показано 4 сюжети, кожен з яких відрізняється дисперсією та тривалістю для груп у той час

  • Перший ряд ділянок має низьку дисперсію, а другий - для дисперсії з високою (ер).
  • Перший стовпець ділянок призначений для однакової тривалості між групами, а другий стовпчик показує групи з (дуже) різними очікуваними тривалістю.

alt текст


2
H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0). Якщо ви зможете передати ці ідеї на графічний дисплей - що, здається, так і відбувається--, я думаю, ви майже готові.
chl

Привіт, дякую, за позитивний відгук (і за попередню детальну відповідь)! Я думаю, що одні з найбільших домашніх масажів, які я отримав під час підготовки матеріалу для цього класу, є: 1) Як описати перетворення вихідних даних, щоб отримати заходи відхилення MSB та MSW. 2) Як статистика випробувань MSB / MSW насправді є однобічним (а не двостороннім) тестом, де H0 - це MSB <= MSW. Нарешті, я просто задумав зазначити, що це правда, що SSW = SST-SSB (але я не бачу, як це правда для MSW = MST-MSB).
Тал Галілі

1
yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)

12

Оскільки ми збираємо певні типи приємних графіків у цій публікації, ось ще один, який я нещодавно знайшов і може допомогти вам зрозуміти, як працює ANOVA і як формується F-статистика. Графіка створена за допомогою пакету granova в Р. alt текст


2
(+1) Я дав посилання на статтю Роберта Прузека, але я не знав, що воно доступне в Р.
chl


6

Чудове запитання. Знаєте, я дуже довго боровся з обертанням голови навколо ANOVA. Мені завжди здається, що я повертаюся до інтуїції "між проти всередині", і завжди намагався уявити, як це виглядатиме в моїй голові. Я радий, що це питання виникло, і мене вразили різноманітні підходи до цього у відповідях вище.

У будь-якому разі, я довгий час (навіть роки) хотів зібрати кілька ділянок в одному місці, де я міг бачити, що відбувається одночасно, з багатьох різних напрямків: 1) наскільки розселені популяції , 2) як Далеко на відстані дані , 3) наскільки великі між порівняно з внутрішньою та 4) як порівнюють центральний та нецентральний розподіли F?

У справді чудовому світі я міг навіть пограти з повзунками, щоб побачити, як розмір вибірки змінює речі.

Отож я грав у manipulateкоманді в RStudio , і корова святе, це працює! Ось один із сюжетів, знімок, насправді:

візуалізуватиANOVA

Якщо у вас є RStudio, ви можете отримати код для створення вищевказаного сюжету (повзунки та всі)! на Github тут .

Дещо граючи з цим, я здивований тим, наскільки добре F-статистика розрізняє групи, навіть для помірно малих розмірів вибірки. Коли я дивлюся на популяції, вони насправді не так далеко (на мій погляд), але смуга "всередині" послідовно карликована смужкою "між". Навчіться щодня щось, я думаю.


3

Щоб проілюструвати, що відбувається з односторонньою ANOVA, я іноді використовував аплет, запропонований авторами "Введення в статистику практики", який дозволяє студентам грати з відхиленнями в межах та між ними та спостерігати їх вплив на статистику F . Ось посилання (аплет - останній на сторінці). Зразок знімка екрана:

введіть тут опис зображення

Користувач контролює верхній слайдер, змінюючи вертикальне поширення трьох груп даних. Червона точка внизу рухається по графіку p-значень, тоді як F-статистика, показана внизу, оновлюється.


2

Здається, корабель вже відплив у відповідь, але я думаю, що якщо це вступний курс, то більшість запропонованих тут дисплеїв буде занадто складно зрозуміти для студентів-початківців ... або, принаймні, занадто важко зрозуміти без вступного дисплея, який забезпечує дуже спрощене пояснення дисперсії розділення. Покажіть їм, як загальна кількість SST збільшується з кількістю предметів. Потім, показавши надуття декількох предметів (можливо, додавши по одній у кожній групі кілька разів), поясніть, що SST = SSB + SSW (хоча я з самого початку вважаю це SSE, тому що це дозволяє уникнути плутанини, коли ви переходите до тесту IMO в рамках предметів ). Потім покажіть їм візуальне зображення дисперсійного перегородки, наприклад, зашифрований великий квадратний колір таким чином, щоб ви могли бачити, як SST виготовлений з SSB і SSW. Тоді,


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.