Який спосіб (способи?) Візуально пояснити, що таке ANOVA?
Будь-які посилання, посилання (R-пакети?) Будуть вітатися.
Який спосіб (способи?) Візуально пояснити, що таке ANOVA?
Будь-які посилання, посилання (R-пакети?) Будуть вітатися.
Відповіді:
Особисто мені подобається вводити лінійну регресію та ANOVA, показавши, що це все однаково і що лінійні моделі складають розділення на загальну дисперсію: у нас є якась дисперсія в результаті, яку можна пояснити факторами, що цікавлять, плюс незрозумілі частина (називається «залишковою»). Я зазвичай використовую таку ілюстрацію (сіра лінія для загальної мінливості, чорні лінії для групової чи індивідуальної певної змінності):
Я також як heplots R пакет, від Майкла дружньому і Джона Фокса, але також побачити візуальні тести гіпотези в багатовимірної лінійної моделі: heplots пакет для R .
Стандартні способи пояснення того, що насправді робить ANOVA, особливо в рамках лінійної моделі, справді добре пояснені Крістенсеном у відповідях Плана на складні запитання , але ілюстрацій дуже мало. Статистичні методи Савіля та Вуда : Геометричний підхід має деякі приклади, але в основному щодо регресії. У проектуванні та аналізі експериментів Монтгомері , який в основному зосереджувався на DoE, є ілюстрації, які мені подобаються, але дивіться нижче
(це мої :-)
Але я думаю, що вам потрібно шукати підручники на лінійних моделях, якщо ви хочете побачити, як сума квадратів, помилок тощо перетворюється у векторний простір, як показано у Вікіпедії . Оцінка та висновки в економетриці Девідсона та Маккіннона, здається, мають гарні ілюстрації (1-й розділ насправді охоплює геометрію OLS), але я переглядаю лише французький переклад (доступний тут ). Геометрія лінійної регресії також має хороші ілюстрації.
Редагувати :
Ну, і я просто пам'ятаю цю статтю Роберта Прузека, нова графіка для однобічної ANOVA .
Редагувати 2
А тепер пакет granova (згаданий @ gd047 та пов'язаний з вищезгаданим документом) перенесений на ggplot, див. GranovaGG із ілюстрацією для одностороннього ANOVA нижче.
Дякую за чудову відповідь на даний момент. Хоча вони там, де дуже освітять, я відчув, що використовувати їх для курсу, який я зараз викладаю (ну, ТА'інг), буде занадто багато для моїх студентів. (Я допомагаю викладати курс біостатистики для студентів вищих ступенів медичних наук)
Тому я закінчив створити два зображення (обидва на основі моделювання), які я вважаю корисним прикладом для пояснення ANOVA.
Я був би радий прочитати коментарі чи пропозиції щодо їх вдосконалення.
Перше зображення показує моделювання 30 точок даних, розділених на 3 графіки (показує, як MST = Var розділяється на дані, що створюють MSB та MSW:
На другому зображенні показано 4 сюжети, кожен з яких відрізняється дисперсією та тривалістю для груп у той час
Оскільки ми збираємо певні типи приємних графіків у цій публікації, ось ще один, який я нещодавно знайшов і може допомогти вам зрозуміти, як працює ANOVA і як формується F-статистика. Графіка створена за допомогою пакету granova в Р.
Перегляньте презентацію Хадлі Вікхем ( pdf , дзеркало ) на ggplot. Починаючи з сторінок 23-40 цього документа, він описує цікавий підхід до візуалізації ANOVA.
* Посилання, взяте з: http://had.co.nz/ggplot2/
Чудове запитання. Знаєте, я дуже довго боровся з обертанням голови навколо ANOVA. Мені завжди здається, що я повертаюся до інтуїції "між проти всередині", і завжди намагався уявити, як це виглядатиме в моїй голові. Я радий, що це питання виникло, і мене вразили різноманітні підходи до цього у відповідях вище.
У будь-якому разі, я довгий час (навіть роки) хотів зібрати кілька ділянок в одному місці, де я міг бачити, що відбувається одночасно, з багатьох різних напрямків: 1) наскільки розселені популяції , 2) як Далеко на відстані дані , 3) наскільки великі між порівняно з внутрішньою та 4) як порівнюють центральний та нецентральний розподіли F?
У справді чудовому світі я міг навіть пограти з повзунками, щоб побачити, як розмір вибірки змінює речі.
Отож я грав у manipulate
команді в RStudio , і корова святе, це працює! Ось один із сюжетів, знімок, насправді:
Якщо у вас є RStudio, ви можете отримати код для створення вищевказаного сюжету (повзунки та всі)! на Github тут .
Дещо граючи з цим, я здивований тим, наскільки добре F-статистика розрізняє групи, навіть для помірно малих розмірів вибірки. Коли я дивлюся на популяції, вони насправді не так далеко (на мій погляд), але смуга "всередині" послідовно карликована смужкою "між". Навчіться щодня щось, я думаю.
Щоб проілюструвати, що відбувається з односторонньою ANOVA, я іноді використовував аплет, запропонований авторами "Введення в статистику практики", який дозволяє студентам грати з відхиленнями в межах та між ними та спостерігати їх вплив на статистику F . Ось посилання (аплет - останній на сторінці). Зразок знімка екрана:
Користувач контролює верхній слайдер, змінюючи вертикальне поширення трьох груп даних. Червона точка внизу рухається по графіку p-значень, тоді як F-статистика, показана внизу, оновлюється.
Здається, корабель вже відплив у відповідь, але я думаю, що якщо це вступний курс, то більшість запропонованих тут дисплеїв буде занадто складно зрозуміти для студентів-початківців ... або, принаймні, занадто важко зрозуміти без вступного дисплея, який забезпечує дуже спрощене пояснення дисперсії розділення. Покажіть їм, як загальна кількість SST збільшується з кількістю предметів. Потім, показавши надуття декількох предметів (можливо, додавши по одній у кожній групі кілька разів), поясніть, що SST = SSB + SSW (хоча я з самого початку вважаю це SSE, тому що це дозволяє уникнути плутанини, коли ви переходите до тесту IMO в рамках предметів ). Потім покажіть їм візуальне зображення дисперсійного перегородки, наприклад, зашифрований великий квадратний колір таким чином, щоб ви могли бачити, як SST виготовлений з SSB і SSW. Тоді,