Як інтерпретувати значення F- та p у ANOVA?


40

Я новачок у статистиці, і зараз я маю справу з ANOVA. Я провожу тест ANOVA в R за допомогою

aov(dependendVar ~ IndependendVar)

Я отримую - серед інших - значення F та p-значення.

Моя нульова гіпотеза ( ) полягає в тому, що всі групові засоби рівні.H0

Існує багато інформації про те, як обчислюється F , але я не знаю, як читати F-статистику і як F і p пов'язані.

Отже, мої запитання:

  1. Як визначити критичне значення F для відхилення ?H0
  2. Чи кожне F має відповідне значення p, тому вони обоє означають в основному однакове? (наприклад, якщо , то H 0 відхилено)p<0.05H0

1
Ви пробували команди summary(aov(dependendVar ~ IndependendVar)))чи summary(lm(dependendVar ~ IndependendVar))? Ви маєте на увазі, що всі засоби групи рівні між собою і рівні 0 або просто один одному?
RyanB

так, я намагався summary(aov...). Дякую за те lm.*, що не знав про це :-) Я не розумію, що ви маєте на увазі рівним 0. Якщо це коротко для моєї гіпотези 0, ніж для гіпотези знадобиться значення, і я не перевіряв конкретний, так що в цьому випадку: просто один одному!
січеньDDD

1
Для інтуїтивного пояснення дивіться у блозі Yhat на тему регресії.
DataTx

Відповіді:


14

Щоб відповісти на ваші запитання:

  1. Ви знаходите критичне значення F з розподілу F (ось таблиця ). Дивіться приклад . Ви повинні бути обережними щодо одностороннього проти двостороннього, ступеня свободи чисельника та знаменника.

  2. Так.


Немає сенсу говорити про одно- або двосторонні порівняння в тесті універсалу, такому як F-тест.
Marcus Morrisey

3
Маркус Моррісі: Я думаю, що ви плутаєте один проти двох хвостів з одним проти двостороннім. F-тест не має декількох "хвостів" на вибір, але при побудові статистики тесту потрібно враховувати однобічну ANOVA проти двосторонню ANOVA.
Еміллер

29

F-статистика - це відношення 2 різних мір дисперсії для даних. Якщо нульова гіпотеза вірна, то це обидві оцінки одного і того ж і співвідношення буде приблизно 1.

Чисельник обчислюється шляхом вимірювання дисперсії засобів і якщо справжні засоби групи однакові, то це функція загальної дисперсії даних. Але якщо нульова гіпотеза помилкова, а засоби не всі рівні, то ця міра дисперсії буде більшою.

Знаменник - це середнє значення вибіркових дисперсій для кожної групи, що є оцінкою загальної дисперсії сукупності (якщо припустити, що всі групи мають однакові відхилення).

Отже, коли нуль всіх значень рівний істинним, то два міри (з деякими додатковими умовами для ступенів свободи) будуть подібними, а відношення буде близьким до 1. Якщо нуль помилковий, то чисельник буде великим відносно знаменник і відношення буде більшим за 1. Перегляд цього відношення на F-таблиці (або обчислення його з такою функцією, як pf в R) дасть значення p.

Якщо ви скоріше використовуєте область відхилення, ніж значення p, тоді ви можете використовувати таблицю F або функцію qf в R (або іншому програмному забезпеченні). Розподіл F має 2 типи ступенів свободи. Ступінь свободи чисельника ґрунтується на кількості груп, які ви порівнюєте (для односторонніх це кількість груп мінус 1), а ступінь свободи в знаменнику базується на кількості спостережень у групах (для 1- так це кількість спостережень мінус кількість груп). Для більш складних моделей ступінь свободи ускладнюється, але дотримуйтесь подібних ідей.


Дякую за пояснення! Я припускаю, що якщо я можу шукати значення F на таблиці, щоб побачити p-значення, то p і F - це лише два способи виразити ймовірність того, що такий результат, як аналізований, може виникнути, якщо H0 є правильним?
січеньDDD

2
У всій параметричній статистиці існує прямий функціональний зв’язок між тестовою статистикою (F у даному випадку) та р-значенням. Вони були внесені в таблицю для зручності, але їх також можна обчислити безпосередньо. Ви можете використовувати альфа для пошуку межі для критичної області для порівняння статистики тесту з (що, на мою думку, більш інтуїтивно зрозумілим), або використовувати обчислену статистику тесту, щоб знайти значення р для порівняння з альфа. В будь-якому випадку ми починаємо з альфа-рівня та тестової статистичної формули, яка слідує заданому розподілу, коли нуль відповідає істині.
Грег Сніг

20

Жp

введіть тут опис зображення

FFFpЖЖpЖp

Вам слід помітити кілька інших речей щодо розподілу за нульовою гіпотезою:

Ж

Ж

ССЖСpp=0,175

ЖЖгf1=3гf1=2

введіть тут опис зображення

Жχ2χ2Жχ2zЖтт

Це набагато більше, ніж я мав намір набрати, але я сподіваюся, що це стосується ваших питань!

(Якщо вам цікаво, звідки беруться діаграми, вони автоматично генеруються моїм пакетом статистики настільних ПК, майстер .)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.