Я хочу навчитися ANOVA. Перш ніж я почати вивчати, як працює алгоритм (які обчислення потрібно робити) і чому він працює, я спершу хотів би дізнатися, яку проблему ми насправді вирішуємо за допомогою ANOVA, або на яку відповідь ми намагаємось відповісти. Іншими словами: Що таке вхід і що є результатом алгоритму?
Я розумію, що ми використовуємо як вхід. У нас є набір чисел. Кожне число має значення однієї або декількох категоричних змінних (також відомих як "фактори"). Наприклад:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
Чи правильно сказати, що ANOVA обчислює p-значення нульової гіпотези, яка говорить про відсутність впливу факторів на середнє значення? Іншими словами, подаємо наведені вище дані в алгоритм і в результаті отримуємо p-значення нульової гіпотези?
Якщо це так, то який захід ми насправді використовуємо для обчислення р-значення. Наприклад, можна сказати, що з огляду на нульову гіпотезу М може бути настільки ж високою, як спостережувана (або навіть вище) випадково в 1% випадків. Що таке М?
Чи ми також не досліджуємо фактори ANOVA окремо? Чи може ANOVA сказати, що фактор_1 має ефект, але фактор_2 ні? Чи може ANOVA сказати, що для заданих факторів значення, відповідні значенням "A", "B" і "C", статистично не відрізняються (мають однакове середнє значення, наприклад), але значення "D" має ефект?