" Тест показав, що цілком ймовірно, що населення нормально розподілене ".
Немає; це не показало.
Тести гіпотези не говорять про те, наскільки ймовірним є нуль. Насправді ви можете зробити ставку, що ця нуль помилкова.
Діаграма QQ не дає чітких ознак нестандартності (сюжет досить прямий); можливо, є трохи коротший лівий хвіст, ніж ви очікували, але це насправді не має великого значення.
Гістограма як - це, мабуть, теж не говорить багато; це також натякає на трохи коротший лівий хвіст. Але дивіться тут
Поширення населення вашими даними не буде абсолютно нормальним. Однак графік QQ показує, що нормальність, ймовірно, є досить хорошим наближенням.
Якби розмір вибірки був не надто малим, брак відхилення Шапіро-Вілка, мабуть, сказав би майже те саме.
Оновлення: ваше редагування для включення фактичного p-значення Shapiro-Wilk є важливим, оскільки насправді це вказувало б, що ви відхилили нуль на типово значущих рівнях. Цей тест вказує на те, що ваші дані зазвичай не поширюються, і легке перекос, позначене ділянками, ймовірно, підбирається тестом. Для типових процедур, які можуть припускати нормальність самої змінної (однотипний t-тест - це той, що спадає на думку), при тому, що представляється досить великим розміром вибірки, ця легка ненормальність майже не матиме наслідків при все - одна з проблем із хорошими тестами на придатність полягає в тому, що вони, швидше за все, відхиляються саме тоді, коли це не має значення (коли розмір вибірки досить великий, щоб виявити деяку скромну ненормальність); аналогічно, вони, швидше за все, не зможуть відхилити, коли це має найбільше значення (коли розмір вибірки невеликий).