Тому що припускати звичайні помилки фактично те саме, що припускати, що великих помилок не відбувається! Нормальний розподіл має настільки легкі хвости, що помилки поза стандартних відхилень мають дуже низьку ймовірність, помилки поза ± 6 стандартних відхилень фактично неможливі. На практиці це припущення рідко відповідає дійсності. Аналізуючи невеликі, охайні набори даних із добре розроблених експериментів, це може не мати великого значення, якщо ми зробимо хороший аналіз залишків. З меншою якістю даних це може мати значення набагато більше.± 3± 6
При використанні методів, заснованих на вірогідності (або байєсів), ефект від цієї норми (як сказано вище, фактично це припущення "без великих помилок" - це зробити висновок дуже малим надійним). На результати аналізу надто сильно впливають великі помилки! Це повинно бути так, оскільки припускаючи, що "немає великих помилок", змушує наші методи інтерпретувати великі помилки як невеликі помилки, і це може статися лише шляхом переміщення параметра середнього значення, щоб зменшити всі помилки. Одним із способів уникнути цього є використання так званих "надійних методів", див. Http://web.archive.org/web/20160611192739/http://www.stats.ox.ac.uk/pub/StatMeth/Robust .pdf
Але Ендрю Гельман не піде на це, оскільки надійні методи зазвичай представлені вкрай не байєсівським способом. Використання t-розподілених помилок у вірогідних / байєсівських моделях - це інший спосіб отримання надійних методів, оскільки розподіл має більш важкі хвости, ніж звичайні, тому дозволяє отримати більшу частку великих помилок. Кількість градусів параметра свободи слід заздалегідь фіксувати, а не оцінювати за даними, оскільки така оцінка знищить властивості стійкості методу (*) (це також дуже складна проблема, функція ймовірності для ν , числа ступенів свободи, можуть бути необмеженими, що призводить до дуже неефективних (навіть непослідовних) оцінок).тν
Якщо, наприклад, ви думаєте (боїтесь), що цілий 1 з десяти спостережень може бути "великими помилками" (вище 3 сд), ви можете використовувати -розподіл з 2 ступенями свободи, збільшуючи це число, якщо частка великих помилок вважається меншою.т
ттттт
(*) Одне посилання на це свідчить про МАСУ Venables & Ripley --- Сучасна прикладна статистика з S (на стор. 110 у 4-му виданні).