Якщо ви визначите дисперсію як - аналогічно дисперсії сукупності але якщо середнє значення вибірки для , то обидва ваші зразки мали б однакову дисперсію.с2н=MSE= 1н∑нi = 1( хi- х¯)2мк
Отже, різниця полягає лише в корекції Бесселя у звичайній формулі для вибіркової дисперсії ( , який коригує той факт, що середнє значення вибірки ближче до даних, ніж означає сукупність, щоб зробити його неупередженим (приймаючи правильне значення "в середньому").с2n - 1= nn - 1⋅ MSE = nn - 1⋅ 1н∑нi = 1( хi- х¯)2= 1n - 1∑нi = 1( хi- х¯)2
Ефект поступово зникає зі збільшенням розміру вибірки, оскільки переходить до 1 як .n - 1нn → ∞
Немає жодної конкретної причини, якщо вам доводиться використовувати неупереджений оцінювач для варіації, до речі - - цілком дійсний оцінювач, і в деяких випадках, можливо, може мати переваги перед більш поширеною формою (неупередженість не обов'язково така велика угода).с2н
Варіантність сама по собі не є безпосередньо показником поширення. Якщо я подвоїв усі значення в наборі даних, я стверджую, що вони вдвічі перевищують "спред". Але дисперсія збільшується в 4 рази. Тому частіше говорять, що стандартне відхилення, а не дисперсія - це міра поширення.
Звичайно, таке ж питання виникає і зі стандартним відхиленням (звичайна версія ), як і з дисперсією - при подвоєнні балів змінюється стандартне відхилення з тієї ж причини, що і з дисперсією.сn - 1
У невеликих зразках корекція Бесселя робить стандартне відхилення дещо менш інтуїтивним, як міру поширення через цей ефект (що дублювання вибірки змінює значення). Але багато заходів розповсюдження зберігають однакове значення при дублюванні вибірки; Я згадаю кілька -
сн (звичайно)
середнє (абсолютне) відхилення від середнього
середнє (абсолютне) відхилення від медіани
міжквартильний діапазон (принаймні, для деяких визначень зразкових квартілів)
{3, 5}
сама по собі по 1-й формулі. Як ви зазначаєте, запитуючий намагався оцінити дисперсію сукупності, з якої це вважається вибіркою, але хто знає, чи це так, чи ні.