- розмір сукупності і n - розмір вибірки. Питання задає питання, чому дисперсія сукупності є середньоквадратичним відхиленням від середнього, а не ( N - 1 ) / N = 1 - ( 1 / N ) кратного за нього. З цього питання, навіщо зупинятися на цьому? Чому б, наприклад, не помножити середнє відхилення в квадраті на 1 - 2 / N , або 1 - 17 / N , або exp ( - 1 / N ) ?Nн( N- 1 ) / Н= 1 - ( 1 / N)1 - 2 / Н1 - 17 / Ндосвід( - 1 / N)
Насправді є вагома причина цього не робити. Будь-яка з цих цифр, яку я щойно згадав, послужила б чудово як спосіб кількісного визначення «типового поширення» серед населення. Однак без попереднього знання чисельності населення було б неможливо використати випадкову вибірку, щоб знайти неупереджений оцінювач такої цифри. Ми знаємо, що дисперсія вибірки , яка помножує середнє квадратичне відхилення від середнього значення вибірки на , є неупередженим оцінкою звичайної дисперсії сукупності при вибірці з заміною. (Немає проблем із внесенням цієї корекції, тому що ми знаємо n !) Відхилення вибірки було б упередженим( п - 1 ) / ннОцінювач будь-якої кратної дисперсії популяції, де цей кратний, наприклад , заздалегідь точно не відомий.1 - 1 / Н
Ця проблема деякої невідомої кількості зміщення пошириться на всі статистичні тести, які використовують дисперсію вибірки, включаючи t-тести та F-тести. Фактично, поділ на будь-яку іншу, ніж у формулі дисперсії популяції вимагатиме від нас зміни всіх статистичних таблиць t-статистики та F-статистики (та багатьох інших таблиць), але коригування залежатиме від чисельності населення. Нікому не хочеться робити таблиці для всіх можливих N ! Особливо, коли це не потрібно.NN
NN- 1Nнавіть не намагайтесь вчити різницю: вони просто надають єдину дисперсійну формулу (ділити на або n залежно від випадку).Nн