Я не впевнений, що це суто американське та британське питання. Решта цієї сторінки витягнута з написаного нами файлу ( http://www.graphpad.com/faq/viewfaq.cfm?faq=1383 ).
Як обчислити СД з n-1 у знаменнику
Обчисліть квадрат різниці між кожним значенням і середнім значенням вибірки.
Додайте ці значення.
Розділіть суму на n-1. Результат називається дисперсією.
Візьміть квадратний корінь, щоб отримати Стандартне відхилення.
Чому n-1?
Навіщо ділити на n-1, а не на n при обчисленні стандартного відхилення? На кроці 1 ви обчислюєте різницю між кожним значенням і середнім значенням цих значень. Ви не знаєте справжнього значення серед населення; все, що ви знаєте, - це середнє значення для вашого зразка. За винятком рідкісних випадків, коли середня вибіркова сума дорівнює середній сукупності, дані будуть ближче до середнього рівня вибірки, ніж будуть до справжнього середнього значення сукупності. Таким чином, значення, яке ви обчислюєте на кроці 2, ймовірно, буде трохи меншим (і не може бути більшим), ніж те, яке було б, якби ви використовували справжнє значення сукупності на кроці 1. Щоб компенсувати це, розділіть на n-1 ніж nv Це називається корекцією Бесселя.
Але чому n-1? Якби ви знали середнє значення вибірки та всі значення, окрім одного, ви могли б обчислити, яким має бути останнє значення. Статистики кажуть, що існує n-1 ступінь свободи.
Коли SD слід обчислювати знаменник n замість n-1?
У статистичних книгах часто в знаменнику відображаються два рівняння для обчислення SD, одне за допомогою n, а друге за допомогою n-1. Деякі калькулятори мають дві кнопки.
Рівняння n-1 використовується в загальній ситуації, коли ви аналізуєте вибірку даних і хочете зробити більш загальні висновки. Таким чином, обчислений SD (з n-1 в знаменнику) - найкраща здогадка про значення SD у загальній сукупності.
Якщо ви просто хочете кількісно визначити варіацію певного набору даних, і не плануєте екстраполювати, щоб робити більш широкі висновки, тоді ви можете обчислити SD, використовуючи n у знаменнику. Отриманий SD - це SD цих конкретних значень. Немає сенсу обчислювати СД таким чином, якщо ви хочете оцінити рівень населення, з якого виходили ці точки. Має сенс використовувати n в знаменнику лише тоді, коли немає вибірки з популяції, немає бажання робити загальні висновки.
Мета науки майже завжди полягає в узагальненні, тому рівняння з n в знаменнику не слід використовувати. Єдиний приклад, який я можу придумати, де це може мати сенс, - це кількісна оцінка варіації серед балів екзамену. Але набагато краще було б показати розсіювач кожного бала або гістограму розподілу частоти.