Моя інтуїція полягає в тому, що стандартне відхилення - це міра поширення даних.
У вас є хороша думка, що широка чи щільна вона залежить від того, яке наше основне припущення щодо розподілу даних.
Застереження: міра розповсюдження є найбільш корисною, коли розподіл ваших даних симетричний навколо середнього та має відхилення порівняно близьке до нормального розподілу. (Це означає, що це приблизно нормально.)
У випадку, коли дані приблизно нормальні, стандартне відхилення має канонічну інтерпретацію:
- Регіон: середнє значення вибірки +/- 1 стандартне відхилення, містить приблизно 68% даних
- Область: середнє значення вибірки +/- 2 стандартного відхилення, містить приблизно 95% даних
- Область: середнє значення вибірки +/- 3 стандартного відхилення, містить приблизно 99% даних
(див. першу графіку у Вікі )
Це означає, що якщо ми знаємо, середня сукупність дорівнює 5, а стандартне відхилення - 2,83, і ми вважаємо, що розподіл приблизно нормальний, я б сказав вам, що я абсолютно впевнений, що якщо ми зробимо (велике) багато спостережень, лише 5% бути менше 0,4 = 5 - 2 * 2,3 або більше 9,6 = 5 + 2 * 2,3.
Зауважте, який вплив має стандартне відхилення на наш довірчий інтервал? (чим більше поширення, тим більше невизначеності)
Крім того, у загальному випадку, коли дані навіть не є приблизно нормальними, але все ще симетричними, ви знаєте, що існує деяка для якої:α
- Область: середнє значення вибіркового значення +/- стандартне відхилення, містить приблизно 95% данихα
Ви можете дізнатися з підпроби, або припустити, що α = 2, і це часто дає вам хороше правило для обчислення в голові, які майбутні спостереження очікувати, або які з нових спостережень можна вважати пережилими. (майте на увазі, проте застереження!)αα = 2
Я не бачу, як ви повинні це інтерпретувати. Чи означає, що 2,83 означає, що значення розкидані дуже широко, чи всі вони щільно згруповані навколо середнього ...
Я думаю, що кожне запитання, що задає "широке або тісне", повинно також містити: "стосовно чого?". Однією з пропозицій може бути використання відомого розподілу в якості посилання. Залежно від контексту може бути корисним подумати про те: "Чи набагато ширше, чи жорсткіше, ніж нормальне / пуассонне?".
EDIT: На основі корисного натяку в коментарях ще один аспект щодо стандартного відхилення як міри відстані.
Ще одна інтуїція корисності стандартного відхилення полягає в тому, що це вимірювання відстані між зразками даних x 1 , … , x N та його середнім ˉ x :сNх1, … , ХNх¯
сN= 1N∑Ni = 1( хi- х¯¯¯)2-------------√
Для порівняння середня квадратична помилка (MSE), одна з найпопулярніших заходів помилок у статистиці, визначається як:
MSE = 1н∑нi = 1( Yi^- Yi)2
Можна поставити питання, чому вищезазначена функція відстані? Чому, наприклад, відстані в квадраті, а не абсолютні відстані? І чому ми беремо квадратний корінь?
Маючи квадратичну відстань або помилку, функції мають ту перевагу, що ми можемо як диференціювати, так і легко їх мінімізувати. Що стосується квадратного кореня, він додає інтерпретаційності, оскільки він перетворює помилку на масштаб наших спостережуваних даних.