Найбільш очевидною причиною є те, що часто немає послідовностей у значеннях часу. Отже, якщо ви перемішуєте дані, це не має різниці в інформації, що передається даними. Якщо ми дотримуємося вашого методу, то кожного разу, коли ви перемішуєте дані, ви отримуєте різну вибірку дисперсії.
Більш теоретична відповідь полягає в тому, що дисперсія вибірки оцінює справжню дисперсію випадкової величини. Справжня дисперсія випадкової величини -
E [ ( X - E X ) 2 ] .X
Е[ ( X- ЕХ)2] .
Тут позначає очікування або "середнє значення". Отже визначення дисперсії - це середня квадратна відстань між змінною від її середнього значення. Якщо ви подивитесь на це визначення, тут немає "порядку часу", оскільки немає даних. Це лише атрибут випадкової величини.Е
Коли ви збираєте iid дані з цього розповсюдження, у вас є реалізації . Найкращий спосіб оцінити очікування - взяти середні вибірки. Ключовим тут є те, що ми отримали дані iid, і тому немає впорядкування даних. Вибірка x 1 , x 2 , … , x n є такою ж, як вибірка x 2 , x 5 , x 1 , x n . .х1, х2, … , Хнх1, х2, … , Хнх2, х5, х1, хн. .
EDIT
Дисперсія зразка вимірює специфічний вид дисперсії для вибірки, той, який вимірює середню відстань від середньої. Існують і інші види дисперсії, такі як діапазон даних та міжквартальний діапазон.
Навіть якщо ви сортуєте свої значення у порядку зростання, це не змінює характеристики вибірки. Отриманий зразок (дані) - це реалізація змінної. Розрахунок дисперсії вибірки схожий на розуміння, скільки дисперсії в змінній. Наприклад, якщо ви відібрали 20 осіб і обчислили їхній зріст, то це 20 "реалізацій" від випадкової величини зріст людей. Тепер дисперсія вибірки повинна вимірювати мінливість у зростанні особин загалом. Якщо ви замовляєте дані
100 , 110 , 123 , 124 , … ,Х=
100 , 110 , 123 , 124 , … ,
що не змінює інформацію у вибірці.
Розглянемо ще один приклад. дозволяє сказати , що у Вас є 100 спостережень від випадкової величини упорядкованого таким чином , Тоді середня наступна відстань дорівнює 1 одиниці, тож за вашим методом дисперсія буде дорівнює 1.
1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 , . . . 100.
Спосіб інтерпретації "дисперсії" або "дисперсії" - це зрозуміти, який діапазон значень вірогідний для даних. У цьому випадку ви отримаєте діапазон в розмірі 0,99 одиниці, що, звичайно, не представляє відмінності.
Якщо замість середнього значення ви просто підсумуєте наступні відмінності, то ваша дисперсія буде 99. Звичайно, це не відображає змінності у вибірці, оскільки 99 дає вам діапазон даних, а не відчуття змінності.