Як саме статистики погодились використовувати (n-1) як неупереджений оцінювач дисперсії популяції без моделювання?


67

Формула для обчислення дисперсії має у знаменнику:(n1)

s2=i=1N(xix¯)2n1

Я завжди цікавився, чому. Однак, читаючи та переглядаючи кілька хороших відеороликів про "чому" це, здається, - це хороший об'єктивний оцінювач мінливості населення. Тоді як занижує і завищує дисперсію населення.(n1)n(n2)

Що мені цікаво знати, це те, що в епоху відсутності комп’ютерів, як саме був зроблений цей вибір? Чи є фактичні математичні докази, що підтверджують це, чи це суто емпіричні, і статистики зробили МНОГО обчислення вручну, щоб придумати "найкраще пояснення" в той час?

Як тільки статистики придумали цю формулу на початку 19 століття за допомогою комп'ютерів? Посібник чи в ньому більше, ніж на очі?


13
Я припускаю, що ви хочете сказати " без допомоги комп'ютерів". Відповідь - можливо, не дивно - використанням алгебри. Виведення є досить простим, і в багатьох місцях студентам статистики прийнято сприймати це як вправу / вивчати її як нижчу.
Glen_b

Я думаю, що це дає досить гарне пояснення: en.wikipedia.org/wiki/Variance#Sample_variance
Верена Хауншмід


Я відредагував вашу формулу, щоб використовувати та оскільки в знаменнику призначений для дисперсії вибірки (латинські символи), а не дисперсії сукупності (грецькі символи). ˉ x n - 1s2x¯n1
Олексій

Відповіді:


40

Корекція називається корекцією Бесселя і має математичне підтвердження. Особисто мене навчили цьому простому способу: за допомогою ви зміщення (див. Тут ).E [ 1n1E[1n1n(xix¯)2]

Ви також можете пояснити виправлення, виходячи з концепції ступенів свободи, моделювання не є строго необхідним.


15
Доказчик №3 має прекрасне інтуїтивне пояснення, яке може зрозуміти навіть непрофесіонал. Основна ідея полягає в тому, що середня вибірка не є такою, як середня кількість населення. Ваші спостереження, природно, будуть ближче до вибіркової середньої величини, ніж середня сукупність, і це в кінцевому рахунку недооцінює ці терміни терміни. Це, мабуть, очевидно для більшості людей, але я ніколи не замислювався над "інтуїцією" щодо того, чому зміщення вибіркової вибірки дотепер є необ'єктивним. Я дізнався лише формальні докази. ( x i - ˉ x ) 2(xiμ)2(xix¯)2
WetlabStudent

2
Існує також геометричний підхід, чому слід виправляти n-1 (це дуже добре пояснено у Савіллі та Вуді: Статистичні методи: Геометричний підхід). Коротше кажучи: вибірку з n можна розглядати як n-мірний простір даних. Вектори точкових зразків додають до спостережуваного вектора, який можна розкласти на модельний вектор з p-розмірністю, що відповідає p параметру, та вектором помилки з np-виміром. Відповідний піфагорейський розпад вектора помилок має np квадрати, середнє значення яких є мірою для варіації.
giordano

Я надішлю вам гарне посилання, яке містить коротке пояснення: en.wikipedia.org/wiki/Bias_of_an_estimator
Крістіна

Чи можете ви пояснити, чому у доказі (чергування 3) ми припускаємо, що як істинні, так і упереджені відхилення обчислюються за допомогою 's? Проблема різних дисперсій виникає тоді, коли ми маємо сукупність (з справжньою дисперсією) та вибірку (з упередженою дисперсією). Але якщо ми обчислимо дисперсію на одних і тих же даних, а саме , чому вони взагалі повинні відрізнятися? Там ми думаємо про як істинну дисперсію, обчислену з використанням таких самих , що і упереджений . Я не можу погодитися з цим доказом. Допоможіть, будь ласка, що я пропускаю? х х 1 , х 2 , . . . , x n σ 2 x s 2 упередженоn xx1,x2,...,xnσ2xsbiased2
Туркхан Бадалов

56

Більшість доказів, які я бачив, досить прості, що Гаусс (проте він це зробив), ймовірно, виявив це досить легко довести.

Я шукав висновок про резюме, до якого я міг би зв’язати вас (є ряд посилань на докази поза сайтом, включаючи принаймні одне у відповідях тут), але я не знайшов його тут у CV у пара пошуків, тому для повноти я наведу простий. Зважаючи на його простоту, легко зрозуміти, як люди почали б використовувати те, що зазвичай називають виправленням Бесселя .

Це сприймає як припущене знання і передбачає, що перші кілька основних властивостей дисперсії відомі.E(X2)=Var(X)+E(X)2

E[i=1n(xix¯)2]=E[i=1nxi22x¯i=1nxi+nx¯2]=E[i=1nxi2nx¯2]=nE[xi2]nE[x¯2]=n(μ2+σ2)n(μ2+σ2/n)=(n1)σ2

1
яке властивість змушує термін зникнути? 2x¯i=1nxi
Ciprian Tomoiagă

3
Він не зникає. Ви помітили, що ознака останнього терміну змінилася?
Glen_b

1
(+1) Нещодавно я почув чудовий доказ того, що я особисто вважаю більш інтуїтивним. Дисперсія вибірки з коефіцієнтом може бути повторно виражена як середнє значення всіх різниць у квадраті між усіма парами балів. Тепер зауважте, що пари, де одна і та сама точка входить двічі, дорівнюють нулю, і це зміщує вираз. Здається розумним виправити зміщення, виключаючи всі ці пари з подвійної суми і лише усереднюючи всі інші. Це дає коригування Бесселя. 1/n
амеба каже: Відновіть Моніку

1
Ніпе, неважливо, зрозумів це. , тож ви просто застосовуєте ту саму особу, яку ви згадали вище, до обох термінів у рядку 3.V[x¯]=V[x]n
тел

1
Будь-яка з змінних iid має той самий другий момент. Ми йдемо від розмови про всіх них до просто обговорення одного з них. Ви могли так само легко взяти (а це деякі люди) або або ... але я взяв -йx1x2xni
Glen_b

37

Відповідно до Світу математики Вайштейна, він був вперше доведений Гауссом у 1823 році. Довідка - це том 4 Гаусса Верке, який можна прочитати на https://archive.org/details/werkecarlf04gausrich . Відповідних сторінок здається 47-49. Схоже, що Гаус розслідував це питання і придумав доказ. Я не читаю латиниці, але в тексті є резюме німецької мови. Сторінки 103-104 пояснюють, що він робив (Редагувати: я додав грубий переклад):

Allein та людина Nicht berechtigt IST, вмирають sichersten Werthe Fuer померти Варен Werthe Селбст цу Halten, так ueberzeugt людина Січі Leicht, Дасс людина Durch Dieses Verfahren allemal ден wahrscheinlichsten унд mittleren Fehler цу Клейн Фінден мус, унд Даер померти gegebenen Resultaten зробіть groessere Genauigkeit beilegt, als sie wirklich besitzen. [Але оскільки ніхто не має права ставитися до найбільш ймовірних значень як до фактичних значень, можна легко переконати себе в тому, що завжди потрібно виявити, що найбільш вірогідна помилка та середня помилка занадто малі, і тому дані результати володіють більшою точністю, ніж вони насправді.]

з якого, здавалося б, було добре відомо, що дисперсія вибірки є упередженою оцінкою дисперсії популяції. У статті йдеться про те, що різницю між ними зазвичай ігнорують, оскільки це не важливо, чи розмір вибірки досить великий. Тоді воно говорить:

Der Verfasser hat daher diesen Gegenstand eine besondere Untersuchung unterworfen, die zu einem sehr Merkwuerdigen hoechst einfachen Resultate gefuehrt hat. Man braucht nemlich den nach dem angezeigten fahlerhaften Verfahren gefundenen mittleren Fehler, um ihn in die richtigen zu verwandeln, nur mit

πρπ

zu multiplicieren, wo die Anzahl der beobachtungen (кількість спостережень) und die Anzahl der undekannten groessen (кількість невідомих) bedeutet. [Отже, автор провів спеціальне дослідження цього об'єкта, що призвело до дуже дивного і надзвичайно простого результату. А саме, потрібно лише помножити середню помилку, знайдену вищезгаданим помилковим процесом, на (заданий вираз), щоб змінити її на правильну, де - кількість спостережень, а - кількість невідомих величин.]πρπρ

Тож якщо це справді вперше було знайдено виправлення, то, схоже, це було знайдено розумним розрахунком Гауссом, але люди вже усвідомлювали, що потрібна певна корекція, тож, можливо, хтось ще міг би це довідатися емпірично перед цим . Або, можливо, попередні автори не мали бажання отримати точну відповідь, оскільки вони все одно працювали з досить великими наборами даних.

Резюме: посібник, але люди вже знали, що в знаменнику не зовсім правильно.n


Якби хтось міг надати переклад з німецької, це було б добре. Я ні для кого не читаю німецьку.
Faheem Mitha

2
Так, Google Translate не так добре працює через мої орфографічні помилки! Додам у спробі перекладу; це буде гарний спосіб практикувати мою німецьку.
Флондерер

14

Для мене одна інтуїція - це те

The degree to whichXi varies from X¯+The degree to whichX¯ varies from μ=The degree to which Xi varies from μ.

Це,

E[(XiX¯)2]+E[(X¯μ)2]=E[(Xiμ)2].

Насправді доведення вищевказаного рівняння вимагає трохи алгебри (ця алгебра дуже схожа на відповідь @ Glen_b вище). Але якщо припустити, що це правда, ми можемо переставити, щоб отримати:

E[(XiX¯)2]=E[(Xiμ)2]σ2E[(X¯μ)2]σ2n=n1nσ2.

Для мене ще однією інтуїцією є те, що використання замість вносить упередження. І це зміщення точно дорівнює .X¯μE[(X¯μ)2]=σ2n


12

Більшість відповідей це вже детально пояснили, окрім тих, що є одна проста ілюстрація, яка може бути корисною:

Припустимо, вам дано, що і перші три числа:n=4

8,4,6 , _

Тепер четвертим числом може бути що завгодно, оскільки немає обмежень. Тепер розглянемо ситуацію, коли вам дано, що і , то якщо перші три числа: то четверте число повинно бути .ˉ x = 6 8 , 4 , 6 6n=4x¯=68,4,66

Це означає, що якщо ви знаєте значення і , то значення не має свободи. Таким чином, дає нам неупереджений оцінювач.ˉ x n t h n - 1n1x¯nthn1

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.