Як можна пояснити, що є неупередженим оцінювачем для лайперсона?


10

Припустимо, є неупередженим оцінювачем для . Тоді звичайно, . ; & thetasE[ & thetas ; |thetas]=thetasθ^θE[θ^θ]=θ

Як пояснити це лайперсону? У минулому я вже говорив, що якщо ви середньо оцінюєте купу значень , оскільки розмір вибірки збільшується, ви отримуєте кращу апроксимацію . ; & thetasθ^θ

Для мене це проблематично. Я думаю, що я тут фактично описую це явище бути асимптотично неупередженим, а не виключно неупередженим, тобто де \ hat {\ theta} , ймовірно, залежить від n .

limnE[θ^θ]=θ,
пθ^n

Отже, як можна пояснити, що таке неупереджений оцінювач для лайперсона?


2
Це спосіб зробити оцінку, яка є правильною: зазвичай це не зовсім правильно, але в цілому це не дає завищення частіше, ніж заниження. Я розумію, що це звучить більше, ніж є медіаною ніж середнім, але я думаю, що це фіксує суттєвий момент. thetas ;θθ^
jwimberley

3
Мені подобається жарт "троє статистиків на полюванні" (версія тут ) ...
Бен Болкер

2
Ваше пояснення - Закон великих чисел, воно не має нічого спільного з неупередженістю.
Сіань

@ Xi'an: Якби оцінювач був упередженим, обмеження не було б . θ
user2357112 підтримує Моніку

@ user2357112: наскільки я розумію (та інші, як показано у відповідях), оскільки розмір вибірки набуває більших значень, враховуючи як зростає до нескінченності, тобто оцінку на основі спостережень. Зараз я бачу, що речення можна трактувати по-різному. θ^nnnn
Сіань

Відповіді:


14

Технічно те, що ви описуєте, говорячи про те, що ваш оцінювач наближається до справжнього значення, оскільки розмір вибірки зростає (як вже згадували інші) узгодженість або збіжність статистичних оцінок. Це зближення може бути або ймовірністю конвергенції, що говорить, що для кожного , або майже певна конвергенція, яка говорить про те, що . Зауважте, як обмежується насправді всерединіε > 0 Р ( Іт п | & thetas ; п - & thetas ; | > ε ) = 0limnP(|θ^nθ|>ϵ)=0ϵ>0P(limn|θ^nθ|>ϵ)=0вірогідність у другому випадку. Виявляється, ця остання форма конвергенції сильніша за іншу, але обидві вони означають по суті одне і те ж, що полягає в тому, що оцінка, як правило, наближається до тієї речі, яку ми оцінюємо, коли ми збираємо більше вибірок.

Тонке моментом тут є те, що навіть коли або по ймовірності або майже напевно, це НЕ вірно взагалі , що , тому послідовність не означає асимптотичну неупередженість, як ви пропонуєте. Ви повинні бути обережними, переходячи між послідовностями випадкових змінних (що є функціями) до послідовностей очікувань (які є інтегралами).LimпE( & thetas ; п)=thetasθ^nθlimnE(θ^n)=θ

Всі технічні матеріали вбік, неупереджені означає лише, що . Тож, коли ви пояснюєте це комусь, просто скажіть, що якби експеримент повторювався в однакових умовах багато разів, середнє значення оцінки було б близьким до справжнього значення.E(θ^n)=θ


5
Ваше бачення лайперсона досить захоплююче. Він знає, що таке "зближення у ймовірності", "як конвергенція", обмежує ... Це людина з майбутнього.
Аксакал

2
Я не думаю, що лайперсон не знає нічого з цього, я намагався виправити деякі непорозуміння в оригінальній публікації. Моя пропозиція щодо того, як пояснити речі непрацівникам, є в останньому абзаці.
dsaxton

останній абзац, хоча заплутує концепцію упередженості з послідовністю оцінки, що, ймовірно, було однією з плутанини ОП.
Аксакал

3
Як так? Повторення експерименту в однакових умовах означало б, що розмір вибірки є фіксованим, тому ми, очевидно, не говоримо про послідовність.
dsaxton

1
Гаразд, ви маєте рацію з цим, але це означає, що ви
припускаєте частолюдистський

9

Я не впевнений, чи плутаєте ви послідовність та неупередженість.

Консистенція: чим більший розмір вибірки, тим менша дисперсія оцінювача.

  • Залежить від розміру вибірки

Незаангажованість: очікуване значення оцінювача дорівнює справжньому значенню параметрів

  • Не залежить від розміру вибірки

Отже, ваше речення

якщо ви в середньому купуєте значення значень , оскільки розмір вибірки збільшується, ви отримаєте кращу апроксимацію .θ^θ

Невірно. Навіть якщо розмір вибірки стає нескінченним, неупереджений оцінювач залишатиметься неупередженим оцінювачем, наприклад, якщо ви оціните середнє значення як "середнє значення +1", ви можете додати до вашої вибірки мільярд спостережень, і ваш оцінювач все одно не дасть вам справжнього значення.

Тут ви можете знайти більш глибоку дискусію про різницю між послідовністю та неупередженістю.

Чим відрізняється послідовний оцінювач від неупередженого оцінювача?


2
Я насправді нічого не знаю про послідовність, але все-таки дякую.
Кларнетист

1
Послідовність @Clarinetist - це, мабуть, найважливіша властивість оцінювача, що, маючи достатньо даних, ви отримаєте довільну близькість до правильної відповіді.
Меттью Ганн

7

@Ferdi вже дав чітку відповідь на ваше запитання, але давайте зробимо це трохи формальніше.

Нехай бути ваша вибірка незалежних і однаково розподілених випадкових величин з розподілом . Вас цікавить оцінка невідомої, але фіксованої кількості , використовуючи оцінювач як функцію . Оскільки - функція випадкових величин, оцінітьX1,,XnFθ gX1,,Xng

θ^n=g(X1,,Xn)

також є випадковою змінною. Ми визначаємо зміщення як

bias(θ^n)=Eθ(θ^n)θ

оцінювач є неупередженим, коли .Eθ(θ^n)=θ

Говорячи це простою англійською мовою: ми маємо справу зі випадковими змінними , тому, якщо це не вироджується , якщо ми брали різні зразки, ми могли б очікувати, що ми спостерігатимемо різні дані та такі різні оцінки. Тим не менш, ми можемо очікувати, що для різних зразків "в середньому" оцінюється буде "правильним", якщо оцінювач буде неупереджений. Так було б не завжди правильно, але "в середньому" було б правильно. Він просто не завжди може бути "правильним" через випадковість, пов'язану з даними.θ^n

Як вже зазначали інші, той факт, що ваша оцінка стає «ближчою» до передбачуваної кількості у міру зростання вибірки, тобто у ймовірності збігається

θ^nPθ

має відношення до послідовності оцінювачів , а не неупередженості. Самобічна неупередженість нічого не говорить про розмір вибірки та її відношення до отриманих оцінок. Більше того, неупереджені оцінки не завжди доступні та не завжди кращі перед упередженими. Наприклад, розглядаючи компроміс з відхиленням відхилення, можливо, ви будете готові розглянути можливість використання оцінювача з більшим ухилом, але меншою дисперсією - тому "в середньому" це було б далі від справжнього значення, але частіше (менша дисперсія) оцінки будуть бути ближче до справжнього значення, тоді у випадку неупередженого оцінювача.


(+1): дуже вдалий підхід до того, що рідко є неупереджені оцінки. І згадка про упередженість / дисперсію протиставлення.
Сіань

2

Спершу слід відрізнити нерозуміння упередженості від статистичних упереджень, особливо для непрофесійної людини.

Вибір слова з використанням медіани, середньої чи режимової оцінки як середнього показника для населення , часто містить політичну, релігійну або наукову теорію. Обчислення того, який оцінювач є найкращою формою середнього значення, має різний тип арифметики, який впливає на статистичне зміщення.

Після того, як ви перейдете упередження вибору методу, ви можете вирішити потенційні зміщення в методі оцінки. Спочатку потрібно вибрати метод, який може мати зміщення, і механізм, який легко веде до цього зміщення.

Це може бути простіше використовувати точки перемоги точки підкорення, коли це стає очевидним, оскільки розмір вибірки стає меншим, оцінка стає чітко упередженою. Наприклад, коефіцієнт n-1 (проти коефіцієнта "n") в оцінювачах поширення вибірки стає очевидним, коли n падає від 3 до 2 до 1!

Все залежить від того, наскільки «лежить» людина.


Я боюся, що ви можете говорити про різного роду упередження, ніж у питанні. Чи можете ви спробувати бути більш конкретними щодо того, що таке упередженість? Ви пишете про "потенційні ухили в методі оцінки", і це, здається, не відповідає визначенню упередженості (наведеному в запитанні та відповідях вище). Зрештою, це робить вашу відповідь заплутаною ...
Тім

@Tim, першим кроком було просто забезпечити охоплення людських упереджень. Другим кроком було (і частково слідує питанням кроку 1), щоб переконатися, що навчання непростої людини вже не було обрано метод X (неупереджений). наприклад, стандартне відхилення становить 1 / n * сума ((середнє значення x) ^ 2), але це (обережно) не розрізняє сукупність і вибірку. Більшість «непрофесійних людей» навчаються недумній версії 1 / (N-1) для вибірки. Якщо у вас є лише один метод, у вас (непрофесіонала) немає жодного вибору зробити, тому зміщення оцінки не може бути проблемою ... Це крок Крюгера-Даннінга.
Філіп Оуклі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.