Що розуміється під стандартною помилкою максимальної оцінки ймовірності?


21

Я математик, який самостійно вивчає статистику і бореться особливо з мовою.

У книзі, яку я використовую, є така проблема:

Випадкова величина X задається як Pareto(α,60) -розподілений з α>0 . (Звичайно, ви можете взяти будь-який розподіл залежно від одного параметра заради цього питання.) Потім дається вибірка з п'яти значень 14 , 21 , 6 , 32 , 2 .

Перша частина: «Використання методу максимальної правдоподібності, знайти оцінку & alpha ; з & alpha ; на основі [зразок].» Це не було проблем. Відповідь & alpha ; ≈ 4,6931 .α^αα^4.6931

Але тоді: «Дайте оцінку стандартної помилки альфаα^

Що мається на увазі під цим? Так як α просто фіксоване число, я не бачу, яким чином це може мати стандартну помилку. Можу чи я визначити стандартне відхилення паретовской ( & alpha ; , 60 ) ?α^Pareto(α^,60)

Якщо ви вважаєте, що питання не зрозуміле, ця інформація допомогла б і мені.


Що означає ? 60
Алекос Пападопулос

У вас є формула для альфа ? Це допоможе вам оцінити його стандартну помилку. α^
soakley

1
@Glen_b Але якщо це була нижня межа, як могло бути, що всі значення реалізованої вибірки менші?
Алекос Пападопулос

1
@Alecos Це прекрасний момент. Мій коментар не має сенсу; Я її видалив.
Glen_b -Встановіть Моніку

1
@ Алекос: - розподіл з щільністю f ( x ) = α λ αPareto(α,λ) . f(x)=αλα(λ+x)α+1
Стефан

Відповіді:


17

Інша відповідь охоплює виведення стандартної помилки, я просто хочу допомогти вам у позначенні:

Ваша плутанина пов’язана з тим, що в статистиці ми використовуємо точно такий же символ для позначення Оцінювача (який є функцією), а також конкретну оцінку (яка є значенням, яке оцінювач приймає, коли отримує як вхід конкретний реалізований зразок).

Таким чином , α = ч ( Х ) і α ( Х = х ) = 4,6931 для ї = { 14 ,α^=h(X)α^(X=x)=4.6931 . Таким чином , α ( X ) є функцією випадкових величин і так самої випадкової величини, щобезумовномає дисперсію. x={14,21,6,32,2}α^(X)

За оцінкою ML, у багатьох випадках ми можемо обчислити асимптотичну стандартну помилку, оскільки кінцевий вибірковий розподіл оцінювача не відомий (неможливо отримати).

Строго не має асимптотичну розподіл, так як вона сходиться до дійсного числа (справжнє число майже у всіх випадках оцінки ML). Але кількість α^сходиться до нормальної випадкової величини (шляхом застосування центральної граничної теореми).n(α^α)

Друга точка нотаціонной плутанини : більшість, якщо не всі тексти, писатимуть ( «аварский» = асимптотическую дисперсію ") , а то , що вони мали в виду це аварский ( Avar(α^), тобто вони відносяться до асимптотичної дисперсії величиниAvar(n(α^α)),НЕ альфа ... Для випадку основного розподілу Парето ми маємоn(α^α)α^

Avar[n(α^α)]=α2

і так

Avar(α^)=α2/n

(Але то , що ви знайдете написане ) Avar(α^)=α2

Тепер, в якому сенсі оцінювач α має «асимптотическую дисперсію», так як сказано, асимптотично сходиться до константи? Ну, у приблизному розумінні та для великих, але кінцевих зразків. Тобто десь посеред "малого" вибірки, де Оцінювач - випадкова величина з (як правило) невідомим розподілом, і "нескінченна" вибірка, де оцінювач є постійною, є ця "велика, але кінцева територія вибірки", де Оцінювач ще не став постійним, і де його розподіл і дисперсія виведено в обхідному напрямку, спочатку використовуючи теорему центрального граничного значення, щоб отримати правильно асимптотичний розподіл величини Z = α^ (який є нормальним зза CLT), а потім повернути речі навколо і писати α = 1Z=n(α^α) (при прийомі один крок назад і лікувань п , як кінцеві)який показує , & alpha ; в якості афінної функції нормального випадкової величини Z , і тому зазвичай себе розподілений (завжди приблизно).α^=1nZ+αnα^Z


+1 для розрізнення між альфа і α^- звичайнопозначення може бути несумісними. n(α^α)
Нейт-папа

21

- це оцінка максимальної правдоподібності - це функція випадкової вибірки, і тому також випадковим(не фіксується). Оцінка стандартної помилки & alpha ; може бути отримана з інформації Фішера,α^α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

Де - параметр, а L ( θ | Y = y ) функція вірогідності журналуθL(θ|Y=y) умовна для випадкової вибірки y . Інтуїтивно зрозуміла, що інформація про Фішера вказує на крутість кривизни поверхні вірогідності колоди навколо MLE, і тому кількість «інформації», яку y надає приблизно θ .θyyθ

Для розподілу з єдиною реалізацієюPareto(α,y0) , ймовірність log, де y 0 відома:Y=yy0

Підключення до визначення інформації Фішера, I(α)=1

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
Для зразка{у1,у2,. . . ,Уп}максимальної правдоподібності оцінки α асимптотично розподілені наступним чином: & alpha ; п
I(α)=1α2
{y1,y2,...,yn}α^ деn- розмір вибірки. Оскількиαневідомо, можна підключити
α^nN(α,1nI(α))=N(α,α2n), 
nαщоб отримати оцінку стандартної помилки: SE (α^
SE(α^)α^2/n4.69312/52.1

1
Для вашого другого до останньої α^nN(α,1nI(α))nnα^˙N(α,1nI(α))
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.