Яке співвідношення між оцінкою та оцінкою?


21

Яке співвідношення між оцінкою та оцінкою?


5
"У статистиці оцінювач - це правило для обчислення оцінки даної кількості на основі спостережуваних даних: таким чином правило і його результат (оцінка) розрізняються." (Перший рядок статті у Вікіпедії en.wikipedia.org/wiki/Estimator ).
whuber

+1 Я підтримую це питання (незважаючи на наявність чітко сформульованої відповіді на очевидній сторінці Вікіпедії), оскільки початкові спроби відповіді на нього тут вказували на деякі тонкощі.
whuber

@whuber, чи можу я сказати, що параметри моделі є оцінкою?
авокадо

2
@loganecolss Оцінювач - це математична функція. Це відрізняється від значення (оцінки), яке воно може отримати для будь-якого набору даних. Один із способів оцінити різницю - зазначити, що певні набори даних дають однакові оцінки , скажімо, нахилу в лінійній регресії, використовуючи різні оцінювачі (наприклад, Максимальна ймовірність або Ітеративно переоцінені найменші квадрати). Без відмежування оцінок від оцінок, які використовуються для виготовлення цих оцінок, ми не зможемо зрозуміти, що це твердження навіть говорить.
whuber

@whuber, навіть з одним певним набором даних D , різні оцінки також можуть давати різні оцінки, чи не так?
авокадо

Відповіді:


13

Ел Леманн у своїй класичній теорії оцінки точки відповідає на це запитання на с. 1-2.

Спостереження тепер постулюються як значення, прийняті за випадковими змінними, які, як передбачається, слідують спільному розподілу ймовірностей, П , що належать до деякого відомого класу ...

... давайте зараз спеціалізуємося на точковій оцінці ... припустимо, що є реально оціненою функцією, визначеною [для обумовленого класу розподілів], і що ми хотіли б знати значення g [за будь-якого фактичного розподілу в ефект, θ ]. На жаль, θ , а значить, g ( θ ) , невідомо. Однак дані можуть бути використані для отримання оцінки g ( θ ) , значення, яке, сподіваючись, буде близьким до g ( θ ) .ггθθg(θ)g(θ)g(θ)

Словом: оцінювач - це певна математична процедура, яка придумує число ( оцінку ) для будь-якого можливого набору даних, які може дати певна проблема. Це число призначене для відображення певної чисельної властивості ( ) процесу генерації даних; ми можемо назвати це "оцінкою".g(θ)

Сам оцінювач не є випадковою змінною: це лише математична функція. Однак оцінка, яку вона виробляє, базується на даних, які самі моделюються як випадкові величини. Це перетворює оцінку (вважаючи її залежною від даних) у випадкову змінну, а конкретна оцінка для певного набору даних стає реалізацією цієї випадкової величини.

В одній (звичайній) звичайній формулі найменших квадратів дані складаються з упорядкованих пар . Х я була визначена експериментатором (вони можуть бути кількості лікарського засобу , що вводиться, наприклад). Кожен рік я (відповідь на препарат, наприклад) , як передбачається, відбуваються з розподілу ймовірностей , що є нормальним , але з невідомих середнім ц я і загальної дисперсією сг 2 . Крім того, передбачається, що засоби пов'язані з x i за допомогою формули μ i = β 0(xi,yi)xiyiμiσ2xi . Ці три параметри - σ , β 0 і β 1 - визначають базовий розподіл y i для будь-якого значення x i . Томубудь-якувластивість такого розподілу можна розглядати як функцію ( σ , β 0 , β 1 ) . Прикладами таких властивостей є перехоплення β 0 , нахил β 1 , значення cos ( σ + βμi=β0+β1xiσβ0β1yixi(σ,β0,β1)β0β1, або навіть середнє значення при значенніx=2, яке (згідно з цим формулюванням) повинно бутиβ0+2β1.cos(σ+β02β1)x=2β0+2β1

У цьому контексті МНК, А НЕ-приклад з оцінки буде процедура вгадати при значенні , якщо х були встановлено рівним 2. Це НЕ блок оцінки , оскільки це значення у є випадковим (таким чином , повністю відокремити від випадковість даних): це не є (певною числовою) властивістю розподілу, хоча воно пов'язане з цим розподілом. (Як ми тільки що бачили, хоча, очікування від у для ї = 2 , рівними & beta ; 0 + - β 1 , може бути оцінений.)yxyyx=2β0+2β1

У формулюванні Леманна майже будь-яка формула може бути оцінником практично будь-якої властивості. Не існує притаманного математичного зв’язку між оцінкою та оцінкою. Однак ми можемо заздалегідь оцінити шанс того, що оцінювач буде досить близьким до тієї кількості, яку він планує оцінити. Способи цього зробити і як їх використовувати, є предметом теорії оцінки.


1
(+1) Дуже точна і детальна відповідь.
chl

2
Чи не сама функція випадкової величини також є випадковою змінною?
jsk

@jsk Я думаю , що різниця , яке я намагався зробити тут можуть бути уточнені з урахуванням складу функцій Перша функція - випадкова величина X ; другий (називаємо його t ) тут називається оцінкою , а склад двох t X : Ω R - це "оцінка" або "процедура оцінки", яка - як ви правильно говорите - випадкова змінна.
ΩRnR.
Xt
tX:ΩR
whuber

1
@whuber У своєму дописі ви говорите "Сам оцінювач не є випадковою змінною". Я спробував редагувати вашу публікацію, щоб уточнити точку, з якою ви і, здається, погоджуєтесь, але, схоже, хтось відхилив мою редакцію. Можливо, вони віддадуть перевагу вашій редакції!
jsk


7

Якщо коротко: оцінювач - це функція, а оцінка - це значення, яке підсумовує спостережуваний зразок.

Оцінка є функцією , яка відображає випадкову вибірку для оцінки параметра:

Зауважимощо блок оцінки зпвипадкових величинХ1,Х2,. . . ,Хпє випадковою величиною Θ . Наприклад, оцінювачем є середнє значення вибірки: ¯ X =1

Θ^=t(X1,X2,...,Xn)
X1,X2,...,XnΘ^оцінка θ є результатом застосування функції оцінювання до нижнього регістра спостерігається вибірких1,х2,. . . ,xn:
X¯=1nn=1nXi
θ^x1,x2,...,xn

Наприклад, оцінку спостережуваного зразках1,х2,. . . ,Хпє вибіркове середнє: μ = ¯ х =1

θ^=t(x1,x2,...,xn)
x1,x2,...,xn
μ^=x¯=1nn=1nxi

Оцінювач RV, тоді як оцінка є постійною?
Parthiban Rajendran

Чи не ваш висновок суперечить @ @uber? Тут ви кажете, що оцінювач RV, але whuber говорить інакше.
Parthiban Rajendran

Так, я не згоден із твердженням @ whuber "Сам оцінювач не є випадковою змінною: це лише математична функція". Функція випадкової величини також є випадковою змінною. onlinecourses.science.psu.edu/stat414/node/128
Freeman

3

Це може бути корисно проілюструвати відповідь Ваубера в контексті лінійної регресійної моделі. Скажімо, у вас є деякі двовимірні дані, і ви використовуєте звичайні найменші квадрати, щоб створити таку модель:

Y = 6X + 1

У цей момент ви можете взяти будь-яке значення X, підключити його до моделі і передбачити результат, Y. У цьому сенсі ви можете вважати окремі компоненти загальної форми моделі ( mX + B ) як оцінювачі . Вибіркові дані (які, імовірно, ви підключили до загальної моделі для обчислення конкретних значень для m та B вище), послужили основою, на якій можна було скласти оцінки для m та B відповідно.

Відповідно до точок @ whuber у нашій нитці нижче, незалежно від значень Y, визначених набором оцінювачів, у контексті лінійної регресії вважається передбачуваними значеннями.

(відредаговано - кілька разів - для відображення коментарів нижче)


1
Ви чудово визначили провісника. Він тонко (але важливо) відрізняється від оцінювача. Оцінювач у цьому контексті - формула найменших квадратів, яка використовується для обчислення параметрів 1 і 6 з даних.
whuber

Хм, я не мав на увазі це так, @whuber, але я думаю, що ваш коментар ілюструє важливу двозначність моєї мови, яку я раніше не помічав. Основний момент тут полягає в тому, що ви можете вважати загальну форму рівняння Y = mX + B (як використовується вище) як оцінювач, тоді як конкретні передбачувані значення, породжені конкретними прикладами цієї формули (наприклад, 1 + 6X), кошторис. Дозвольте спробувати відредагувати вищезазначений абзац, щоб зафіксувати це відмінність ...
ashaw

btw, я намагаюся пояснити це, не вводячи позначення "капелюх", з яким я стикався в більшості обговорень цього поняття підручником. Можливо, це кращий маршрут зрештою?
ashaw

2
Я думаю, що ви знайшли хороше середовище між точністю та технічністю у своїй оригінальній відповіді: продовжуйте! Капелюшки вам не потрібні, але якщо вам вдасться показати, чим оцінювач відрізняється від інших подібних на вигляд речей, це було б найбільш корисно. Але, будь ласка, зауважте різницю між прогнозуванням значення Y та оцінкою такого параметра, як m або b . Y можна інтерпретувати як випадкову змінну; m і b - ні (за винятком байєсівської обстановки).
whuber

Дійсно, дуже хороший момент щодо параметрів та значень. Ще раз редагування ...
ashaw

0

Припустимо, ви отримали деякі дані, і у вас спостерігалася змінна назва, яка називається theta. Тепер ваші дані можуть бути з розподілу даних, для цього розподілу існує відповідне значення тети, яке ви випливає, що є випадковою змінною. Ви можете використовувати MAP або середнє значення для обчислення оцінки цієї випадкової величини, коли розподіл ваших даних змінюється. Тож випадкова тета змінної відома як оцінка , єдине значення непоміченої змінної для певного типу даних.

Тоді як оцінювач - це ваші дані, що також є випадковою змінною. Для різних типів розподілів у вас є різні типи даних, і, таким чином, ви маєте різні оцінки, і тому ця відповідна випадкова величина називається оцінкою .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.