Лінійна модель регресії, яка найкраще підходить для даних з помилками


9

Я шукаю алгоритм лінійної регресії, який найбільше підходить для даних, незалежна змінна (x) яких має постійну помилку вимірювання, а залежна змінна (y) має помилку, залежну від сигналу.

введіть тут опис зображення

Наведене вище зображення ілюструє моє запитання.


1
Якщо постійна змінна x має постійну похибку вимірювання, а помилки використовуються лише для відносного зважування змінних, чи не ця ситуація рівнозначна помилкам у x?
pedrofigueira

2
@pedro Це не так, оскільки помилки в це не просто ваги у формулі. При регресії змінних помилок у змінних пристосуваннях будуть відрізнятися, а оцінки коваріації параметрів будуть відрізнятися від звичайних регресій. x
whuber

1
Дякую за роз’яснення. Чи можете ви трохи розширити, чому це так?
pedrofigueira

Відповіді:


2

Похибка вимірювання у залежній змінній

Враховуючи загальну лінійну модель з homosckedastic, не автокорельована і некорельована з незалежними змінними, нехай позначає "справжню" змінну, і її спостережуваний захід. Похибка вимірювання визначається як їх різниця Отже, оцінною моделлю є: Оскільки є спостерігається, ми можемо оцінити модель за OLS. Якщо похибка вимірювання у статистично не залежить від кожної пояснювальної змінної, то

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xky(e+ε)має ті самі властивості, що і і звичайні процедури виводу OLS ( статистика тощо) є дійсними. Однак у вашому випадку я б очікував, що розширення . Ви можете використовувати:εte
  • зваженої оцінки по методу найменших квадратів (наприклад , Кутнер і ін. , §11.1; Verbeek , §4.3.1-3);

  • МНК - оцінка, яка по - , як і раніше несмещенной і заможної, і гетероскедастичності-послідовної стандартні помилки, або просто Wite стандартних помилок ( Verbeek , §4.3.4).

Похибка вимірювання в незалежній змінній

Враховуючи ту ж лінійну модель, що і вище, нехай позначає значення "справжнє", а його міру, яку можна спостерігати. Похибка вимірювання тепер: Існують дві основні ситуації ( Wooldridge , §4.4.2).xkxk

ek=xkxk
  • Cov(xk,ek)=0 : похибка вимірювання некорельована із спостережуваною мірою і тому повинна бути співвіднесена із незарезервованою змінною ; написання та підключення цього до (1): оскільки і обидва некорельовані з кожним , включаючи , вимірювання просто збільшує відхилення помилок і порушує жодне з припущень OLS;xkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • Cov(xk,ηk)=0 : похибка вимірювання некорельована із незазначеною змінною і тому повинна бути співвіднесена із спостережуваною мірою ; таке співвідношення спричиняє проблеми і регресія OLS на як правило, дає необ'єктивні та неузгоджені оцінки.xkyx1,,xk

Наскільки я можу здогадатися, дивлячись на ваш сюжет (помилки, зосереджені на "справжніх" значеннях незалежної змінної), міг би застосувати перший сценарій.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.