Я шукаю алгоритм лінійної регресії, який найбільше підходить для даних, незалежна змінна (x) яких має постійну помилку вимірювання, а залежна змінна (y) має помилку, залежну від сигналу.
Наведене вище зображення ілюструє моє запитання.
Я шукаю алгоритм лінійної регресії, який найбільше підходить для даних, незалежна змінна (x) яких має постійну помилку вимірювання, а залежна змінна (y) має помилку, залежну від сигналу.
Наведене вище зображення ілюструє моє запитання.
Відповіді:
Похибка вимірювання у залежній змінній
Враховуючи загальну лінійну модель з homosckedastic, не автокорельована і некорельована з незалежними змінними, нехай позначає "справжню" змінну, і її спостережуваний захід. Похибка вимірювання визначається як їх різниця Отже, оцінною моделлю є: Оскільки є спостерігається, ми можемо оцінити модель за OLS. Якщо похибка вимірювання у статистично не залежить від кожної пояснювальної змінної, то
зваженої оцінки по методу найменших квадратів (наприклад , Кутнер і ін. , §11.1; Verbeek , §4.3.1-3);
МНК - оцінка, яка по - , як і раніше несмещенной і заможної, і гетероскедастичності-послідовної стандартні помилки, або просто Wite стандартних помилок ( Verbeek , §4.3.4).
Похибка вимірювання в незалежній змінній
Враховуючи ту ж лінійну модель, що і вище, нехай позначає значення "справжнє", а його міру, яку можна спостерігати. Похибка вимірювання тепер: Існують дві основні ситуації ( Wooldridge , §4.4.2).
: похибка вимірювання некорельована із спостережуваною мірою і тому повинна бути співвіднесена із незарезервованою змінною ; написання та підключення цього до (1): оскільки і обидва некорельовані з кожним , включаючи , вимірювання просто збільшує відхилення помилок і порушує жодне з припущень OLS;
: похибка вимірювання некорельована із незазначеною змінною і тому повинна бути співвіднесена із спостережуваною мірою ; таке співвідношення спричиняє проблеми і регресія OLS на як правило, дає необ'єктивні та неузгоджені оцінки.
Наскільки я можу здогадатися, дивлячись на ваш сюжет (помилки, зосереджені на "справжніх" значеннях незалежної змінної), міг би застосувати перший сценарій.