Припустимо, у мене є панель пояснювальних змінних , для , , а також вектор змінних залежних від бінарних результатів . Тож спостерігається лише в кінцевий час а не в будь-який раніше час. Повністю загальний випадок полягає в тому, щоб мати кілька для для кожної одиниці в кожен момент часу , але для короткості зупинимося на випадку . i = 1 . . . N t = 1 . . . T Y i T Y T X i j t j = 1 ... K i t K = 1
Застосування таких "незбалансованих" пар з часовими корельованими пояснювальними змінними є, наприклад, (щоденні ціни на акції, квартальні дивіденди), (щоденні звіти про погоду, щорічні урагани) або (особливості шахової позиції після кожного ходу, результат виграшу / втрати при кожному кінець гри).
Я зацікавлений в (можливо нелінійному) коефіцієнтах регресії для виконання передбачення про , знаючи , що в навчальних даних, враховуючи ранні спостереження для , то це призводить до підсумкового X i t t < T Y i T
Виходячи з економетрики, я не бачив регресійного моделювання, застосованого до таких даних. OTOH, я бачив такі методи машинного навчання, які застосовуються до таких даних:
- здійснення контрольованого навчання для всього набору даних, наприклад мінімізація
просто екстраполюючи / вводячи спостережуване у всі попередні моменти часу
Це відчуває себе "неправильно", оскільки не враховуватиме часову кореляцію між різними моментами.
- робити підкріплення навчання , як тимчасова різниця з параметром навчання та параметром знижки , і рекурсивно вирішувати для шляхом зворотного розповсюдження, починаючи зλ β t t = T
з градієнт щодо . F ( ) & beta ;
Це здається більш "правильним", оскільки воно враховує тимчасову структуру, але параметри і є своєрідними "ad hoc".λ
Запитання : Чи є література про те, як відобразити вищезазначені контрольовані / підкріплюючі методи навчання в регресійну систему, що використовується в класичній статистиці / економетриці? Зокрема, я хотів би мати можливість оцінити параметри за "один раз" (тобто для всіх одночасно), виконавши (нелінійні) найменші квадрати або максимальну ймовірність. на таких моделях, як t = 1 ... T
Мені також було б цікаво дізнатись, чи можна відновити часові різниці мета-параметрів та формулюванням максимальної ймовірності.λ