Чи може корисна регуляризація, якщо нас цікавить лише моделювання, а не прогнозування?


19

Чи може регуляризація бути корисною, якщо нас цікавить лише оцінка (та інтерпретація) параметрів моделі, а не прогнозування чи прогнозування?

Я бачу, як регуляризація / перехресне підтвердження є надзвичайно корисним, якщо ваша мета - зробити хороші прогнози щодо нових даних. Але що робити, якщо ви займаєтеся традиційною економікою, і все, що вам цікаво, це оцінка β ? Чи може перехресне підтвердження також бути корисним у цьому контексті? Концептуальна складність, з якою я стикаюся, полягає в тому, що ми можемо насправді обчислити на тестових даних, але ми ніколи не можемо обчислити оскільки справжня за визначенням ніколи не спостерігається. (Візьмемо за припущення, що навіть існує справжня , тобто, що ми знаємо сімейство моделей, з яких були створені дані.) L ( & beta ; , & beta ; ) & beta ; & beta ;L(Y,Y^)L(β,β^)ββ

Припустимо, ваша втрата . Ви стикаєтеся з ухилом відхилення відхилення, правда? Тож теоретично вам може бути краще зробити деяку регуляризацію. Але як ви можете вибрати параметр регуляризації?L(β,β^)=β-β^

Я би радий побачити простий числовий приклад моделі лінійної регресії з коефіцієнтами β(β1,β2,,βк) , де функція втрати дослідника є, наприклад, β-β^ , або навіть просто (β1-β^1)2 . Як на практиці можна використовувати перехресну перевірку для покращення очікуваних втрат у цих прикладах?


Редагувати : DJohnson вказав мені на https://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdf , що має відношення до цього питання. Автори це пишуть

Методи машинного навчання ... забезпечують дисциплінований спосіб прогнозувати Y^ який (i) використовує самі дані, щоб вирішити, як зробити компроміс відхилення відхилення та (ii) дозволяє здійснити пошук дуже багатого набору змінні та функціональні форми. Але все виходить дорого: потрібно завжди пам’ятати, що оскільки вони налаштовані на Y^ вони не дають (без багатьох інших припущень) дуже корисних гарантій для β^ .

Ще один відповідний документ, знову ж таки завдяки DJohnson: http://arxiv.org/pdf/1504.01132v3.pdf . Ця стаття стосується питання, з яким я боровся вище:

... Основний виклик застосування методів машинного навчання, таких як дерева регресії поза часом, до проблеми причинного висновку полягає в тому, що підходи до регуляризації, засновані на перехресній валідації, зазвичай покладаються на дотримання "основної істини", тобто фактичних результатів. у вибірці перехресної перевірки. Однак якщо нашою метою є мінімізація середньої квадратичної помилки ефектів лікування, ми стикаємося з тим, що [11] називає «фундаментальною проблемою причинного висновку»: причинний ефект не спостерігається для будь-якої окремої одиниці, і тому ми не здійснюємо безпосередньо мати основну правду. Ми вирішуємо це, пропонуючи підходи до побудови неупереджених оцінок середньоквадратичної помилки причинного ефекту лікування.


2
Перехресна перевірка - це лише один метод інструментарію інструментів для вилучення даних та машинного навчання. ML бачить все більш широке використання в економіці - див. Веб-сайт Сьюзен Атей в Стенфорді (вона є академіком, зацікавленою в інтеграції методів МЛ в економіку) або в цьому документі Проблеми з прогнозуванням Клейнберга та ін . cornell.edu/home/kleinber/aer15-prediction.pdf
Майк Хантер

9
Будь ласка, люди, не розлучайте: ML для багатьох пропонує машинне навчання, а для багатьох інших пропонує максимальну ймовірність. (Визначення: ви знаходитесь на стороні машинного навчання, якщо ML автоматично перекладає вас як машинне навчання.)
Нік Кокс

3
@Aksakal мій досвід полягає в тому, що традиційна економетрика, як вона викладається як для студентів нижчих класів, так і для студентів вищих класів, приділяє по суті нульову увагу перехресній валідації. Подивіться на Хаяші, який є класичним підручником. Звичайно, можливо, перехресне підтвердження та компроміс відхилень відхилень згадуються в курсі спеціально щодо прогнозування, але не в основному курсі, який починають усі студенти. Це звучить правильно для вас?
Адріан

2
@ Adrian Я бачу, що люди голосують за закриття цього питання як занадто широкого. Це може бути так, але, як я бачу, ви в основному запитуєте: "Чи може CV бути корисним, якщо нас цікавить лише моделювання, а не прогнозування?" - якщо я вас правильно зрозумів, ваше питання можна легко редагувати та спрощувати, тому воно зрозуміліше і, звичайно, не надто широке (навіть цікаве!).
Тім

2
@ Адріан, тож це дуже цікаве питання! Боюся, ви зробили це надто складним, і посилання на економетрику тут не має вирішального значення (як це відбувається в інших областях, де використовуються статистичні методи). Я б радив вам відредагувати своє питання, щоб спростити його.
Тім

Відповіді:


2

Так, коли ми хочемо необ'єктивні оцінки низької дисперсії. Мені особливо подобається публікація Гунга, яку проблему вирішують методи усадки? Будь ласка, дозвольте мені вставити фігуру Гунга сюди ...

введіть тут опис зображення Якщо ви перевірите зроблений сюжетний гунг, вам буде зрозуміло, для чого нам потрібна регуляризація / усадка. Спочатку мені здається дивно, що для чого нам потрібні необ’єктивні оцінки? Але дивлячись на цю цифру, я зрозумів, що модель з низькою дисперсією має багато переваг: наприклад, вона є більш "стабільною" у виробництві.


Так, але як вибрати параметр регуляризації? Коли мета - мінімізувати помилку передбачення, ми можемо використовувати набір перевірки. Як ми можемо використовувати набір перевірки, якщо ніколи не дотримуємось справжніх параметрів моделі?
Адріан

Дивіться цитату про "фундаментальну проблему причинного висновку" внизу мого питання.
Адріан

1

Чи може перехресне підтвердження бути корисним, якщо нас цікавить лише моделювання (тобто оцінка параметрів), а не прогнозування?

Так, це може. Наприклад, днями я використовував оцінку важливості параметрів через Дерева рішень. Кожен раз, коли я будую дерево, я перевіряю помилку перехресної перевірки. Я намагаюся зменшити помилку наскільки це можливо, тоді я перейду до наступного кроку оцінки важливості параметрів. Можливо, якщо перше дерево, яке ви будуєте, дуже погано, і ви не перевірите помилку, у вас будуть менш точні (якщо не неправильні) відповіді.

Основна причина, на яку я вважаю, пов’язана з великою кількістю контрольних змінних, які має кожна методика. Навіть незначна зміна однієї контрольної змінної забезпечить інший результат.

Як поліпшити модель після перевірки помилки перехресної перевірки? Ну, це залежить від вашої моделі. Сподіваємось, спробувавши кілька разів, ви отримаєте деяке уявлення про найважливіші змінні управління та зможете ними маніпулювати, щоб знайти малу помилку.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.