R2
R2R2
Чому це? Дозвольте проілюструвати на прикладі з власного досвіду (незначні деталі змінені).
R2
R2
R2
R2
Що призводить до цих великих відмінностей у очікуванні? Контекст. Цей розпливчастий термін охоплює велику область, тому дозвольте спробувати розділити його на деякі більш конкретні фактори (це, мабуть, неповно):
1. Що таке виплата / наслідок / застосування?
R2
R2птахів. До кількох десятиліть тому в США точність близько 85% вважалася високою. Сьогодні цінність досягнення найвищої точності - близько 99%? Заробітна плата, яка, очевидно, може становити від 60 000 до, можливо, 180 000 доларів на рік (виходячи з швидкого гуглінгу). Оскільки люди все ще обмежені у швидкості, з якою вони працюють, алгоритми машинного навчання, які можуть досягти подібної точності, але дозволяють сортування проходити швидше, можуть коштувати мільйони.
(Сподіваюся, вам сподобався приклад - альтернатива була гнітючою щодо дуже сумнівної алгоритмічної ідентифікації терористів).
2. Наскільки сильним є вплив немодельованих факторів у вашій системі?
R2
3. Наскільки точними та точними є ваші вимірювання?
R2
4. Складність моделі та узагальнення
R2R2
R2R2
ІМО, перевиконання напрочуд часто зустрічається у багатьох сферах. Як найкраще цього уникнути - це складна тема, і я рекомендую прочитати про процедури регуляризації та вибір моделі на цьому веб-сайті, якщо вас це цікавить.
5. Діапазон даних та екстраполяція
R2
Окрім цього, якщо ви пристосуєте модель до набору даних і вам потрібно передбачити значення поза межами діапазону X цього набору даних (тобто екстраполяту ), ви можете виявити, що його ефективність нижча, ніж ви очікували. Це тому, що відносини, які ви оцінили, цілком можуть змінитися за межами відповідного діапазону даних. На малюнку нижче, якщо ви проводили вимірювання лише в діапазоні, зазначеному зеленим полем, ви можете уявити, що пряма (червона) лінія добре описувала дані. Але якщо ви спробували передбачити значення за межами цього діапазону за допомогою цієї червоної лінії, ви були б абсолютно невірними.
[Фігура є відредагованою версією цієї , знайденої за допомогою швидкого пошуку Google для "Кривої Монода".]
6. Метрики дають вам лише частину картини
Це насправді не є критикою метрик - вони резюме , а це означає, що вони також викидають інформацію за задумом. Але це означає, що будь-яка окрема метрика залишає поза інформацією, яка може мати вирішальне значення для її інтерпретації. Хороший аналіз враховує більше, ніж одну метрику.
Пропозиції, виправлення та інші відгуки вітаються. І інші відповіді теж, звичайно.