Яка різниця між офлайн і онлайн-навчанням ? Це лише питання навчання за всім набором даних (офлайн) порівняно з навчанням поступово (по одному екземпляру)? Які приклади алгоритмів використовуються в обох?
Яка різниця між офлайн і онлайн-навчанням ? Це лише питання навчання за всім набором даних (офлайн) порівняно з навчанням поступово (по одному екземпляру)? Які приклади алгоритмів використовуються в обох?
Відповіді:
Онлайн-навчання означає, що ви це робите під час надходження даних. Офлайн означає, що у вас є статичний набір даних.
Отже, для навчання в Інтернеті ви (як правило) маєте більше даних, але у вас є часові обмеження. Ще одна зморшка, яка може вплинути на онлайн-навчання, - це те, що ваші концепції можуть змінюватися з часом.
Скажімо, ви хочете створити класифікатор для розпізнавання спаму. Ви можете придбати великий корпус електронної пошти, позначити його і навчити класифікатор на ньому. Це було б офлайн-навчання. Або ви можете приймати всю електронну пошту, що надходить у вашу систему, і постійно оновлювати класифікатор (мітки можуть бути дещо складними). Це було б онлайн-навчання.
Термін "онлайн" перевантажений, і тому викликає плутанину в області машинного навчання.
Протилежністю "он-лайн" є пакетне навчання. При пакетному навчанні алгоритм навчання оновлює свої параметри після споживання всієї партії, тоді як при онлайн-навчанні алгоритм оновлює його параметри після вивчення 1 навчального екземпляра. Міні-пакетне навчання - це половина шляху між серійним навчанням на одному кінці та онлайн-навчанням на іншому крайньому рівні.
Крім того, "коли" дані надходять або здатні вони зберігатися чи ні, є ортогональними для онлайн або пакетного навчання.
Навчання в Інтернеті вважається повільнішим для зближення до мінімумів у порівнянні з пакетним навчанням. Однак у випадках, коли весь набір даних не вміщується в пам'яті, використання онлайн-навчання є прийнятним компромісом.
Онлайн-навчання (також називається поступовим навчанням ): ми розглядаємо єдине представлення прикладів. У цьому випадку кожен приклад використовується послідовно таким чином, як це визначено алгоритмом навчання, а потім викидається. Зміни ваги, зроблені на даному етапі, залежать конкретно лише від поданого (поточного) прикладу та, можливо, від поточного стану моделі. Це природна процедура, що відрізняється часом, коли приклади можуть бути доступні не відразу.
Офлайн-навчання : зміни ваги залежать від усього набору даних (навчання), визначаючи функцію глобальних витрат. Приклади використовуються неодноразово, поки не буде досягнуто мінімізації цієї функції витрат.