Інтернет проти офлайн навчання?


38

Яка різниця між офлайн і онлайн-навчанням ? Це лише питання навчання за всім набором даних (офлайн) порівняно з навчанням поступово (по одному екземпляру)? Які приклади алгоритмів використовуються в обох?

Відповіді:


26

Онлайн-навчання означає, що ви це робите під час надходження даних. Офлайн означає, що у вас є статичний набір даних.

Отже, для навчання в Інтернеті ви (як правило) маєте більше даних, але у вас є часові обмеження. Ще одна зморшка, яка може вплинути на онлайн-навчання, - це те, що ваші концепції можуть змінюватися з часом.

Скажімо, ви хочете створити класифікатор для розпізнавання спаму. Ви можете придбати великий корпус електронної пошти, позначити його і навчити класифікатор на ньому. Це було б офлайн-навчання. Або ви можете приймати всю електронну пошту, що надходить у вашу систему, і постійно оновлювати класифікатор (мітки можуть бути дещо складними). Це було б онлайн-навчання.


7
Так, і невелике уточнення полягає в тому, що алгоритми онлайн-навчання, принаймні, як це вивчали в машинному навчанні, здебільшого роблять припущення, що ваша здатність зберігати приклади дуже обмежена порівняно з розміром набору даних. У самому обмежувальному випадку ви бачите лише один приклад за один раз, і тоді вам доведеться забути його після використання ним для оновлення класифікатора.
Харлан

8

Термін "онлайн" перевантажений, і тому викликає плутанину в області машинного навчання.

Протилежністю "он-лайн" є пакетне навчання. При пакетному навчанні алгоритм навчання оновлює свої параметри після споживання всієї партії, тоді як при онлайн-навчанні алгоритм оновлює його параметри після вивчення 1 навчального екземпляра. Міні-пакетне навчання - це половина шляху між серійним навчанням на одному кінці та онлайн-навчанням на іншому крайньому рівні.

Крім того, "коли" дані надходять або здатні вони зберігатися чи ні, є ортогональними для онлайн або пакетного навчання.

Навчання в Інтернеті вважається повільнішим для зближення до мінімумів у порівнянні з пакетним навчанням. Однак у випадках, коли весь набір даних не вміщується в пам'яті, використання онлайн-навчання є прийнятним компромісом.


Я не думаю, що це правда. Ви описуєте алгоритм оптимізації стохастичного (або онлайн) градієнтного спуску, який можна використовувати як для налаштувань проблеми в Інтернеті, так і в режимі офлайн.
danijar

Я вважаю, що "як дані надходять" відноситься до онлайн-та офлайн-алгоритмів en.wikipedia.org/wiki/Online_algorithm Я вважаю, що ОП, які визначаються для онлайн-навчання, чітко визначають це розходження. Інтернет Algos -> обробляти, коли дані надходять. Онлайн-навчання -> поступово оновлювати базову модель під час навчання.
gokul_uf

4

Онлайн-навчання (також називається поступовим навчанням ): ми розглядаємо єдине представлення прикладів. У цьому випадку кожен приклад використовується послідовно таким чином, як це визначено алгоритмом навчання, а потім викидається. Зміни ваги, зроблені на даному етапі, залежать конкретно лише від поданого (поточного) прикладу та, можливо, від поточного стану моделі. Це природна процедура, що відрізняється часом, коли приклади можуть бути доступні не відразу.

Офлайн-навчання : зміни ваги залежать від усього набору даних (навчання), визначаючи функцію глобальних витрат. Приклади використовуються неодноразово, поки не буде досягнуто мінімізації цієї функції витрат.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.