Останнім часом я намагаюся дізнатися більше про онлайн-навчання (це абсолютно захоплююче!), І одна тема, яку мені не вдалося зрозуміти, - як думати про вибір моделі в офлайні та в Інтернеті. В Зокрема, припустимо , що ми тренуємо класифікатор в автономному режимі, на основі деякого фіксованого набору даних . Скажімо, його характеристики продуктивності здійснюється за допомогою перехресної перевірки, скажімо, і ми вибираємо найкращий класифікатор таким чином.
Це те, про що я думав: як же тоді ми з вами застосуємо до он-лайн налаштувань? Чи можемо ми припустити, що кращий знайдений в режимі офлайн, також буде добре працювати в режимі онлайн-класифікатора? Чи є сенс зібрати деякі дані для навчання , а потім взяти той самий класифікатор і "оперувати" його в онлайн-налаштуваннях з тими самими параметрами, що знаходяться на , чи може бути інший підхід кращим? Які застереження в цих випадках? Які ключові результати тут? І так далі.
У будь-якому випадку, зараз це там, я думаю, що я шукаю - це деякі довідники або ресурси, які допоможуть мені (і, сподіваюся, інші, хто думав про цю своєрідну річ!) Зробити перехід від мислення виключно в офлайн-терміні, і розвивати ментальні рамки, щоб міркувати над проблемою вибору моделі та цими питаннями більш цілісно, по мірі прочитання мого читання.