Звідки взявся термін «вивчити модель»


10

Часто я чув, як шахтарі даних тут використовують цей термін. Як статистик, який працював над проблемами класифікації, я знайомий з терміном "навчити класифікатора", і я припускаю, що "вивчити модель" означає те саме. Я не проти терміна "тренуйте класифікатора". Це, здається, відображає ідею підгонки моделі, оскільки навчальні дані використовуються для отримання хороших або «покращених» оцінок параметрів моделі. Але навчитися означає означає здобувати знання. Простий англійською мовою "вивчити модель" означало б знати, що це таке. Але насправді ми ніколи не знаємо модель. Моделі наближені до реальності, але жодна модель не є правильною. Начебто Box сказав: "Жодна модель не є правильною, але деякі корисні".

Мені було б цікаво почути відповідь шахтарів. Як виник цей термін? Якщо ви використовуєте його, чому вам це подобається?


Найсмішніша частина полягає в тому, що "вивчити модель" означає максимум "запам'ятати всі її параметри" або, таким чином, це неправильно, навіть якщо ви не будете сперечатися, чи "навчання" є хорошим словом. У моїй мові (pl) офіційна номенклатура - це "викладання моделі", хоча "машинне навчання" називається "машинне навчання", а не "машинне навчання".

Бічна панель: Чи є у вас посилання на котировку Box.
ентропія

Відповіді:


8

Я підозрюю, що її джерела знаходяться у дослідницькій спільноті штучних нейронних мереж, де нейронну мережу можна розглядати як вивчення моделі даних за допомогою зміни синаптичних ваг аналогічно тому, що відбувається в людському мозку, як ми самі вчимося досвід. Моя дослідницька кар’єра почалася в штучних нейронних мережах, тому я іноді використовую фразу.

Можливо, це має більше сенсу, якщо ви вважаєте, що модель закодована в параметрах моделі, а не рівняння, так само, як ментальна модель не є ідентифікованою фізичною складовою мозку стільки, скільки набором параметрів. налаштування для деяких наших нейронів.

Зауважте, що не має сенсу, що ментальна модель обов'язково правильна!


1
Ми з моїм керівником дослідження провели це обговорення, і я розмістив питання, пов’язані з цією дискусією, тут stats.stackexchange.com/questions/43559/… . Я зрозумів, що підгонка моделі, навчання, оцінка та навчання просто означають застосування певного методу оптимізації для пошуку найкращих параметрів, що визначають модель конкретної форми.
ентропія

6

Термін досить старий у штучному інтелекті. Тьюринг присвятив довгий розділ «Навчання машини» в його 1950 - обчислювальної техніки і розвідці паперу Ума і якісно описує контрольоване навчання. Оригінальний документ Розенблатта: Перцептрон: ймовірнісна модель зберігання та організації інформації в роботі "Мозг" 1958 року широко розповідає про "Математичну модель навчання". Тут перцептрон був «моделлю навчання»; моделі не були «вивчені».

Папір Піттса та Маккаллоу 1943 року - оригінальний папір "нейронних мереж" - насправді не займався навчанням, тим більше, як можна було побудувати логічне обчислення (як система Гільберта чи Генцен, але я думаю, що вони посилаються на Рассела / Уайтхеда), який може зробити висновок. Я думаю, що саме документ "Perceptrons" ввів числове значення, на відміну від символічного поняття навчання в цій традиції.

Чи можна машині навчитися грати в шахи лише з прикладів? Так. Чи є в ньому модель для гри в шахи? Так. Це оптимальна модель (якщо вона існує)? Майже точно не. Простий англійською мовою я "навчився шахи", якщо я можу грати в шахи нормально - або, можливо, досить добре. Це не означає, що я оптимальний шахіст. Це сенс, в якому Тьюрінг описував "навчання", коли він обговорював вивчення шахів у своїй роботі.

Я дуже не відповідаю тому, яким терміном користуюсь. Так (наприклад) для навчання в межах межі я б сказав "визначити", для навчання в SVM я сказав би "тренуватися", а для MCMC "навчання" я сказав би "оптимізувати". І наприклад, я просто називаю регресію "регресією".


Моє питання полягало не у використанні терміна навчання у класифікації, а у фразі "вивчення моделі". Машинне навчання дуже добре знайоме, але "вивчення моделі" - це фраза, яку я вперше почув тут, на цьому веб-сайті.
Майкл Р. Черник

Я додав туди трохи розмитості, але ти маєш рацію, це не чудова відповідь, я забився на навчання без особливого обговорення "моделі". Я побачу, чи можу сьогодні щось запам’ятати, але можу зняти це сьогодні ввечері, якщо нічого не прийме на думку
Патрік Калдон

Я збирався видалити цю відповідь, але явно мало кому подобається! Я думаю, що це розумний невеликий конспект того, звідки в цьому контексті походить термін "навчання".
Патрік Калдон

+1 Я даю підсумки, тому що хоч і трохи не по суті питання, це пов'язано і цікаво, але я отримав 3 нагороди. Тримайте це.
Майкл Р. Черник

2

Як дослідник біоінтензивного машинного навчання, я повністю погоджуюся з тим, що "жодна модель не є правильною, але деякі корисні", і насправді моделі та формалізми мають сильний збій, як використовують автори, які говорять про оптимізацію проблеми, коли те, що вони роблять - це оптимізація моделі, тобто дослідження простору її параметрів та пошук локального або, сподіваємось, глобального оптимуму. Це взагалі не є оптимальним для реальної проблеми. Хоча розробник моделі, як правило, використовує правильну термінологію та викладає всі припущення, більшість користувачів переглядають припущення, яких, як відомо, найчастіше не дотримуються, а також використовують менш точну мову про "навчання" та "оптимізацію" та " параметризація ".

Я думаю, що ця оптимальна параметризація моделі - це те, що означатиме людина під час машинного навчання, особливо в контрольованому машинному навчанні, хоча я не можу сказати, що я багато чув "вивчити модель" - але це відбувається, і тоді як людина тренує модель, комп'ютер вивчає параметри моделі. Навіть у навчанні без нагляду «навчання» найчастіше є просто параметризацією моделі, і, сподіваємось, «навчання моделі», таким чином, є оптимальною параметризацією моделі (хоча часто різні способи пошуку простору параметрів знаходять різні рішення, хоча вони можуть бути доведені оптимізувати те саме). Я б дійсно скоріше скористався б "навчанням моделі"

Насправді більшість моїх досліджень стосується вивчення моделі з точки зору виявлення кращої моделі, або більш обчислювальної та когнітивно / біологічно / екологічно правдоподібної моделі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.