Це визначення не зовсім застосовне, оскільки ми не завжди припускаємо базовий розподіл. Так що ж насправді модель? Чи можна вважати ГБМ із вказаними гіперпараметрами моделлю? Чи є модель збіркою правил?
Це визначення не зовсім застосовне, оскільки ми не завжди припускаємо базовий розподіл. Так що ж насправді модель? Чи можна вважати ГБМ із вказаними гіперпараметрами моделлю? Чи є модель збіркою правил?
Відповіді:
Нещодавно мене зацікавило те саме питання, і я зрозумів, що в машинному навчанні немає єдиного визначення «моделі». Це сильно залежить від джерел, з якими ви консультуєтесь, а це може бути документація для певної програмної програми, сленг, прийнятий його спільнотою користувачів, або визначення, що використовуються в опублікованих наукових працях, які можуть сильно відрізнятися від журналу до журналу. Більше того, мені довелося навчитися мати на увазі, що такі документи пишуть не просто фахівці з машинного навчання, а й фахівці з інших дисциплін, які мають потребу в застосуванні машинних технологій навчання (таких як візуалізація, різні галузі медицини тощо). . Багато з них не чітко визначають термін "модель", який часто використовується вкрай. Ось лише кілька різних визначень "моделі" Я "
• Статистичні моделі, зокрема статистика, що стосується розподілу ймовірностей.
• Регресійні дані та відповідна статистика.
• Математичні моделі, про які згадував Ніл Слейтер вище.
• Моделі даних, що використовуються в машинному навчанні, такі як стовпці, які використовуються, їх типи даних, джерела даних та інші метадані. Це особливо складно, оскільки взагалі немає нічого математичного в цьому визначенні, на відміну від перших трьох перерахованих я. Для прикладу дивіться всю документацію для «майнінг-моделей SQL Server», які виконують подвійне виконання для цілей машинного навчання.
• Іноді всі вищезазначені визначення розширюються, щоб включати структури машинного навчання, побудовані на основі рівнянь та метаданих, наприклад специфікації нейронних мереж. В інших випадках вони вважаються окремими утвореннями.
Все вищезазначене іноді змішується і поєднується разом, залежно від джерела. Я впевнений, що є інші визначення поняття "модель", я покинув цей список, що ще більше ускладнить справу. Щоб вирішити цю неоднозначність, я намагаюся навчити себе божественним намірам автора кожного разу, коли вони використовують термін «модель». Іноді легко визначити, виходячи з контексту чи сфери, в якій працює автор, але інший раз мені доводиться детально читати статтю чи документацію, перш ніж з’ясувати її. Я б хотів, щоб я міг бути більш визначеним щодо цього, але це дійсно природний нечіткий термін; на це ніколи не буде простої відповіді на один розмір. Я сподіваюся, що це допомагає.
З статті про машинне навчання Amazon
Процес навчання моделі ML включає в себе надання алгоритму ML (тобто алгоритму навчання) навчальних даних, з яких слід вчитися. The term ML model refers to the model artifact that is created by the training process.
Мені подобається визначення машинного навчання, яке дав Том Мітчелл .
Кажуть, що комп'ютерна програма вивчає досвід Е щодо деякого класу завдань Т та міри ефективності Р, якщо його ефективність у завданнях T, виміряна P, покращується з досвідом E.
Отже, з огляду на це визначення, я повинен сказати, що моделлю є набутий досвід після занять деяким класом Т.
Модель, вільно кажучи, - це спрощення якоїсь речі чи процесу. Наприклад, форма Землі насправді не є сферою, але ми можемо трактувати її як єдину, якщо розробляємо глобус. Аналогічно, якщо припустити, що Всесвіт є детермінованою, існує певний природний процес, який визначає, чи буде клієнт купувати товар на веб-сайті. Ми можемо побудувати щось, що наближає цей процес, і ми могли б дати деяку інформацію про замовника і яка підкаже нам, якщо він думає, що клієнт придбає товар.
Тоді "модель машинного навчання" - це модель, побудована системою машинного навчання.
(Вибачте, що це не сувора відповідь, але я сподіваюся, що це все-таки корисно.)
У парадигмі машинного навчання модель посилається на математичне вираження параметрів моделі разом із власниками місць введення для кожного категорії прогнозування, класу та дії відповідно до регресії, класифікації та посилення.
Цей вираз вкладено в єдиний нейрон як модель.
Для одношарової персептронної та глибокої моделі навчання потрібно витягти цю модель, обережно пройшовши нейрони та шари, щоб впорядковане збирати та зшити функцію активації.
У машинному навчанні модель є центром ваги, і все обертається навколо моделі. Хоча різні люди мають різні визначення моделі. Але, на мою думку, тут ми можемо найкраще визначити модель "модель в машинному навчанні - це гіпотеза, яка намагається підходити до даних і вчитися передбачати небачені дані".
У машинному навчанні модель - це абстракція, яка може виконувати передбачення, (повторну) дію або перетворення на екземпляр вхідних значень або відносно них. Модель може бути єдиним числом, таким як середнє значення набору спостережень, яке часто використовується в якості базової моделі, поліноміального виразу або набору правил (наприклад, дерево рішень), що визначають, як отримати генерування результату.
Взагалі модель визначається набором правил і гіперпараметрів, які визначають структуру та здатність моделі, оптимізовану для виконання задачі. Гіперпараметром може бути ступінь многочлена або глибина дерева рішень. Модель може бути піддана процесу оптимізації, де параметри оптимізовані відповідно до певної мети.
Процес оптимізації часто називають навчанням пристосуванню та результатам пристосованої моделі, яку також можна просто назвати моделлю. Якщо модель була навчена або не часто її потрібно виводити з контексту.
Це весела дискусія! Мої два центи полягають у тому, що в моделі зберігається інформація, яку комп'ютер може інтерпретувати для оцінки відображень із деякого набору можливих входів до набору відповідних виходів. Модель є не більш-менш, ніж визначення простої функції, яка наближає до більш складної функції. Не потрібно, щоб складна функція була явищем у реальному світі, лише щоб модель апроксимувала складну функцію, не зберігаючи достатньої інформації, щоб її відтворити ідеально.