Уявіть, що у вас купка насіння кріпиться на скляній тарілці, яка горизонтально лежить на столі. Через те, як ми зазвичай думаємо про космос, було б сміливо сказати, що ці насіння живуть у двовимірному просторі, більш-менш, тому що кожне насіння може бути ідентифіковане за двома числами, які дають координати цього насіння на поверхні стакан.
Тепер уявіть, що ви берете тарілку і нахиляєте її по діагоналі вгору, щоб поверхня скла більше не була горизонтальною щодо землі. Тепер, якщо ви хотіли знайти одне насіння, у вас є пара варіантів. Якщо ви вирішите проігнорувати скло, то, здавалося б, кожне насіння плаває в тривимірному просторі над таблицею, і тому вам потрібно буде описати місце кожного насіння, використовуючи три числа, по одному для кожного просторового напрямку. Але лише нахиливши склянку, ви не змінили факту, що насіння все ще живуть на двовимірній поверхні. Таким чином, ви могли б описати, як поверхня скла лежить у тривимірному просторі, а потім ви могли б описати розташування насіння на склі, використовуючи свої початкові два виміри.
У цьому мисленому експерименті скляна поверхня схожа на низькомірний колектор, який існує у просторі більш високого розміру: як би ви не обертали пластину в трьох вимірах, насіння все ще живуть уздовж поверхні двовимірної площини.
Приклади
Більш загально, низькомірний колектор, вбудований у простор більш високого розміру, - це лише сукупність точок, які з будь-якої причини вважаються пов'язаними або частиною одного набору. Зокрема, колектор може бути дещо викривлений у просторі більш високого розміру (наприклад, можливо поверхня скла викривлена у форму чаші замість форми пластини), але колектор все ще в основному маломірний. Особливо у просторовому просторі цей колектор може приймати багато різних форм і форм, але, оскільки ми живемо в тривимірному світі, важко уявити приклади, які мають більше трьох вимірів. Однак як зразок враховуйте наступні приклади:
- шматок скла (плоский, двовимірний) у фізичному просторі (тривимірний)
- єдина нитка (одновимірна) в шматку тканини (двовимірна)
- шматок тканини (двовимірний) зім'ятий в пральній машині (тривимірний)
До загальних прикладів багатообразів в машинному навчанні (або принаймні множини, які гіпотезуються, що живуть уздовж маловимірних багатообразий), включають:
- зображення природних сцен (зазвичай ви не бачите зображень білого шуму, наприклад, це означає, що "природні" зображення не займають всього простору можливих конфігурацій пікселів)
- природні звуки (подібний аргумент)
- людські рухи (людське тіло має сотні градусів свободи, але руху, здається, живуть у просторі, який можна ефективно представити, використовуючи ~ 10 вимірів)
Навчання багатоманітності
Багаторазове припущення в машинному навчанні полягає в тому, що замість того, щоб припускати, що дані у світі можуть надходити з кожної частини можливого простору (наприклад, простору всіх можливих 1-мегапіксельних зображень, включаючи білий шум), має більше сенсу припускати що дані тренінгу надходять із відносно маломірних колекторів (як скляна тарілка з насінням). Тоді вивчення структури багатоманітника стає важливим завданням; крім того, таке навчальне завдання здається можливим без використання мічених даних про навчання.
Існує багато, багато різних способів пізнання структури багатовимірного колектора. Одним з найбільш широко використовуваних підходів є PCA, який передбачає, що колектор складається з єдиної еліпсоїдальної "краплі", подібної до форми млинця або сигари, вбудованої у просторі більш високого розміру. Більш складні методи, такі як ізомапа, ICA або рідке кодування, послаблюють деякі з цих припущень різними способами.
Навчальне навчання
Причина того, що багатозначне припущення є важливим у навчанні, яке знаходиться під наглядом, є двома. Для багатьох реалістичних завдань (наприклад, визначення того, чи показують пікселі на зображенні 4 або 5), у світі є набагато більше даних без міток (наприклад, зображень, які можуть мати в них цифри), ніж із мітками (наприклад, зображення, явно позначені "4" або "5"). Крім того, в пікселях зображень доступно більше інформації на порядок більше, ніж в мітках зображень, що мають мітки. Але, як я описав вище, природні зображення насправді не відбираються за рахунок рівномірного розподілу по конфігураціях пікселів, тому, мабуть, існує певне багатоманіття, яке фіксує структуру природних зображень.Коли зображення, що містять 5s, також лежать на різному, але сусідньому колекторі, то ми можемо спробувати розробити уявлення для кожного з цих колекторів, використовуючи лише дані пікселів, сподіваючись, що різні колектори будуть представлені з використанням різних вивчених особливостей даних. Потім, пізніше, коли у нас є кілька бітів даних міток, ми можемо використовувати ці біти для простого нанесення міток до вже визначених колекторів.
Більшість цього пояснення виходить із роботи з глибокої та художньої літератури. Йошуа Бенджо та Ян Лекун - див. Підручник з вивчення енергетики має особливо доступні аргументи у цій галузі.