(Чому) SOM у стилі Kohonen не прихильнився?


33

Наскільки я можу сказати, СМС у стилі Кохонена мав пік ще в 2005 році і останнім часом не відчував такої великої прихильності. Я не знайшов жодної статті, в якій було б сказано, що СОМ були заміщені іншим методом, або що було б еквівалентним чомусь іншим (у більших розмірах, як би там не було). Але схоже, що tSNE та інші методи отримують набагато більше чорнила зараз, наприклад, у Вікіпедії або в SciKit Learn, і SOM згадується більше як історичний метод.

(Насправді, стаття у Вікіпедії, схоже, вказує на те, що СОМ продовжують мати певні переваги перед конкурентами, але це також найкоротший запис у списку. EDIT: За запитом Гунга, одна з статей, про яку я думаю, - це: Нелінійне зменшення розмірності. Зауважте, що про SOM менше написано про це, ніж про інші методи. Я не можу знайти статтю, в якій згадувалося про перевагу, яку, схоже, зберігають SOM над більшістю інших методів.)

Будь-які уявлення? Хтось інший запитав, чому SOM не використовуються, і отримав посилання з деякого часу тому, і я знайшов провадження на конференціях SOM, але мені було цікаво, чи зростання SVM або tSNE та ін, просто затьмарило SOM у поп-машинному навчанні.

EDIT 2: За чистим збігом обставин я сьогодні читав опитування 2008 року про зменшення нелінійної розмірності цього вечора, і для прикладів він згадує лише: Isomap (2000), локально лінійне вбудовування (LLE) (2000), Hessian LLE (2003), Laplacian eigenmaps (2003) та напіввизначене вбудовування (SDE) (2004).


3
Чи можете ви зв’язатись із будь-яким із ресурсів, на які ви посилаєтесь? (Наприклад, яка стаття у Вікіпедії "начебто вказує на ..."?)
gung - Відновіть Моніку

11
Вони, схоже, не прихильні до такої міри, що я не знаю, на що йдеться у SOM.
Меттью Друрі

5
мабуть, самоорганізуюча карта
Крістоф Ганк

SOM - лише варіант багатовимірного масштабування (MDS), який набагато старіший.
kjetil b halvorsen

@kjetilbhalvorsen: Чи є у вас якісь посилання на SOM та MDS? Як я розумію, MDS має глобальний характер (пов'язаний з PCA), тоді як SOM є локальним. А може, я їх неправильно розумію.
Уейн

Відповіді:


18

Думаю, ви щось досягаєте, відзначаючи вплив того, що в даний час машинне навчання сприймається як "найкращі" алгоритми зменшення розмірності. Хоча t-SNE виявив свою ефективність у змаганнях, таких як Merck Viz Challenge , я особисто мав успіх у впровадженні SOM як для вилучення функцій, так і для бінарної класифікації. Хоча, безумовно, є такі, хто відхиляє СОМ без обґрунтування, окрім віку алгоритму (ознайомтеся з цією дискусією , також є ряд статей, які були опубліковані протягом останніх кількох років, де впроваджені СОМ та досягнуто позитивних результатів (див. Мортазаві та ін., 2013 ; Frenkel et al., 2013наприклад). Пошук Google Академії виявить, що SOM все ще використовуються в ряді областей додатків. За загальним правилом, однак, найкращий алгоритм для конкретного завдання - це саме той - найкращий алгоритм для конкретного завдання. Якщо випадковий ліс, можливо, добре працював для певної задачі бінарної класифікації, він може жахливо виконувати іншу. Це ж стосується завдань кластеризації, регресії та оптимізації. Це явище пов'язане з теоремою "Безкоштовний обід" , але це тема для іншого обговорення. Підсумовуючи, якщо SOM найкраще працює для вас у певній задачі, це алгоритм, який ви повинні використовувати для цього завдання, незалежно від популярності.


5

Я провів дослідження щодо порівняння СОМ з t-SNE та іншим, а також запропонував покращення щодо SOM, що підніме його на новий рівень ефективності. Будь ласка, перевірте це і дайте мені знати ваші відгуки. Дуже хотілося б отримати уявлення про те, що люди думають про це, і чи варто публікувати в python, щоб люди могли його використовувати.

Посилання IEEE на папір: http://ieeexplore.ieee.org/document/6178802/

Реалізація Matlab. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase

Дякуємо за ваш відгук.


4
Ласкаво просимо в Cross Valified! Це допоможе дати короткий підсумок ваших висновків та покращення, яке ви зробили, а також, можливо, вирішити це питання безпосередньо.
Scortchi

1

Моє суб’єктивне бачення полягає в тому, що СОМ менш відомі і сприймаються як менш "сексуальні", ніж багато інших методів, але все ще дуже актуальні для певних класів проблем. Цілком може статися так, що вони мали б вагомий внесок, якби вони широко використовувались. Вони є неоціненними на ранніх етапах науково-дослідних даних для того, щоб відчути «ландшафт» або «топологію» багатоваріантних даних.

Розвиток таких бібліотек, як Somoclu , та такі дослідження, як Гуенаел Кабанес (серед багатьох інших), показують, що СОМ все ще актуальні.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.