Чи є клас особи в ImageNet? Чи є заняття, пов’язані з людиною?


14

Якщо я перегляну одне з багатьох джерел для класів Imagenet в Інтернеті, я не можу знайти жодного класу, пов’язаного з людьми (і ні, жнивець - це не той, хто збирає урожай, але це те, що я знав, як тато довгі ноги, такий собі павук :-). Як це можливо? Я б, по крайней мере , очікував personклас, і навіть що - то більш конкретно , такі як man, woman, toddlerі т.д. Нічого подібного. Чому? Чи зробили Фей-Фей Лі та її команда свідомий вибір не мати зображень людей у ​​базі даних? Я дивлюся на неправильний файл? Заради питання ми можемо розглянути ImageNetверсії з 2014 року.

Відповіді:


7

Ви також можете поглянути тут на мітки в imagenet. Напевно, ви праві, в наборі даних немає етикетки для людини, але є що помітити. У imagenet є ярлики, такі як ковбой чи певні шапки та інші речі, пов'язані з людьми, такі як сорочка та футболка. Ви можете подивитися тут, а також тут. В останньому посиланні Йосінський та ін намагалися показати, що популярний AlexNet навчився розпізнавати людські обличчя, хоча в наборі даних із мережею зображень немає мітки як людського обличчя. У своїй роботі вони дослідили, що нейромережі, що розвиваються, можуть намагатися дізнатись речі, які розподіляються між шарами, а можуть і ні, і вони можуть не мати спеціальних міток у навчальних даних. Як приклад можна навести обличчя котів і людей. Більше того, як ви бачите тут, можливо, метою було приписувати навчання в масштабних наборах даних , як це цитується в останньому рядку сторінки, як посилання.


Мені подобається відповідь, але я не розумію вашого останнього речення. Що ви маєте на увазі під атрибутивним навчанням, чим він відрізняється (якщо він відрізняється) від класифікації зображень і як це пов’язано з моїм запитанням (чи є personкласи в ImageNet)?
DeltaIV

@DeltaIV Я мав на увазі в останньому посиланні, яке я надав, є посилання, яке в цій роботі вони обговорюють це питання. Те, що я сказав, було як навчання облич, які не є етикетками, але вони потрібні, щоб зрозуміти футболки.
Медіа

Гаразд, сімейні мережі вивчають функції, схожі на обличчя, оскільки вони допомагають розпізнавати (або розрізняти) мітки. Так, я начебто цього очікував. Спасибі
DeltaIV

@DeltaIV Я думаю, це, можливо, те, що ми називаємо навчанням
Медіа

2
Я думаю, що навчання нейронних мереж має дуже мало спільного з процесом навчання людини. Дивіться ці галюцинації . Знову ж таки, та сама ідея, що ці оптимізовані зображення повинні показувати те, про що дізналися Нейронні мережі, глибоко хибна і ґрунтується на нерозумінні того, що таке об'ємний розподіл ймовірностей. Тема дуже делікатна: моє запитання було набагато елементарніше.
DeltaIV

6

Я виявив, що клас 7846 (name = "n00007846") призначений для людини. Щоб отримати доступ до опису класу, прочитайте http://image-net.org/download-API . Ще краще, що наступні текстові файли містять усе, що вам потрібно, щоб зрозуміти класи в наборі даних ImageNet (class = WordNet ID):

n00007846 відображає людину, особу, когось, когось, смертного, душу . Відповідний блиск: людина; "для однієї людини було занадто багато" .


Не могли б ви зв’язатись із джерелом? Це було б корисно для інших користувачів.
Ілля Стреле

Моделі Imagenet, здається, недостатньо ефективні для людей різного походження. За моїми даними, є люди в бігових нарядах, і вони здебільшого ідентифікуються як м'ячі для регбі та волейболу.
levesque

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.