Які ролі баз знань відіграють зараз і які будуть грати в майбутньому?


13

У наш час штучний інтелект здається майже рівним машинному навчанню, особливо глибокому навчанню. Деякі кажуть, що глибоке навчання замінить людських експертів, традиційно дуже важливих для інженерних технологій, у цій галузі. Кажуть, що два прориви підкріпили підйом глибокого навчання: з одного боку, нейронаука та нейропластичністьзокрема, говорить нам, що подібно до людського мозку, який має високу пластичність, штучні мережі можна використовувати для моделювання майже всіх функцій; з іншого боку, збільшення обчислювальної потужності, зокрема впровадження GPU та FPGA, чудово розширило алгоритмічний інтелект і зробило моделі, створені десятиліттями тому, надзвичайно потужними та універсальними. Додам, що великі дані (в основному мічені дані), накопичені за останні роки, також є актуальними.

Такі розробки приносять комп'ютерне бачення (і розпізнавання голосу) у нову епоху, але в системах обробки природних мов та експертних системах ситуація, здається, не сильно змінилася.

Досягнення здорового глузду для нейронних мереж здається високим порядком, але більшість пропозицій, бесід та коротких текстів містять умовиводи, які слід виходити з передового світового знання. Таким чином, графік знань має велике значення для штучного інтелекту. Нейронні мережі можуть бути використані для побудови баз знань, але, здається, що моделі нейронної мережі мають труднощі з використанням цих побудованих баз знань.

Мої запитання:

  1. Чи є база знань (наприклад, "графік знань", придуманий Google) перспективною галуззю AI? Якщо так, то яким чином КБ може розширити можливості машинного навчання? Як ми можемо включити дискретні латентні змінні в NLU та NLG?

  2. Для виживання в епоху, де домінує DL, де напрямок до бази знань (або символічний підхід парасольового терміна)? Чи є новий напрямок схожий на Wolfram z динамічну базу знань? Або якісь нові напрямки?

Я пропускаю щось фундаментальне чи якісь ідеї, які стосуються цих питань?


Я працював у великій ІТ-компанії, яка свого часу продавала продукцію AI. Проблема нейромережевого підходу полягає в тому, що не існує бази знань за кожний. Таким чином, без будь-яких правил, нейронна мережа не може пояснити "чому". Навчання нейронної мережі, а потім формулювання правил, що дублюють мережу, дасть вам такі відповіді. Але не існує жодної форми машинного навчання, яка б тепер могла надати таку поведінку.
MaxW

Так. У нашій компанії чітхат-бот, підтримуваний лише NN, дуже дурний.
Лернер Чжан

Я знайшов цей документ: arxiv.org/abs/1702.01932
Лернер Чжан

Відповіді:


4

Перш за все, я хотів би зазначити основні відмінності між базою знань та (глибоким) машинним навчанням, особливо коли основна увага приділяється "AI", а не "Science Science":

  • НН - як чорний ящик; Навіть якщо вони вивчать набір даних і отримають силу узагальнення над проблемним доменом, ви ніколи не дізнаєтесь, як вони працюють. якщо вивчити деталі розробленої моделі, все, що ви бачите, - це цифри, ваги, погані та міцні зв'язки та функції перетворення. крок "вилучення особливостей" перед початком тренувального етапу буквально каже вам: "ей людино, досить у твоєму складному світі, почнемо нулі та одиниці". У випадку з DL це гірше! ми навіть не бачимо, що таке обрані та ефективні функції. Я не експерт з DL, але наскільки я знаю, чорний ящик DL темніший! Але бази знань написані зручною для людини мовою. після фази накопичення знань ви зможете побачити всі зв'язки між сутностями, і ще важливіше, Ви можете інтерпретувати ці зв'язки. якщо ви вирізаєте дріт у базі знань, ваша модель втратить лише трохи своєї сили, і ви знаєте, що саме вона втратить; наприклад, відключивши вузол «Плутон» від вузла «Сонячна система», підкаже вашій моделі, що нам сказав деГрассе Тайсон. але в моделі ML це може перетворити це на абсолютно марний: що трапиться, якщо ви маніпулюєте зв’язком між нейроном № 14 та 47 в моделі NN, яка використовується для прогнозування, які планети належать до Сонячної системи ?!

  • Моделі ML - це лише напис даних. Вони не мають сили висновку, і вони вам не дають. З іншого боку, база знань може зробити висновок із попередніх знань, як ви вказали у своєму запитанні. Показано, що моделі DL, які пройшли навчання з даними класифікації зображень, також можуть бути застосовані до проблеми виявлення голосу. Але це не означає, що моделі DL можуть застосовувати свої попередні знання в області зображень до області голосів.

  • Вам потрібні кілограми даних для традиційних алгоритмів ML та тонни даних для DL. але один екземпляр набору даних створить для вас значущу базу знань.

У NLP є дві основні теми дослідження: машинний переклад та відповіді на питання. Практично було показано, що DL значною мірою працює з проблемами машинного перекладу, але виглядає нерозумно під питанням відповіді на виклик, особливо коли сфера тем, що охоплюються в розмові людина-машина, широка. Бази знань не є хорошим вибором для машинного перекладу, але, ймовірно, є ключем до авторитетного автовідповідача. Оскільки в машинному перекладі важливо лише перекладена версія тексту (і мені байдуже, як на землі це зробила машина, наскільки це правда), але в питанні відповіді на проблему мені не потрібен папуга, який повторює ту саму інформацію, яку я йому дав, але розумна істота, яка дає мені "яблуко їсть" після того, як я скажу йому "яблуко - плід" і "


Всі фрукти їстівні, якщо вони не метафоричні, такі плоди "праці". (Знову ж таки, ми могли б використати "пожирання" в метафоричному сенсі, наприклад, коли один пожирає "смачну" відповідь на стек і перетравлює її вміст;)
DukeZhou
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.