Назвіть новітні методи навчання тренажера?


11

Я хотів би навчити бота, який використовує введення тексту, запам’ятовує кілька категорій і відповідає на питання відповідно. Крім версії 2.0, я хочу змусити бота відповідати і на голосові введення. Які найновіші алгоритми машинного навчання / AI доступні для одного і того ж? Будь ласка, дай мені знати.


перевірити динамічно-пам'ять-нейронні мережі
riemann77

Подумайте про використання символьно-математичного відображення .
Сергій

Відповіді:


1

Ваше запитання неймовірно широке - тому у відповідь я хочу заохотити вас дві широкі рамки:

  1. Для передового розвитку розмов чат-ботів http://rasa.ai - це програма з відкритим кодом, яка є більш пристосованою, ніж більш традиційні системи на основі правил
  2. Щоб розпізнати мовлення, ознайомтеся з https://discourse.mozilla.org/c/deep-speech, що також є відкритим кодом.

0

Якщо ваш бот "запам'ятовує" кілька категорій, а потім відповідає на запитання, то це в нинішньому сценарії зовсім марно. тому що в цьому випадку він працює дуже погано на іншому наборі даних (тестовий набір). в термінології статистики його називають "надмірним". і, дійшовши до відповіді на питання, не існує жодного основного правила визначення алгоритмів "найсучасніших". хоча ви можете перевірити кілька моделей, які чудово працювали на бабі чи подібних наборах даних, що сподобалися динамічним мережам пам'яті або моделям seQ2seQ. щоб отримати базове уявлення про цю сферу, я б запропонував вам вивчити лінгво машинного навчання, а потім перейти на якийсь передовий природний курс обробки мови (Стенфорд пропонує cs224n).


0

AbuShawar & Atwell:

Чатбот - це розмовний агент, який взаємодіє з користувачами по черзі, використовуючи природну мову. Різні чати або системи діалогу між людиною та комп’ютером були розроблені за допомогою розмовної або текстової комунікації та застосовувалися в різних сферах, таких як: лінгвістичні дослідження, мовна освіта, обслуговування клієнтів, допомога на веб-сайті та для розваги.

Їхні роботи та інші статті передають деякі з багатьох сучасних підходів до навчання чатботу станом на цей текст.

Автоматичне вилучення даних про навчання тренувальників із природних діалогових корпорацій, Баян АбуШавар, Ерік Етвелл, 2016

Однак більшість чатів обмежуються знаннями, що знаходяться вручну в їхніх файлах, та певною природною мовою, яка пишеться чи розмовляється. У цьому документі представлена ​​програма, яку ми розробили для перетворення машиночитаного тексту (корпусу) у певний формат чату, який потім використовується для перенавчання чату та створення чату, ближчого до людської мови. Були використані різні корпорації: діалогові корпуси, такі як Британський національний корпус англійської мови (BNC); священну книгу Ісламу Корану, яка є монологічним корпусом, де повороти вірша та наступного вірша; і FAQ, де питання та відповіді мають два витки. Основна мета цього процесу автоматизації - можливість генерувати різні прототипи чатботів, які розмовляли різними мовами на основі корпусу.

Вибір дій, що усвідомлює контекст-невизначеність, завдяки параметризованому навчанню допоміжного підкріплення , Чуандун Інь, Руй Чжан, Цзяньчжун Ци, Ю. Сонце та Тенглун Тан, 2018

Ми пропонуємо чат-бот, орієнтований на невизначеність, та модель посилення навчання (RL) для навчання чат-бота. Запропонована модель має назву Параметризований допоміжний асинхронний критичний дійовий фактор (PA4C). Ми використовуємо тренажер користувача, щоб імітувати невизначеність впевненості користувачів у контексті розмови. У порівнянні з наївними підходами, заснованими на правилах, наш чат-бот, навчений за допомогою моделі PA4C, уникає вибору ручних дій та є більш надійним у відхиленні від висловлювань користувачів. Модель PA4C оптимізує звичайні моделі RL з параметризацією дій та допоміжними завданнями для навчання чатботів, які вирішують проблеми великого простору дій та станів нульової винагороди. Ми оцінюємо модель PA4C під час навчання чатботу завданням створення календаря.

Навчальна система навчання з використанням взаємодії Chatbot , публікація патентних заявок США 0034828 A1, Міжнародна корпорація бізнес-машин, Armonk, Нью-Йорк, США, 2019

Комп'ютерно реалізований метод, що включає в себе прийом та аналіз точки даних для визначення параметрів точки даних, генерування сигнального квитка на основі аналізу точки даних, передавання через чатбот щонайменше деякої інформації, що міститься в квитку попередження, одному або більше користувачів, і класифікуючи через чатбот точку даних, яка призвела до отримання квитка попередження на основі поведінки пристрою, який генерував точку даних. Джонатан А. Кагадас, Олександр Д. Льюїтт, Саймон Д. Мікульчик, Каран Шукла, Лі А. Вільямсон

Двоетапне навчання та змішане кодування-розшифровка для впровадження генеративного чату з малим діалоговим корпусом, Джинтай Кім, Хеон-Гу Лі, Харксу Кім, Йонсу Лі, Янг-Гіл Кім, 2016

Генеративні чат-моделі, засновані на мережах послідовності-послідовності, можуть генерувати природні взаємодії в бесіді, якщо величезний корпус діалогу використовується в якості навчальних даних. Однак, за винятком кількох мов, таких як англійська та китайська, зібрати великий корпус діалогу залишається складно. Для вирішення цієї проблеми ми пропонуємо модель чатботу, використовуючи суміш слів і складів як одиниць кодування-декодування. Крім того, ми пропонуємо двоетапний метод навчання, що включає попередню підготовку з використанням великого корпусу без діалогу та перепідготовку з використанням корпусу малого діалогу. У наших експериментах було показано, що одиниці сумішей допомагають зменшити проблеми поза словниками (OOV). Більше того, двоступеневий метод навчання був ефективним для зменшення граматичних та семантичних помилок у відповідях, коли чат-бот навчався за допомогою невеликого корпусу діалогу (533,

Підбір даних на основі субмодулярності для цільового навчання чатових тренувань на основі вбудованих вироків , Младен Дімовський, Клавдіу Мусат, Володимир Ільєвський, Андреа Хоссманн, Майкл Баерісвіль, 2018

Системи розуміння розмовної мови (SLU), такі як орієнтовані на цілі чат-боти або особисті помічники, для визначення наміру та вилучення відповідної інформації з запитів користувачів, які вони приймають як вхідні дані, покладаються на модуль початкового розуміння природної мови (NLU). Системи SLU зазвичай допомагають користувачам вирішувати проблеми у відносно вузьких областях і вимагають великої кількості даних про навчальну роботу в домені. Це призводить до значних проблем з наявністю даних, що гальмують розвиток успішних систем. Щоб полегшити цю проблему, ми пропонуємо методику вибору даних у режимі низьких даних, яка дозволяє нам навчатись із меншою кількістю мічених речень, таким чином, меншими витратами на маркування. Ми пропонуємо функцію ранжирування даних на основі субмодулярності, граничне посилення співвідношення-штраф, для вибору точок даних для мітки на основі лише інформації, витягнутої з текстуального простору вбудовування. Ми показуємо, що відстані у вбудованому просторі є життєздатним джерелом інформації, яке можна використовувати для вибору даних. Наш метод перевершує дві відомі методи активного навчання та дає змогу вигідно навчати підрозділ НЛУ. Більше того, запропонована нами методика відбору не потребує перенавчання моделі між етапами відбору, що також робить її ефективною.


-1

Ви можете працювати з періодичними нейронними мережами з LSTM або GRU як клітинки пам'яті та вбудовування слів, як Word2vec. Моделі пошуку променя та уваги також можуть використовуватися з RNN для більшої надійності та меншої упередженості. Але результати цих робіт помітні до деякої міри лише тому, що дослідження в цій галузі ще гарячі і їх не можна буде розгадати.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.