AbuShawar & Atwell:
Чатбот - це розмовний агент, який взаємодіє з користувачами по черзі, використовуючи природну мову. Різні чати або системи діалогу між людиною та комп’ютером були розроблені за допомогою розмовної або текстової комунікації та застосовувалися в різних сферах, таких як: лінгвістичні дослідження, мовна освіта, обслуговування клієнтів, допомога на веб-сайті та для розваги.
Їхні роботи та інші статті передають деякі з багатьох сучасних підходів до навчання чатботу станом на цей текст.
Автоматичне вилучення даних про навчання тренувальників із природних діалогових корпорацій, Баян АбуШавар, Ерік Етвелл, 2016
Однак більшість чатів обмежуються знаннями, що знаходяться вручну в їхніх файлах, та певною природною мовою, яка пишеться чи розмовляється. У цьому документі представлена програма, яку ми розробили для перетворення машиночитаного тексту (корпусу) у певний формат чату, який потім використовується для перенавчання чату та створення чату, ближчого до людської мови. Були використані різні корпорації: діалогові корпуси, такі як Британський національний корпус англійської мови (BNC); священну книгу Ісламу Корану, яка є монологічним корпусом, де повороти вірша та наступного вірша; і FAQ, де питання та відповіді мають два витки. Основна мета цього процесу автоматизації - можливість генерувати різні прототипи чатботів, які розмовляли різними мовами на основі корпусу.
Вибір дій, що усвідомлює контекст-невизначеність, завдяки параметризованому навчанню допоміжного підкріплення , Чуандун Інь, Руй Чжан, Цзяньчжун Ци, Ю. Сонце та Тенглун Тан, 2018
Ми пропонуємо чат-бот, орієнтований на невизначеність, та модель посилення навчання (RL) для навчання чат-бота. Запропонована модель має назву Параметризований допоміжний асинхронний критичний дійовий фактор (PA4C). Ми використовуємо тренажер користувача, щоб імітувати невизначеність впевненості користувачів у контексті розмови. У порівнянні з наївними підходами, заснованими на правилах, наш чат-бот, навчений за допомогою моделі PA4C, уникає вибору ручних дій та є більш надійним у відхиленні від висловлювань користувачів. Модель PA4C оптимізує звичайні моделі RL з параметризацією дій та допоміжними завданнями для навчання чатботів, які вирішують проблеми великого простору дій та станів нульової винагороди. Ми оцінюємо модель PA4C під час навчання чатботу завданням створення календаря.
Навчальна система навчання з використанням взаємодії Chatbot , публікація патентних заявок США 0034828 A1, Міжнародна корпорація бізнес-машин, Armonk, Нью-Йорк, США, 2019
Комп'ютерно реалізований метод, що включає в себе прийом та аналіз точки даних для визначення параметрів точки даних, генерування сигнального квитка на основі аналізу точки даних, передавання через чатбот щонайменше деякої інформації, що міститься в квитку попередження, одному або більше користувачів, і класифікуючи через чатбот точку даних, яка призвела до отримання квитка попередження на основі поведінки пристрою, який генерував точку даних. Джонатан А. Кагадас, Олександр Д. Льюїтт, Саймон Д. Мікульчик, Каран Шукла, Лі А. Вільямсон
Двоетапне навчання та змішане кодування-розшифровка для впровадження генеративного чату з малим діалоговим корпусом, Джинтай Кім, Хеон-Гу Лі, Харксу Кім, Йонсу Лі, Янг-Гіл Кім, 2016
Генеративні чат-моделі, засновані на мережах послідовності-послідовності, можуть генерувати природні взаємодії в бесіді, якщо величезний корпус діалогу використовується в якості навчальних даних. Однак, за винятком кількох мов, таких як англійська та китайська, зібрати великий корпус діалогу залишається складно. Для вирішення цієї проблеми ми пропонуємо модель чатботу, використовуючи суміш слів і складів як одиниць кодування-декодування. Крім того, ми пропонуємо двоетапний метод навчання, що включає попередню підготовку з використанням великого корпусу без діалогу та перепідготовку з використанням корпусу малого діалогу. У наших експериментах було показано, що одиниці сумішей допомагають зменшити проблеми поза словниками (OOV). Більше того, двоступеневий метод навчання був ефективним для зменшення граматичних та семантичних помилок у відповідях, коли чат-бот навчався за допомогою невеликого корпусу діалогу (533,
Підбір даних на основі субмодулярності для цільового навчання чатових тренувань на основі вбудованих вироків , Младен Дімовський, Клавдіу Мусат, Володимир Ільєвський, Андреа Хоссманн, Майкл Баерісвіль, 2018
Системи розуміння розмовної мови (SLU), такі як орієнтовані на цілі чат-боти або особисті помічники, для визначення наміру та вилучення відповідної інформації з запитів користувачів, які вони приймають як вхідні дані, покладаються на модуль початкового розуміння природної мови (NLU). Системи SLU зазвичай допомагають користувачам вирішувати проблеми у відносно вузьких областях і вимагають великої кількості даних про навчальну роботу в домені. Це призводить до значних проблем з наявністю даних, що гальмують розвиток успішних систем. Щоб полегшити цю проблему, ми пропонуємо методику вибору даних у режимі низьких даних, яка дозволяє нам навчатись із меншою кількістю мічених речень, таким чином, меншими витратами на маркування. Ми пропонуємо функцію ранжирування даних на основі субмодулярності, граничне посилення співвідношення-штраф, для вибору точок даних для мітки на основі лише інформації, витягнутої з текстуального простору вбудовування. Ми показуємо, що відстані у вбудованому просторі є життєздатним джерелом інформації, яке можна використовувати для вибору даних. Наш метод перевершує дві відомі методи активного навчання та дає змогу вигідно навчати підрозділ НЛУ. Більше того, запропонована нами методика відбору не потребує перенавчання моделі між етапами відбору, що також робить її ефективною.