Alexa Amazon , Mix Nuance's Mix і Facebook Wit.ai використовують подібну систему, щоб вказати, як перетворити текстову команду в наміри - тобто те, що комп'ютер зрозумів би. Я не впевнений, що це за "офіційна" назва, але я називаю це "визнанням наміру". В основному це спосіб перейти від "будь-ласка, встановіть моє світло на 50% яскравості" до lights.setBrightness(0.50)
.
Спосіб їх визначення полягає в тому, щоб розробник надав перелік "зразкових висловлювань", які пов'язані з наміром і необов'язково позначені місцями "об'єктів" (в основному параметрами). Ось приклад від Wit.ai:
Моє запитання: як працюють ці системи? Оскільки вони всі дуже схожі, я припускаю, що є певна робота, яку вони використовують. Хтось знає, що це?
Цікаво Houndify використовує іншу систему , яка більше схожа регулярних виразів: ["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]
. Я припускаю, що він інтегрований у пошук променя їх системи розпізнавання голосу, тоді як у Alexa, Wit.ai та Mix, мабуть, є окремі системи Speech-> Text і Text-> Intent.
Редагувати: Я знайшов вихідну точку - Механізм взаємодії людини - робота за допомогою неформальних голосових команд . Для порівняння висловлювань використовується те, що називається "Латентний семантичний аналіз". Я буду читати про це. Принаймні, це дало мені вихідну точку в мережі цитування.
Редагування 2: LSA по суті порівнює слова, що вживаються (Мішок слів) у кожному абзаці тексту. Я не бачу, як це може працювати дуже добре для цього випадку, оскільки він повністю втрачає порядок слів. Хоча, можливо, порядок слів не має великого значення для таких типів команд.
Редагувати 3: Приховані теми моделей Маркова виглядають так, що можуть бути цікавими.