З того, що я бачив, формула згладжування (другого порядку) Кнайзера-Нея так чи інакше подається як
з нормуючим коефіцієнтом заданим як
і ймовірність продовження слова w n
де є число контекстів ш був помічений в або, простіше, число різних слів ∙ які передують дане слово ш . З того, що я зрозумів, формула може застосовуватися рекурсивно.
Тепер це добре обробляє відомі слова у невідомому контексті для різної n-грамової довжини, але те, що не пояснює, що робити, коли є слова, які не є словниками. Я спробував дотримуватися цього прикладу, який стверджує, що на етапі рекурсії для уніграм, . Потім документ використовує це - цитуючи Чена та Гудмена - для обгрунтування вищезгаданої формули якP 1 K N (w)=Pcont(w) .
Я не бачу, як це працює за наявності невідомого слова хоча. У цих випадках P c o n t ( невідомо ) = 0 оскільки, очевидно, невідоме слово не продовжує нічого щодо навчального набору. Так само число n-грамів будеC(wn-1,невідомо)=0.
Крім того, цілий може бути нульовим, якщо зустрінеться послідовність невідомих слів - скажімо, триграма слів OOD.
Що я пропускаю?