просте розпізнавання мови під Linux


15

Хтось має простий підручник для запуску розпізнавання мови під Linux? Я бачу, що Pocketphinx доступний у вигляді двійкового завантаження в центрі програмного забезпечення, але запуск його з терміналу не вдається повідомити, що йому потрібні параметри, але я не знаю, що туди поставити. Я спробував встановити всі перелічені голосові моделі, але не знаю, де їх зберегти чи як змусити їх працювати. Я також не знав, що робити, щоб і Sphinx3 працював. Сторінки Sphinx3 здаються зламаними, а в кишені не існує приклад використання, який має для мене сенс.

Я шукаю те, що отримує 60% правильне розпізнавання від мікрофонного введення з обмеженою лексикою та словами, а потім можу записати це у текстовий файл - цей матеріал існував наприкінці 1980-х. Отже, я знаю, що вона існує і повинна якось працювати.

Спасибі.

(Підключення до Інтернету PS не працює)


У мене виникли проблеми з тим, як simon-listens.org працює на Ubuntu востаннє, коли я спробував, але це було досить давно, можливо, варто було б дослідити
david.libremone

1
Ви можете поговорити, чи добре вимагати активного підключення до Інтернету. Голосовий сервіс google приймає аудіофайл та повертає текст, але це не в режимі офлайн.
RobotHumans

Активний Інтернет - це не піде.
користувач2068060

1
Найкращий спосіб додати додаткову інформацію до свого питання - відредагувавши його, натиснувши кнопку редагування . Це краще видно таким чином, і коментарі в основному є вторинними, тимчасовими цілями. Коментарі видаляються за різних обставин. Все, що важливо для вашого питання, повинно бути в самому питанні.
guntbert

Відповіді:


4

Спробуйте Саймон Слухає

Саймон - програма розпізнавання мови з відкритим кодом та замінює мишу та клавіатуру. Він розроблений таким чином, щоб бути дуже гнучким і дозволяє налаштувати будь-які програми, де потрібне розпізнавання мови.

Щоб завантажити та отримати більше інформації, відвідайте simon на kde.org



0

Швидкість точності залежить від декількох факторів, таких як акцент, фонові шуми, якість записів. Попередньо підготовлені моделі дещо обмежені, і я використовував Transcribear замість веб-браузера на основі інструменту "мова в текст" для моїх проектів з транскрипції.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.