Перетворення мови (аудіо файли mp3) у текст


8

Я шукаю простий конвертер з mp3 в txt. Я без успіху намагався: julius, CMU Sphinx, ... За останні 4 години я не знайшов способу їх використання (або належної їх установки).

Я шукаю щось таке:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

Я також добре з додатком GUI, оскільки у мене є лише кілька файлів для конвертації, і я можу натискати.

Редагувати: За допомогою цієї відповіді програма розпізнавання мовлення для перетворення MP3 у текст? Я керував тим, щоб він працював, але це не дає результату. Ну, насправді він створює пару порожніх рядків (жодних слів не виявлено) ...


Яка точна команда, яку ви виконуєте, і вихід, який ви бачите?
Микола Шмирев

1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null &> otput.txt - точна команда відповідно до Питання @NikolayShmyrev Я завантажив моделі з sourceforge.net/projects/cmusphinx/files/… .
Само

Відповіді:


4

Pocketsphinx виконуватиме мовлення до тексту з існуючого аудіофайлу. Залежно від початкового формату mp3, вам можуть знадобитися дві окремі команди.

Спочатку конвертуйте існуючий аудіофайл у обов'язковий формат введення:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Пробіг кишені

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

створений файл myspeech.txt матиме те, що ви шукаєте.


Якщо ви не новачок у ubuntu, вам потрібно буде встановити вищезазначені програми за допомогою цієї команди:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg

0

Mozilla SpeechDeep зробить інструмент " мова в текст" з відкритим джерелом . Вам потрібно буде встановити додаток на робочому столі Linux. Або ви можете спробувати Transcribear за допомогою інструменту «мова в текст» на основі браузера, який не потребує встановлення, але вам потрібно буде підключитися до Інтернету, щоб завантажити запис на сервер.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.