Я шукаю простий в установці текст для мовного програмного забезпечення для Ubuntu, який звучить природно. Я встановив Festival
і Gespeaker
т.д., але нічого не звучить дуже природно. Все дуже синтетично і важко зрозуміти.
Якісь рекомендації там?
Я шукаю простий в установці текст для мовного програмного забезпечення для Ubuntu, який звучить природно. Я встановив Festival
і Gespeaker
т.д., але нічого не звучить дуже природно. Все дуже синтетично і важко зрозуміти.
Якісь рекомендації там?
Відповіді:
Дуже мінімалістичний ТТС, кращий звук, ніж еспік чи мброла (на мій погляд). Деякі відомості тут .
Я не розумію, чому pico2wave порівняно з espeak або mbrola рідко обговорюється. Це мало, але звучить дуже добре (природно). Без модифікацій ви почуєте природний жіночий голос.
І ... порівняно з Mbrola, він розпізнає Units і говорить це правильним шляхом!
Наприклад:
Після установки я використовую його в сценарії:
#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
Потім запустіть його потрібним текстом:
<scriptname>.sh "hello world"
або прочитати вміст цілого файлу:
<scriptname>.sh "$(cat <filename>)"
Це все, щоб мати легкий стабільний робочий TTS на Ubuntu.
pico2wave
знаходиться в пакеті libttspico-utils
в останніх версіях ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Погодьтеся, що цей інтерфейс CLI поганий дизайн: на відміну від величезної більшості CLI, і можливо досягти максимальної довжини аргументів CLI в ОС .
echo {1..1000}
Я вважаю, що Ive знайшов найкраще програмне забезпечення TTS безкоштовно за допомогою розширення Google Chrome під назвою "SpeakIt". Це працює лише в браузері Chrome для мене на Ubuntu. Чомусь це не працює з Chromium. SpeakIt поставляється з двома жіночими голосами, які обидва звучать дуже реалістично порівняно з усім іншим там. У розширеннях Chrome перелічено щонайменше ще чотири чоловічі та жіночі голоси, якщо ви шукаєте веб-магазин Chrome, використовуючи "TTS" як свій запит.
Використання : для використання на веб-сайті. ви виділите текст, який потрібно прочитати, або клацніть правою кнопкою миші та "SpeakIt" або натисніть значок SpeakIt, докріплений на верхній панелі Chrome.
Користувачі Firefox також мають два варіанти. У Firefox-додатку виконайте пошук TTS, і вам слід знайти «Клацніть промовити», а також «Текст на голос». Голоси не такі хороші, як голоси Chrome SpeakIt, але, безумовно, корисні.
Розширення SpeakIt використовує технологію iSpeech і за ціною 20 доларів на рік сайт може конвертувати текст у аудіофайли MP3. Ви можете вводити текст, URL-адреси, RSS-канали, а також документи, такі як TXT, DOC, PDF та виводити в MP3. Ви можете робити подкаст, вставляти аудіо та ін. Ось посилання та зразок їх аудіо (не знаю, скільки часу посилання триватиме).
Pico та espeak - це весело та легко приступити до роботи, але вони не все так добре. Голоси фестивалю за замовчуванням теж не такі добрі. Однак Фестиваль - це схема мовлення на основі схем, де ряд дослідників створили набагато кращі голоси плагінів. Ви можете легко перевершити якість pico2wave на складі Ubuntu, тому що один із цих голосів доступний як готовий пакет.
Щоб фестиваль звучав природно, ось що робити:
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
Ви можете зробити це з командного рядка, використовуючи -b
(або --batch
) і вводячи кожну команду в окремі лапки:
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
Ви можете отримати інші досить непогані голоси з сховища Nitech, але їх установка витончена, і шляхи за замовчуванням змінилися, тому посилання на ім’я файлів у файлах схеми, що вбудовуються, можливо, потрібно буде вручну редагувати для роботи на фонді Ubuntu.
Оновлення на сторінці проекту (2019-02) : Цей проект наразі є незмінним і залишатиметься таким у найближчому майбутньому
Через відсутність кращої альтернативи я написав скрипт bash, який взаємодіє зі сценарієм perl від Міхала Фапсо для надання TTS через Google Translate. З опису проекту:
Наміром є створення простого у користуванні інтерфейсу для виведення тексту з мовлення через систему синтезу мовлення Google. Резервна опція за допомогою pico2wave автоматично забезпечує синтез TTS у випадку, якщо не знайдено з'єднання з Інтернетом.
Наразі обгортка підтримує читання зі стандартного введення, звичайні текстові файли та вибір X (виділений текст).
Основні особливості:
Установка та використання задокументовані на сторінці проекту .
Буду радий, якби ви спробували. Звіти про помилки та будь-які інші відгуки вітаються!
Я виглядав високо та низько, щоб текст у мовленні для Ubuntu був високоякісним. Немає жодної. Мої голосові зв’язки паралізовані, тому мені потрібен був TTS, щоб додати голосові інструкції до своїх відео Ubuntu . Ви можете отримати комерційну високу якість Linux тексту в мову програмне забезпечення тут . Це просто дуже дорого. Я придбав Natural Reader для Windows (не працює в Ubuntu під Wine) за 40 доларів. Можливо, пізніше я отримаю Linux.
Я проводив дослідження найкращого звучання та легко налаштовував текст на мовленнєві голоси. Нижче наведено перелік того, що я вважав топ-5 продуктів у порядку якості звуку. Більшість веб-сайтів, пов’язаних із цим продуктом, мають інтерактивну демонстраційну версію, яка дозволить вам самостійно визначитися.
Я вважаю, що голоси від Nitech HTS на фестивалі є дуже природними та втішними над будь-якими іншими голосами, які я чув. Дивіться це посилання про те, як налаштувати Nitech та інші звуки за допомогою фестивалю. Я не знайшов хорошого gui, який би міг використати для налаштування цих голосів, але їх встановлення через festival.scm все ще працює. Цей пост дуже старий, і ви, можливо, захочете знайти фактичну каталог встановлення за допомогою команди "знайти фестиваль"
Поєднайте інструменти SVOX (pico) з LibreOffice:
Інструменти SVOX (pico) прості в установці і приносять хороші якості голосу в Ubuntu. Встановіть його:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Ви можете використовувати LibreOffice у поєднанні з інструментами SVOX (pico), встановивши розширення "Прочитати текст", і ви отримаєте "GUI" для цього чудового програмного забезпечення TTS:
Налаштуйте параметри читання розширення тексту за допомогою інструментів - Додатки - Прочитайте вибір .... Використовуйте / usr / bin / python як зовнішню програму. Виберіть параметр командного рядка, що включає маркер (PICO_READ_TEXT_PY) , можливо, ви захочете експериментувати з деякими з них.
Тепер вам залишається лише вибрати деякий текст у програмі LO Writer, Calc, Impress або Draw і натиснути на значок, доданий як панель інструментів (щасливе обличчя з кулькою).
Ось що я зробив, щоб мати чисто природне мовлення для PDF та інших текстових файлів (інші рішення не є природними або вони просто платні послуги). Це насправді робота з використанням хрому або хрому, але працює швидко і легко.
Є також способи відкрити інші файли, такі як .doc та .txt у chrome, і зробити те ж саме. Є й інші розширення для chrome, які переглядають файли PDF, перевірте, чи краще вам підходить. Крім того, ви можете завантажувати на Google Диск всі типи текстів і використовувати SpeakIt! читати це вам. Інше розширення під назвою "Говори текст" працює так само і має природне мовлення.
Під час пошуку кращого двигуна tts для використання в новому режимі firefox 49 я знайшов pico tts (svox) - мій улюблений двигун TTS.
sudo apt install espeak libttspico0 libttspico-data libttspico-utils
Як змінити систему двигуна синтезу мовлення за замовчуванням в цілому?
Люди з арки linux привели мене до правильного шляху:
Відключіть модуль, який вам подобається, і зробіть його за замовчуванням у налаштуваннях диспетчера мови:
# sudo vim /etc/speech-dispatcher/speechd.conf
[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak" "sd_espeak" "espeak.conf"
AddModule "pico-generic" "sd_generic" "pico-generic.conf"
[...]
#DefaultModule espeak
DefaultModule pico-generic
Перезапустіть демон:
# sudo systemctl restart speech-dispatcher.service
АЛЕ при повторному запуску firefox нічого не відбувається. За вищезазначеним посиланням (арк. Форум форуму №10 та №16) працює з фестивалем (не пробував), але лонг-диспетчер для pico не перелічує доступні голоси. Він не працюватиме.
Будь-яка ідея там буде дуже вдячна ;-)
Моя улюблена програма для текстового мовлення називається Magic English, але, як і Natural Reader, про яку згадував Джо Штейгер, це програма Windows, і я не впевнений, чи буде вона працювати під Wine.
AT&T Natural Voices доступний в Інтернеті як демонстраційний, але це скоріше обхід, ніж рішення ...
Pico, mbrola, cmu, festival, flite, все SUCK у 2017 році (Вони були дивовижними у 90-х роках). Натуральна мова AT&T (яка є фантастичною) не є Linux compat і не є безкоштовною, тому ми використовуємо Google
git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
gTTS ( Google Text-to Speech ), бібліотека Python та інструмент CLI для взаємодії з текстовим мовленням API Google Translate. Записує розмовні
mp3
дані у файл, об'єкт, подібний до файлу (тестування) для подальшого маніпулювання звуком, абоstdout
.
Мінуси : лише CLI Потрібно бути в Інтернеті, оскільки це вимагає звернення до відкритої кінцевої точки Google.
sudo -H pip install gTTS # Install
Використання
gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -
Про деякі вже згадувалося
Міміка . Установка:
sudo apt-get install gcc make pkg-config automake libtool libasound2-dev
git clone https://github.com/MycroftAI/mimic.git # take a while
cd mimic
./dependencies.sh --prefix="/usr/local" # take a while
./autogen.sh
./configure --prefix="/usr/local"
make # take a while
make check
eSpeak + Gespeaker (GUI) ( вихідний код Gespeaker )
Мінуси : старий і потворний
sudo apt install espeak gespeaker
Для цього я будую Intelligent Speaker - розширення для Google Chrome. Він може читати сторінки навіть без вибору (коли правильне затримання тексту).