Текст природного звучання до виступу?


85

Я шукаю простий в установці текст для мовного програмного забезпечення для Ubuntu, який звучить природно. Я встановив Festivalі Gespeakerт.д., але нічого не звучить дуже природно. Все дуже синтетично і важко зрозуміти.

Якісь рекомендації там?


Відповіді:


51

SVOX pico2wave

Дуже мінімалістичний ТТС, кращий звук, ніж еспік чи мброла (на мій погляд). Деякі відомості тут .

Я не розумію, чому pico2wave порівняно з espeak або mbrola рідко обговорюється. Це мало, але звучить дуже добре (природно). Без модифікацій ви почуєте природний жіночий голос.

І ... порівняно з Mbrola, він розпізнає Units і говорить це правильним шляхом!
Наприклад:

  • 2 ° C → два градуси
  • 2м → два метри
  • 2 кг → два кілограми

Після установки я використовую його в сценарії:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Потім запустіть його потрібним текстом:

<scriptname>.sh "hello world"

або прочитати вміст цілого файлу:

<scriptname>.sh "$(cat <filename>)"

Це все, щоб мати легкий стабільний робочий TTS на Ubuntu.


1
Наскільки я бачу, він використовує лише параметри cli як вхідні дані. Чи можу я змусити pico2wave прочитати текст з імені файлу?
Carlos Eugenio Thompson Pinzón

13
pico2waveзнаходиться в пакеті libttspico-utilsв останніх версіях ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
naught101

1
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)"=). Погодьтеся, що цей інтерфейс CLI поганий дизайн: на відміну від величезної більшості CLI, і можливо досягти максимальної довжини аргументів CLI в ОС .
Ciro Santilli 新疆 改造 中心 法轮功 六四 事件

1
@Koen Я не знаю! :-) Як і будь-яка інша проблема, спробуйте навести мінімальний приклад, наприклад, використовуючиecho {1..1000}
Ciro Santilli 新疆 改造 中心 法轮功 六四 事件

1
@ user49557 Ми не повинні викрадати питання інших людей, тому, можливо, ви можете створити нове запитання, пояснивши, що саме ви встановили, і що це не так, і тоді я завжди можу спробувати вам допомогти (жодних гарантій, хоча , Я не експерт: P)
Коен

22

SpeakIt!

Я вважаю, що Ive знайшов найкраще програмне забезпечення TTS безкоштовно за допомогою розширення Google Chrome під назвою "SpeakIt". Це працює лише в браузері Chrome для мене на Ubuntu. Чомусь це не працює з Chromium. SpeakIt поставляється з двома жіночими голосами, які обидва звучать дуже реалістично порівняно з усім іншим там. У розширеннях Chrome перелічено щонайменше ще чотири чоловічі та жіночі голоси, якщо ви шукаєте веб-магазин Chrome, використовуючи "TTS" як свій запит.

Використання : для використання на веб-сайті. ви виділите текст, який потрібно прочитати, або клацніть правою кнопкою миші та "SpeakIt" або натисніть значок SpeakIt, докріплений на верхній панелі Chrome.


Користувачі Firefox також мають два варіанти. У Firefox-додатку виконайте пошук TTS, і вам слід знайти «Клацніть промовити», а також «Текст на голос». Голоси не такі хороші, як голоси Chrome SpeakIt, але, безумовно, корисні.

Розширення SpeakIt використовує технологію iSpeech і за ціною 20 доларів на рік сайт може конвертувати текст у аудіофайли MP3. Ви можете вводити текст, URL-адреси, RSS-канали, а також документи, такі як TXT, DOC, PDF та виводити в MP3. Ви можете робити подкаст, вставляти аудіо та ін. Ось посилання та зразок їх аудіо (не знаю, скільки часу посилання триватиме).


3
На жаль, жоден з параметрів браузера не працює для файлів PDF. Ви натрапили на те, що робить? Я хотів би мати можливість вибрати абзаци для читання з PDF (тобто не потрібно вставляти біти до терміналу чи іншого)
James Owers

1
це розширення працює для мене на Chrome 50.0.2661.94, використовуючи Debian 8.4 та його чудово! мені особливо подобається англійський жіночий голос. моя єдина скарга на те, що вона занадто довго паузує на коми.
mulllhausen

Він часто неправильно вимовляє слова, а також вимагає часу, щоб надіслати текст на окремий сервер, а не просто використовувати вашу власну систему.
Годдард

14

Pico та espeak - це весело та легко приступити до роботи, але вони не все так добре. Голоси фестивалю за замовчуванням теж не такі добрі. Однак Фестиваль - це схема мовлення на основі схем, де ряд дослідників створили набагато кращі голоси плагінів. Ви можете легко перевершити якість pico2wave на складі Ubuntu, тому що один із цих голосів доступний як готовий пакет.

Щоб фестиваль звучав природно, ось що робити:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Ви можете зробити це з командного рядка, використовуючи -b(або --batch) і вводячи кожну команду в окремі лапки:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Ви можете отримати інші досить непогані голоси з сховища Nitech, але їх установка витончена, і шляхи за замовчуванням змінилися, тому посилання на ім’я файлів у файлах схеми, що вбудовуються, можливо, потрібно буде вручну редагувати для роботи на фонді Ubuntu.


2
До речі, в Ubuntu 16.04 цей пакет, здається, відсутній. Ви можете завантажити і встановити Deb від Debian , і він буде працювати нормально: packages.debian.org/sid/all/festvox-us-slt-hts/download Суду Dpkg -i Завантаження / festvox-нам-SLT-hts_0.2010.10. 25-2_all.deb
Джон Ватт

13

Простий Google ™ TTS

Оновлення на сторінці проекту (2019-02) : Цей проект наразі є незмінним і залишатиметься таким у найближчому майбутньому


Через відсутність кращої альтернативи я написав скрипт bash, який взаємодіє зі сценарієм perl від Міхала Фапсо для надання TTS через Google Translate. З опису проекту:

Наміром є створення простого у користуванні інтерфейсу для виведення тексту з мовлення через систему синтезу мовлення Google. Резервна опція за допомогою pico2wave автоматично забезпечує синтез TTS у випадку, якщо не знайдено з'єднання з Інтернетом.

Наразі обгортка підтримує читання зі стандартного введення, звичайні текстові файли та вибір X (виділений текст).

Основні особливості:

  • онлайн-синтез TTS через Google translate
  • офлайн синтез TTS через pico2wave
  • підтримує безліч різних мов
  • може читати з CLI, текстових файлів та виділеного тексту
  • підтримує читання виділеного тексту з фіксованим форматуванням (наприклад, PDF-файли)

Установка та використання задокументовані на сторінці проекту .

Буду радий, якби ви спробували. Звіти про помилки та будь-які інші відгуки вітаються!


Це має бути одним із найкрутіших проектів, які я бачив. Просто вау. 😲

5
Це більше не підтримується.
Годдард

8

Я виглядав високо та низько, щоб текст у мовленні для Ubuntu був високоякісним. Немає жодної. Мої голосові зв’язки паралізовані, тому мені потрібен був TTS, щоб додати голосові інструкції до своїх відео Ubuntu . Ви можете отримати комерційну високу якість Linux тексту в мову програмне забезпечення тут . Це просто дуже дорого. Я придбав Natural Reader для Windows (не працює в Ubuntu під Wine) за 40 доларів. Можливо, пізніше я отримаю Linux.


чувак, є, і я користувався ним, як минулого тижня, принаймні 5 або 6, і я не можу за все життя знайти жодного з них, треба любити нашу громаду
mchid

Textaloud має вказівки змусити свою продукцію працювати під вином. див. nextup.com/forum/viewtopic.php?t=3349 Я вважаю, що cepstral також має порт Linux. Мені не вдалося змусити свою улюблену програмну балаболку працювати. У мене встановлено Windows 10 здебільшого для обробки TTS. MS David хороший і схожий на cepstral david. Попередній варіант безкоштовний, якщо у вас вікна 10.
Bhikkhu Subhuti

6

Я проводив дослідження найкращого звучання та легко налаштовував текст на мовленнєві голоси. Нижче наведено перелік того, що я вважав топ-5 продуктів у порядку якості звуку. Більшість веб-сайтів, пов’язаних із цим продуктом, мають інтерактивну демонстраційну версію, яка дозволить вам самостійно визначитися.

  1. NeoSpeech
  2. iVona
  3. Акапела
  4. AT&T Природні голоси
  5. Голоси CereProc

1
чи доступні для Linux? не думаю, що так
Мехді Хадмелу

5

Я вважаю, що голоси від Nitech HTS на фестивалі є дуже природними та втішними над будь-якими іншими голосами, які я чув. Дивіться це посилання про те, як налаштувати Nitech та інші звуки за допомогою фестивалю. Я не знайшов хорошого gui, який би міг використати для налаштування цих голосів, але їх встановлення через festival.scm все ще працює. Цей пост дуже старий, і ви, можливо, захочете знайти фактичну каталог встановлення за допомогою команди "знайти фестиваль"


Здається, це дуже добре. Знайдені демонстрації тут cstr.ed.ac.uk/projects/festival/onlinedemo.html
Iacchus

2
Так, голоси Nitech є головами та плечима вище інших голосів фестивалю (крім голосів КМУ, які також дуже хороші.) Шкода, що їх важко встановити. Є один хороший голос CMU, який має пакет за замовчуванням в Ubunut, він називається cmu_us_slt_arctic_hts і постачається в пакет festvox-us-slt-hts. Це набагато краще, ніж піко чи еспік!
Джон Ватте

5

Поєднайте інструменти SVOX (pico) з LibreOffice:

Інструменти SVOX (pico) прості в установці і приносять хороші якості голосу в Ubuntu. Встановіть його:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Ви можете використовувати LibreOffice у поєднанні з інструментами SVOX (pico), встановивши розширення "Прочитати текст", і ви отримаєте "GUI" для цього чудового програмного забезпечення TTS:

Налаштуйте параметри читання розширення тексту за допомогою інструментів - Додатки - Прочитайте вибір .... Використовуйте / usr / bin / python як зовнішню програму. Виберіть параметр командного рядка, що включає маркер (PICO_READ_TEXT_PY) , можливо, ви захочете експериментувати з деякими з них.

Тепер вам залишається лише вибрати деякий текст у програмі LO Writer, Calc, Impress або Draw і натиснути на значок, доданий як панель інструментів (щасливе обличчя з кулькою).


4

Ось що я зробив, щоб мати чисто природне мовлення для PDF та інших текстових файлів (інші рішення не є природними або вони просто платні послуги). Це насправді робота з використанням хрому або хрому, але працює швидко і легко.

  1. Встановити SpeakIt! розширення на ваш хром або хром.
  2. Встановіть програму перегляду PDF, якщо ви користуєтеся хромом (у Chrome вже є програма перегляду PDF-файлів безкоштовно) та встановіть прапорець "Дозволити інкогніто" та "Дозволити доступ до параметрів URL-адрес файлів" у налаштуваннях розширень хрому.
  3. Перетягніть свій pdf у браузер.
  4. Тепер виділіть текст і клацніть правою кнопкою миші та виберіть SpeakIt! тож ви можете слухати чистий природний текст у мовленні.

Є також способи відкрити інші файли, такі як .doc та .txt у chrome, і зробити те ж саме. Є й інші розширення для chrome, які переглядають файли PDF, перевірте, чи краще вам підходить. Крім того, ви можете завантажувати на Google Диск всі типи текстів і використовувати SpeakIt! читати це вам. Інше розширення під назвою "Говори текст" працює так само і має природне мовлення.


Не могли б ви детальніше розповісти, як змусити SpeakIt читати PDF-файли, збережені на Google Диску?
Марко Лацкович

2

Під час пошуку кращого двигуна tts для використання в новому режимі firefox 49 я знайшов pico tts (svox) - мій улюблений двигун TTS.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Як змінити систему двигуна синтезу мовлення за замовчуванням в цілому?

Люди з арки linux привели мене до правильного шляху:

Відключіть модуль, який вам подобається, і зробіть його за замовчуванням у налаштуваннях диспетчера мови:

# sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Перезапустіть демон:

# sudo systemctl restart speech-dispatcher.service

АЛЕ при повторному запуску firefox нічого не відбувається. За вищезазначеним посиланням (арк. Форум форуму №10 та №16) працює з фестивалем (не пробував), але лонг-диспетчер для pico не перелічує доступні голоси. Він не працюватиме.

Будь-яка ідея там буде дуже вдячна ;-)


1

Моя улюблена програма для текстового мовлення називається Magic English, але, як і Natural Reader, про яку згадував Джо Штейгер, це програма Windows, і я не впевнений, чи буде вона працювати під Wine.

AT&T Natural Voices доступний в Інтернеті як демонстраційний, але це скоріше обхід, ніж рішення ...


1

Простий Google ™ TTS

Pico, mbrola, cmu, festival, flite, все SUCK у 2017 році (Вони були дивовижними у 90-х роках). Натуральна мова AT&T (яка є фантастичною) не є Linux compat і не є безкоштовною, тому ми використовуємо Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -

Це дублікат відповіді Glutanimate (автор цього проекту). Також: "Оновлення статусу: Цей проект наразі не підтримується і залишатиметься таким у найближчому майбутньому." Він пропонує кілька альтернатив
Пабло А

1

гТТС

gTTS ( Google Text-to Speech ), бібліотека Python та інструмент CLI для взаємодії з текстовим мовленням API Google Translate. Записує розмовні mp3дані у файл, об'єкт, подібний до файлу (тестування) для подальшого маніпулювання звуком, або stdout.

Мінуси : лише CLI Потрібно бути в Інтернеті, оскільки це вимагає звернення до відкритої кінцевої точки Google.

sudo -H pip install gTTS  # Install

Використання

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Документація та інші приклади

Інші

Про деякі вже згадувалося


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.