Гарне рішення "Текст-мова" для Windows [закрито]


9

Я запускаю Windows 7 і знаю, що він має можливість читати мені текст у своїх програмах, але я шукаю гарну утиліту для збереження фрагментів тексту у форматі WAV або mp3. Він може бути вже вбудований в ОС, але вміло замаскований. Я знаю, що можу написати програму для виклику API, що є моїм наступним кроком, якщо вже немає хорошого рішення.

Я дуже люблю якість системи AT&T , але вона має досить круті обмеження щодо використання MP3, що виробляється. Я хотів би використовувати їх у своєму подкасті.

Веб-версія також нормальна, доки вона легко створює досить необременену (загальнодоступне домену або Creative Commons) Wav, MP3 або якийсь інший стандартний аудіофайл. Звичайно, я віддаю перевагу вільному чи відкритому коду над комерційним, але це не обов'язково.

Відповіді:


4

Я спробував еспік , фестиваль та MaryTTS . Всі вони генерують зрозумілі голоси здебільшого, але вони не дуже природні. Навіть при додаткових завантаженнях голосу для цих систем (наприклад, Mbrola, CMU Arctic) голоси не такі великі.

Голоси IVONA - це найкраще, що я чув досі. Вони дають вам 30-денну безкоштовну демонстрацію, що достатньо, якщо у вас є разове завдання. Після цього вони наче $ 45 / голос. Компанія Amazon щойно купила компанію, щоб ви знали, що вона міцна ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Вони працюють з інтерфейсом SAPI Microsoft, що означає, що голоси доступні будь-якій програмі, яка підтримує цю програму (наприклад, Adobe Reader). Я використовую їх з програмою Text To Wav, яка приємна для масового перетворення текстових файлів у файли хвиль.

Редагувати

Насправді просто перечитайте своє запитання, і я думаю, що для особистого використання (наприклад, подкасти) ціна, можливо, набагато вища для IVONA. У такому випадку я б сказав перевірити MaryTTS.


Я просто слухав MaryTTS, і це збиває верх із еспіка та фестивалю.
тридцять тридцятиріччя

У MaryTTS чудові голоси, і він також безкоштовний.
Джим Маккіт

Здається, TextAloud
Користувач

6

eSpeak є безкоштовним та відкритим кодом та пропонує все необхідне.

Він може запускатися як програма командного рядка, щоб говорити текст з файлу або з stdin.
Також доступна спільна версія бібліотеки.

* Включає різні голоси, характеристики яких можна змінити.
* Може виробляти мовний вихід у форматі WAV.
* Підтримується (не завершено) SSML (мова розмітки синтезу мови),
  а також HTML.
* Компактний розмір. Програма та її дані, включаючи багато мов,
  налічує близько 1 Мбайт.
* Може перевести текст у фонемні коди, щоб він міг бути адаптований як передня частина
  кінець для іншого механізму синтезу мовлення.
* Потенціал для інших мов. Кілька з них включаються в різні етапи
  прогресу. Довідка носіїв мови для тих чи інших мов є
  вітали.
* Інструменти розробки, доступні для виробництва та налаштування даних фонеми.
* Написано на C ++.

Хоча eSpeak видається цікавим, він справді може скористатися посібником із «швидкого початку». Дякую за пораду, хоча. Я буду продовжувати працювати з цим.
Джим Маккіт

+1 для eSpeak. Я довго шукав додаток для цього. Дякую вам сер!
Axxmasterr
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.