Голосовий контроль над середовищем робочого столу


16

Я хотів би включити систему, яка може реагувати на голосові команди користувача та виконувати скрипти відповідно до словесної команди GIVEN.

В ідеалі я хотів би, щоб комп’ютер постійно слухав.

Після того, як він почує слово "комп'ютер", він активується та прослуховує команди протягом 10 секунд (або близько того).

Коли я активно, і під час прослуховування, я хотів би, щоб інший набір гучних слів міг запускати сценарії.

Наприклад....

(Комп'ютер у режимі очікування) "Комп'ютер" (комп'ютер одразу слухає) "Доступ до нових ПОВІДОМЛЕНЬ" (Повідомлення - це гучне слово * IGNORES "ДОСТУП НОВОГО" - комп'ютер запускає сценарій і відкриває еволюцію чи співпереживання). Тут може бути один для веб-переглядача, закриття вікон та показ робочого столу, або дуже багато речей.

Це навіть можливо?

Відповіді:


7

Gnome-Voice-Control

Ця ідея була розроблена як частина Google Summer of Code 2007, щоб розробити деякі функції, які покращать зручність використання на робочому столі Gnome.

Мета - впровадження настільної системи голосового управління. Система складається з програми, яка здійснюватиме моніторинг аудіовходу (мікрофона), і коли виявлено значний звуковий сигнал, програмне забезпечення ловить, обробляє та розпізнає сигнал, а потім виконує потрібну дію над робочим столом Gnome. У набір дій можна включити максимізацію, мінімізацію, закриття активного вікна; відкрити конкретну програму; перехід з одного робочого столу на інший; серед інших. GnomeVoiceControl реалізований на C спільно з CMU Sphinx, що є інструментом з відкритим кодом, створеним для перетворення мови в текст.

Слайд-шоу авторів

На жаль, схоже, що він не дуже розвинувся за рамки основних «цілей» - проте, як видається, в цьому році є деяка діяльність, яка підтримує нові мови, такі як болгарська та турецька.

Щоб встановити:

sudo apt-get install gnome-voice-control

Платиноса

Існує цікавий вигляд проектного дзвінка platypus - в основному це linux-фронт для Dragon Naturally Speaking, який працює у Wine.

Претензія на популярність цього додатка полягає в тому, що «він може навіть запускати програми та сценарії Windows та Linux, наприклад,« запустити термінал ».

ВЕДИКА

Це новий проект, який говорить, що він працює з інтерфейсом Unity.

На сторінці проекту написано, що він розпізнає "запустити [ім'я програми]" - тому теоретично ви [назва програми] може бути будь-яким сценарієм, який ви хочете запустити.


Дякую за надзвичайно швидку відповідь. Я чув про цю програму, і встановив її, але вона, здається, не минула конфігурація - вона просто говорить "config". Я здивований, що на цьому фронті не було зроблено багато роботи. Чи, можливо, є віконний еквівалент, який я можу бігти з вином?
BorgDomination

1
старша версія голосу гнома, яка є синаптичною, дала мені ті ж результати. Я спробував останнє з веб-сайту, і, здавалося, дійшов далі, але мені ніколи не дісталося, щоб він працював належним чином. ручні залежності залежали від болю.
Кендрік

3

Саймон слухає

Це відкритий проект, спрямований на заміну миші та / або клавіатури розпізнаванням мови, спочатку розробленим для людей з обмеженими фізичними можливостями.

Є ppa, звідки ми можемо встановити додаток : ppa: grasch-simon-listens / simon


працює симон лише з kde? Це виглядає справді приголомшливо, і я встановив його, але, здається, не можна змусити його працювати з gnome-shell. спеціально управління вікнами. Якщо я хочу показати, наприклад, усі вікна, що буде працювати по-різному в kde env та gnome env, правильно?
Джошуа Робісон

1
Залежності повинні бути вирішені при встановленні на Ubuntu <= 12.04 від ppa, але я не намагався останнім часом, а також не маю уявлення, як це може заважати оболонці GNOME. Немає версії (поки) для 12.10.
Таккат

3

Google2Ubuntu

Google2Ubuntu - це інструмент, який дозволяє керувати комп'ютером за допомогою голосових команд через API розпізнавання мови Google.

Запустіть команди нижче на терміналі для встановлення google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Джерело


1

Розпізнавання мови Linux

Він розробляється для роботи під дистрибутивами Linux, його дуже легко налаштовувати та легко розширювати, підтримувати користувацькі словники, розпізнавання на основі контексту, режим диктантів та макроси, що можна настроювати.

Для встановлення розпізнавання мови Linux перейдіть на сторінку GitHub проекту . Завантажте файл ZIP і витягніть його.

Потім встановіть деякі залежності:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Відкрийте вилучену папку (Palaver-master) у терміналі та виконайте налаштування:

cd /~Path-to-folder~/Palaver-master/
./setup

Тепер достатньо призначити гарячу клавішу для ввімкнення запису, для цього перейдіть у Налаштування системи ...> Клавіатура> Ярлики> Спеціальні ярлики натисніть кнопку Плюс, щоб додати ярлик, назвіть його Розпізнавання голосу та встановіть команду на:

/~Path-to-folder~/Palaver-master/hotkey

Клацніть Застосувати, клацніть по ярлику та призначте гарячу клавішу, щоб активувати розпізнавання голосу.

Зауважте, що стабільна збірка ще не випущена, тому не очікуйте, що команди будуть повністю функціональними на цьому етапі, багато фраз будуть розпізнані, але реальні дії не будуть зроблені.



0

Snips.ai

Щойно спробував це на pi3 - схоже, потенційний
запуск у докер

https://snips.ai/


1
Ласкаво просимо до Ask Ubuntu. Зауважте, що якщо ви пов’язані з цим інструментом, вам це потрібно чітко сказати у своєму дописі; див. Як не бути спамером .
Глорфіндель

1
На офіційному веб-сайті йдеться: Open Source: Ми готові відкривати Snips з часом , тому Snips, можливо, варто спробувати.
карел
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.