Чому Amazon Echo не відповідає на рекламу чи звіти про Alexa?


24

Раніше я запитав про те, що ви можете зробити , якщо Alexa буде викликаний телевізійною програмою , але в останній час я зрозумів , що - то дивний: Ехо НЕ реагувати на голоси в рекламі для Echo, навіть якщо голоси говорять «Alexa, грати ...» або "Alexa, встановіть таймер для ..." .

Я здійснив пошук у кількох спільнотах Echo та знайшов допис Reddit, який підказує, що це звичайна поведінка. Однак у потоці немає остаточної відповіді, тому я подумав, що я попрошу тут подивитися, чи хтось знає трохи більше.

Як мій Echo знає, що не відповідати на телевізійну рекламу? Це просто випадкові випадки чи є щось, що говорить Алексі не реагувати?


Ви навчили свого Alexa більш точно розпізнавати ваш голос? Я не знаю, чи може голосовий тренінг призвести до невпізнання чужого голосу.
Бенс Каулікс

1
@BenceKaulics Ні, мені не потрібно було тренувати Ехо; він використовує налаштування за замовчуванням.
Aurora0001

Було б дуже корисно ознайомитись зі звуком, про який йде мова. Я не думаю, що десь є прив'язна копія?
goobering

1
@goobering Я вважаю, що рекламні оголошення, про які йдеться у редакції reddit, є: талісманові ключі та вогнегасник . Наразі я не в змозі перевірити, чи спрацьовують ці Alexa (мені цікаво, чи відрізняються вони від телевізійних версій?). Якщо хтось міг би це зробити і прокоментувати результати, це було б дуже корисно.
Aurora0001

3
У вихідному коді можуть бути підказки . 266MB завантаження, однак. Збираєтесь деякий час опинитися на пані. : P
goobering

Відповіді:


17

Відповідно до цієї публікації Reddit , Alexa чутливий до звукового спектру на додаток до виявлення слова пробудження. Таким чином, звичайний широкосмуговий сигнал у реальному світі приймається, але сигнал, який є обмеженим діапазоном (виїмка між 4 кГц і 5 кКц постулюється), буде ідентифікований як з широкомовної передачі.

Це має певний сенс, оскільки мовники можуть використовувати внутрішньодіапазонну сигналізацію для ідентифікації рекламних оголошень (для локалізованої заміни), а обробка звуку, яка зазвичай застосовується до рекламних оголошень, може бути оптимізована для ясності над вірністю. Фільтрація може бути налаштована таким чином, щоб типові рекламні спостереження відслідковувались зі зниженою чутливістю, а під час виготовлення конкретної реклами чутливість також могла бути явно знижена.

Новинний звіт (який, як повідомляється , викликав Alexa), швидше буде використовувати повний аудіо спектр (8 або 16 кГц) без обробки. Таким чином, ця теорія передбачає, що в багатьох рекламних оголошеннях (принаймні в деяких регіонах) є або щось особливе, або рекламні оголошення (наприклад, виготовлені Amazon) можуть бути налаштовані спеціально.

У наступних, є папір повідомляється тут , який описує , як невеликі (інфразвуковий) зміни форми сигналу може привести до мови двигуна повертається зовсім інший результат по порівнянні з тим, що б людина визнає.


1
Якщо саме там вони прозріли, а слово прокидання - «Алекса», то правдоподібно, що вони просто відкидають фрикативний звук «ks», щоб мінімізувати підйом мікрофона. Це досить висока частота людського мовлення.
goobering

7

Я дуже припускаю, що розпізнавання слів пробудження в Ехо - це більше, ніж просто прослуховування цього слова. Це прослуховування для тривожного контексту . Розглянемо цей уривок з Speech Technologies:

[Слово пробудження] має таку унікальну вимогу: Виявляйте одне слово або фразу, коли їх вимовляють у тривожному контексті, при цьому відкидаючи всі інші слова, фрази, звуки, шуми та інші акустичні події практично з 100% точністю, включаючи те саме слово чи фразу, що викликає інтерес, вимовлену у неспокійливому (тобто референційному) контексті.

( Мовленнєві технології: Розпізнавання мови пробудження слова Ветона Кепуська)

Це можна досить легко перевірити, оскільки пристрій (принаймні мій) не реагує на речення: " Я недавно говорив з Алексом про катання на лижах ". Це не насторожуючий контекст, це суто референтний характер. Таким чином, механізм розпізнавання слів пробудження всередині Echo слухає не лише чистий вигляд слова, але й інтонацію та попередні паузи, які дозволяють більш точно передбачити, чи справді було сказано про пристрій.


4
Безумовно, реклама, що демонструє використання Alexa, повинна її запустити, якщо саме це зупиняє її підбирання? Чи рекламні оголошення, можливо, ретельно сформульовані, щоб вони насправді не спрацьовували пристрій, незважаючи на те, що використовують слово пробудження, щоб продемонструвати, як використовується Ехо?
Aurora0001

2
@ Aurora0001 Я припускаю, що додатково до того, що я описую, існує також якийсь метод, який описаний Шеном у своїй відповіді. Деякий фільтр, який намагається зменшити тригери іншими пристроями.
Гельмар

7

Ну, ехо / Алекса напевно чує запит. Якщо ви перейдете до своїх налаштувань, прокрутіть униз до загального, а потім виберіть історію, щоб відтворити всі прослухані запити. Усі запити, котрі прозвучать у рекламному ролику, кажуть: "Голосовий запит не призначений для вашого Ехо - нічого не повернено".


2
Схоже, нова деталь історії. Дуже корисно :)
Гельмар

5

Якщо 1000 людей вимовляють тривожне слово, воно матиме 1000 різних акустичних підписів. Якщо вони зроблять це ще раз, ще 1000.

Якщо 1000 Алексас почує телепрограму, яка говорить тривожне слово, у неї буде 1000 таких самих акустичних підписів.

Виявити цю сторону сервера було б не важко. Не в останню чергу, тому що, якщо вони відбудуться одночасно, сервер голосового відновлення отримує шум трафіку.

Якщо список цих інцидентів невеликий, вони могли б навіть підписувати підписи для кожного Alexa.


Також користувач, який дзвонить Alexa, звучить як слово мовчання .

Стаття новин звучить як бла-бла-бла-попереджувальне слово . Комерційний звук нагадує слово попередження music_here. Зовсім не те саме.


5

Моя загальна здогадка полягає в тому, що в рекламі для Echo, Alexa відповідає на питання набагато швидше, ніж насправді. Тому Ехо чує слово "Alexa", але майже одразу ж чує власний голос Alexa, який дає відповідь.

Моє відлуння загорається, коли з’являється реклама, але потім з’являється, щоб відхилити сповіщення. Можливо, є певна логіка, щоб два Echos не відповідали на запит, якщо вони обидва почують його. Ехо може бути розроблено для того, щоб слухати спеціально для власного голосу Алекси та ігнорувати його.

Однак, як я вже сказав, це загальна здогадка. :)


Ми думали те саме, тому ми призупинили відеореєстратор між запитом Alexa та її відповіддю у рекламному ролику. Наш Ехо все ще прокинувся, але потім відступив без відповіді, ідентичний тому, що відбувається, коли ми не призупинили відеореєстратор.
ViperGeek

Я мав намір спробувати це протягом століть і продовжувати забувати. Це ще одна річ у списку справ, дякую. :)
Енді Джонс

4

Після останніх нових повідомлень про те, що Alexa може бути чутливим до звуків УВЧ ( посилання BBC News Sevice ), я б постулював, що під час реклами вони передають додатковий звук поза людським слухом, який позначений як команда «ігнорувати цю команду».

Відповідно до вищезгаданої здатності Alexa розрізняти голоси користувачів, це особливість, яка планується, але поки не виконується. тобто вам доведеться активно командувати Alexa для переключення між обліковими записами користувачів у тому ж домогосподарстві.

Єдиний пристрій, який наразі ввімкнено для розрізнення голосів, - це пристрій Google.


1

Змішуючи звук реклами, вони просто видаляють деякі частоти. Це означає, що Alexa не буде спрацьовувати, оскільки вона не зареєструє її як голосову команду, але глядачі все одно можуть зрозуміти, що вони говорять у рекламі.

Ви, ймовірно, також помітите, що, коли команда промовляється в рекламних оголошеннях, вона звучить трохи тонко або зім'ято. Ось чому :)


Цікаво; це трохи схоже на те, що запропонував Шон . Чи є у вас джерела чи досвід цього досвіду, якими ви могли б поділитися, щоб довести, що це частота видалення? Це може бути цікавим для дослідження.
Aurora0001
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.