Американская техническая компания Amazon рассказала, как ей удалось сделать собственного голосового ассистента Alexa более «человечным» благодаря вдохам и паузам во время разговора.
Компания внедрила в Alexa технологию Neural Text-to-Speech, над которой Amazon работала с прошлого года. Благодаря этой системе, помощник сможет разговаривать как настоящий человек. Во время разговоров, голосовая программа будет делать паузы в тех моментах, в которых обычные люди делают паузу для вдоха.
Кроме этого, Amazon добавила новую функцию, с помощью которой помощника можно поправить, если она услышала что-то неправильно и пригласить в общую дискуссию.
Поправить ассистента можно голосовыми командами, вроде «Алекса, это неправильно» или «Алекса, остановись». Когда программа поймет, что допустила ошибку, помощник исправится или задает дополнительный вопрос, чтобы «заполнить пробелы в своем понимании».
Amazon говорит, что помощник использует комбинацию лингвистических, визуальных и акустических сигналов, чтобы определить, когда кто-то разговаривает с Alexa, а затем использовать контекст сказанного для определения реакции. Например, после того, как пользователь скажет «Алекса, присоединяйся к разговору», устройство станет еще одним участником группового обсуждения и не будет прерывать собеседников.