Управляющая Тинькофф-банком TCS Group выводит на рынок b2b разработки в сфере речевых технологий, сообщает «Коммерсантъ». На их основе уже работает голосовой помощник Тинькофф-банка «Олег», а сторонние компании, как предполагается, смогут развивать собственных голосовых ассистентов или роботов для колл-центров. На этом рынке объемом около 3 млрд руб. в год TCS Group придется конкурировать с «Яндексом» и целым рядом крупнейших компаний, развивающих подобные технологии.
Набор инструментов Tinkoff VoiceKit может использоваться, например, для создания голосового ассистента, роботов для автоматизации колл-центров, построения системы аналитики по транскрибированным текстам, а также создания аудиокниг, говорят в TCS Group.
TCS Group представила голосового помощника «Олега» в июне 2019 года. «Олег» обучается на базе суперкомпьютера «Колмогоров», о запуске которого группа объявила 2 апреля. По данным TCS Group, на разработку и запуск речевых технологий без учета оборудования и затрат на «Колмогорова» ушло около 80 млн руб. за три года. «Наши первые клиенты считают, что качество распознавания выше, чем у решений, которые они использовали до этого. Особенно это касается телефонной речи, поскольку у нас накоплено очень много данных в этой области и мы можем обучать нейросетевые модели, используя «Колмогоров» на всем их объеме»,— заявил вице-президент TCS Group Вячеслав Цыганов.
TCS Group намерена конкурировать с технологией распознавания и синтеза речи «Яндекса» Yandex.SpeechKit, инструменты которой были впервые представлены в 2013 году. Стоимость использования Tinkoff VoiceKit для корпоративных клиентов с целью распознавания речи в среднем составит 40–45 коп. за минуту двухканального аудио, говорит представитель группы, для образовательных учреждений и студентов сервис будет бесплатным.
Mail.ru Group также активно развивает речевые технологии, включая собственные системы распознавания и синтеза речи вместе с диалоговым движком, говорит директор по технологиям искусственного интеллекта Mail.ru Group Андрей Калинин. «Самые заметные примеры использования технологии — это голосовой помощник «Маруся» и b2b-сервис аудиоаналитики Sounds. В рамках работы MRG Tech Lab мы рассматриваем разные сценарии применения речевых технологий во всех элементах экосистемы Mail.ru Group»,— отметил он. Почти все крупные компании с экспертизой в сфере искусственного интеллекта так или иначе работают с речевыми технологиями, в том числе Microsoft, Nuance и Центр речевых технологий (ЦРТ).
ЦРТ предлагает такие продукты на базе речевых технологий, как запись и очистка от шумов диалогов с клиентами, распознавание и синтез речи, анализ голосовых сообщений и индустриальные решения для голосового сопровождения деятельности сотрудников. Разработки на базе технологий компании используют операторы связи «большой четверки», крупные банки и госкомпании, а также правительства Москвы и Санкт-Петербурга, говорит он. В последние годы ЦРТ сконцентрирован на повышении качества распознавания речи в сложных условиях: улица, общественный транспорт, магазин, офис обслуживания.
По оценке ЦРТ, объем российского рынка речевых технологий в 2018 году составил 2,5–3 млрд руб., а по итогам 2019-го может вырасти на 25%.