Open AI представила сайт для преобразования текста в речь

Компания Open AI представила новые модели преобразования речи в текст и текста в речь, доступные через API. Эти решения позволяют разработчикам создавать персонализированные голосовые агенты для клиентского сервиса, транскрипции и креативных проектов.

Open AI активно развивает интеллект и функциональность текстовых агентов — систем, которые автономно выполняют задачи для пользователей. Среди ключевых релизов — Operator, Deep Research, Computer-Using Agents и Responses API с интегрированными инструментами. Однако для того, чтобы такие агенты стали по-настоящему полезными, пользователи должны иметь возможность общаться с ними естественно, используя разговорный язык.

Компания объявила о запуске новых моделей преобразования речи в текст и текста в речь в своем API. Эти модели устанавливают новый стандарт точности и надежности, особенно в сложных условиях, таких как шумная среда или речь с акцентами. Они идеально подходят для использования в колл-центрах, транскрипции встреч и других сценариях, где важна точность.

Впервые разработчики смогут настраивать голосовые агенты, задавая тон и стиль речи, например, «говорить как отзывчивый агент службы поддержки». Протестировать преобразование текста в речь уже можно на сайте openai.fm.

С 2022 года компания активно развивает аудиомодели, улучшая их интеллект и точность. Новые модели позволяют разработчикам создавать более надежные и персонализированные голосовые решения, расширяя возможности взаимодействия с пользователями через естественный разговорный язык.

Что будем искать? Например,ChatGPT

Мы в социальных сетях