Компания Anthropic представила обновленные версии своих ИИ-моделей, включая Claude 3.5 Sonnet и Claude 3.5 Haiku. Главное нововведение – возможность физического управления компьютером: ИИ может перемещать курсор, прокручивать страницы и нажимать кнопки.
Как сообщает Decrypt, в демонстрационном видео исследователь Anthropic Сэм Рингер показал, как Claude 3.5 Sonnet заполняет форму на веб-сайте. ИИ просматривает электронную таблицу, находит информацию о компании в CRM-системе и затем автоматически вводит данные в нужные поля формы.
«Разработчики могут управлять Claude так же, как люди используют компьютеры: просматривать экран, перемещать курсор, нажимать кнопки и вводить текст. Claude 3.5 Sonnet – первая передовая ИИ-модель, предлагающая функцию управления компьютером».
Пресс-служба Anthropic
По отзывам пользователей Reddit, обновленный Claude 3.5 Sonnet стал быстрее, точнее и реже «извиняется». Anthropic сообщает, что способности модели к программированию значительно выросли. В тесте SWE-bench Verified Claude 3.5 Sonnet набрал 49%, обогнав конкурентов, таких как o1-preview от OpenAI.
Функция управления компьютером пока доступна только через API. Anthropic обучила Claude визуально интерпретировать содержимое экрана. Разработчики могут давать ему инструкции по выполнению таких задач, как заполнение форм, навигация по веб-сайтам или даже использование программных приложений.
Компания признает, что функция находится в бета-версии и может допускать ошибки, например, при прокрутке и масштабировании. Anthropic внимательно следит за работой функции и проводит проверки безопасности, чтобы выявить любое подозрительное поведение.
Обновленная модель Claude 3.5 Haiku также стала мощнее и теперь сопоставима по производительности с предыдущей флагманской моделью Claude 3 Opus. При этом она работает быстрее и дешевле.