Команда Google Deepmind обучает ИИ быть помощником в играх. Его обучение происходит на основе обширного количества видеоматериалов, где люди демонстрируют игровой процесс. Результаты исследования показали, что обученные в разнообразных игровых условиях агенты лучше справляются с неизвестными им ранее играми.
Игровые модели искусственного интеллекта, которые на протяжении десятилетий совершенствовались в мастерстве побеждать в определенных играх, теперь достигли нового уровня благодаря работе команды Google Deepmind. Их цель — создать ИИ, который не только осваивает множество 3D-игр, подобно человеку, но и стремится понимать устные указания и следовать им.
Проект SIMA от Deepmind представляет собой масштабируемого агента, который не полагается на доступ к коду игры или её правилам. Его обучение происходит на основе обширного количества видеоматериалов, где люди демонстрируют игровой процесс. Изучая эти данные и получая подсказки, модель учится распознавать визуальные образы, объекты и их взаимодействия в игровом мире.
Интересный момент обучения заключается в том, что ИИ учится понимать действия, наблюдая за тем, как игроки объясняют их друг другу. Так, наблюдая за перемещением пикселей по экрану, ИИ усваивает, что такое «движение вперед», что является гораздо более сложной задачей, чем простое нажатие кнопки или распознавание объекта.
Обучение проводилось в различных игровых мирах, от Valheim до Goat Simulator 3. Одна из ключевых задач исследования заключалась в проверке, сможет ли ИИ, обученный в одних играх, успешно адаптироваться к другим, ранее неизвестным ему. Результаты показали, что обученные в разнообразных игровых условиях агенты действительно лучше справляются с новыми играми. Однако уникальные механики и специфическая терминология отдельных игр могут стать препятствием даже для продвинутого ИИ, хотя единственное, что мешает модели их освоить — это отсутствие достаточного количества обучающих данных.
В дополнение к фундаментальным достижениям в разработке агентов искусственного интеллекта исследователи стремятся создать модель, которая будет восприниматься как естественный игровой спутник, в отличие от жестко запрограммированных LLM, существующих сегодня. Поскольку ИИ воспринимает игру исключительно через пиксели на экране, он вынужден учиться, подобно человеку, что открывает возможности для адаптации и развития нестандартных поведенческих стратегий.
Другие компании также изучают этот вид сотрудничества, а взаимодействие с неигровыми персонажами рассматривается, как возможности запустить чат-бота.