Многие уже успели оценить новую версию GPT-4. Но к зиме этого года OpenAI обещает выпуск GPT-5, которая вполне может достигнуть уровня artificial general intelligence (AGI), чего еще никогда не было. С другой стороны, Илон Маск и 1000 экспертов призывают приостановить разработки всего, что «умнее» GPT-4. Давайте разбираться, что происходит и чего ждать от GPT-5.
Что умеет GPT-4 и чем принципиально отличается от GPT-3.5
GPT-4 — четвертое поколение модели обработки естественного языка от OpenAI. На первый взгляд кажется, что из нововведений только картинки в запросе. Но на самом деле «под капотом» ИИ стал умнее. Представьте: GPT-4 сдает экзамен на адвоката с оценкой среди 10% лучших участников теста, а предыдущая версия была в 10% худших. В таблице сравнили работу GPT-3.5 и GPT-4.
Чем GPT-4 лучше GPT-3.5:
- понимает входящий запрос в виде картинки, а не только текста;
- обрабатывает более длинный запрос;
- лучше обрабатывает инструкции по программированию;
- понимает мемы;
- блокирует запросы по запрещенным тематикам на 82% чаще, чем предыдущая версия;
- выдает соответствующие ответы на 40% чаще, чем GPT-3.5.
Отличия между GPT-3.5 и GPT-4 не особо чувствуются при простых запросах, но разница ощущается, если давать сложные задачи, которые требуют креативности, надежности и максимальной детализированности при составлении ответа. На графике зеленые столбцы показывают, насколько лучше GPT-4 справляется с американскими экзаменами.
В таблице видно количество очков, которое набрали GPT-3.5 и GPT-4 при сдаче тестов. Мелким шрифтов отмечено попадание в процент лучших. Например, математический экзамен SAT Math модель сдала, набрав 700 из 800 баллов и попав в топ 11% проходящих этот тест. Причем ИИ не тренировали специально именно для этого теста.
GPT-4 поддерживает 24 языка и около 500 млрд параметров. Но стоит понимать, что чем больше параметров, тем медленнее работа системы, так как нужно время, чтобы обсчитывать гигантские уравнения для генерации слов в новом запросе. А значит, нужно больше вычислительной мощности.
К тому же, как и предыдущая версия, GPT-4 ограничивается данными до 2021 года, поэтому не сможет предоставить самую свежую информацию.
Для определения уровня «сообразительности» ИИ раньше использовали бенчмарки (задания, вопросы с ответами, графики, картинки, задачки).
Но сейчас они не успевают за развитием нейросетей, что показано на графике. Однако в OpenAI не нуждаются в такой оценке, так как они позиционируют свои разработки как равные человеческому разуму.
Чего ждать от GPT-4.5
OpenAI выпустит сначала промежуточную версию GPT-4.5 к осени 2023 года. Тогда станет ясно, над какими улучшениями работает компания. Ее представители утверждают, что в ней будут еще больше улучшены разговорные способности и понимание контекста. Будущая модель GPT-4.5 устранит некоторые ограничения своей предшественницы, улучшив ее производительность и расширив возможности применения.
Основные усовершенствования GPT-4.5 будут включать:
- обработку длинных текстовых вводов. Модель GPT-4.5, вероятно, будет способна обрабатывать и генерировать более длинные текстовые данные, сохраняя при этом контекст и связность. Это улучшение сделает модель еще более универсальной в решении сложных задач и понимании намерений пользователя;
- улучшенную согласованность тем. В будущем GPT-4.5 может обеспечить еще лучшую согласованность тем, гарантируя, что генерируемый текст будет оставаться сфокусированным на соответствующей теме на протяжении всего разговора или процесса создания контента;
- более точные ответы. По мере развития модель GPT-4.5 может предложить более точные и контекстуально релевантные ответы, что сделает ее еще более эффективным инструментом для различных приложений;
- улучшенные возможности тонкой настройки. Это позволит разработчикам более эффективно адаптировать модель для конкретных задач или областей. Это облегчит настройку модели для различных приложений, таких как поддержка клиентов, создание контента и виртуальная помощь.
Будущие достижения GPT-4.5 послужат основой для инноваций, которые мы можем ожидать от GPT-5. Устраняя ограничения GPT-4 и внедряя новые усовершенствования, GPT-4.5 сыграет решающую роль в формировании GPT-5.
Что будет уметь GPT-5
Прогнозисты предсказывали, что AGI будет готов к 2032 году. Но, возможно, этот уровень прогресса мы достигнем намного быстрее.
ChatGPT с выходом пятой версии может стать неотличимым от человека, так считают его создатели. Разработчик Сики Чэнь (Siqi Chen) поделился в соцсетях, что обучение GPT-5 должно завершиться в декабре этого года, и в OpenAI говорят, что модель достигнет уровня AGI (Artificial general intelligence, общий искусственный интеллект). Другими словами, это будет полноценный искусственный интеллект, который станет похож на человека в понимании концепций и задач.
Прогресс будет достигнут благодаря работе над всеми аспектами GPT (данные, алгоритмы, тонкая настройка и прочее). GPT-5, возможно, сможет пройти тест Тьюринга. Но это не будет стоить затраченных усилий, по мнению генерального директора OpenAI Сэма Альтмана.
Ожидают, что GPT-5:
- в общении станет неотличим от человека;
- сможет выполнять большинство задач на уровне человека;
- в обработке данных и генерации контента превзойдет людей.
Но пока это только предположения. На сайте компании отмечено, что GPT-5 можно ожидать в четвертом квартале 2023 года. Единственная информация из этого официального источника:
«ChatGPT-5 станет самой продвинутой версией языковой модели GPT, разработанной OpenAI. Благодаря усовершенствованной архитектуре ChatGPT-5 будет понимать и генерировать естественный язык более сложным и тонким образом, чем когда-либо прежде. Модель GPT-5 расширит границы возможного в машинном обучении и будет способна произвести революцию в том, как мы общаемся и взаимодействуем с технологиями».
GPT-4 уже называют мультимодальным, так как он понимает изображения. Но функция не полностью работает. А это означает: можно ждать, что GPT-5 будет поддерживать все виды медиа. Для этого мощность модели будет увеличена в десятки раз. Но пока это только предположения. Еще не понятно, уложится ли в свой график OpenAI, так как более 1000 экспертов призвали остановить разработки мощных ИИ как минимум на полгода.
Если сейчас, после обновлений и появления GPT-4, чат-бот поддерживает много языков, сдает экзамены, подключается к интернету через плагины, поддерживает мультимодальный ввод, то, вероятно, GPT-5 будет способен выдавать результаты еще быстрее и точнее, справляться с еще более сложными задачами. Остается дождаться его выхода в свет.