GPT-4 и GPT-5: настоящее и будущее

Многие уже успели оценить новую версию GPT-4. Но к зиме этого года OpenAI обещает выпуск GPT-5, которая вполне может достигнуть уровня artificial general intelligence (AGI), чего еще никогда не было. С другой стороны, Илон Маск и 1000 экспертов призывают приостановить разработки всего, что «умнее» GPT-4. Давайте разбираться, что происходит и чего ждать от GPT-5.

Что умеет GPT-4 и чем принципиально отличается от GPT-3.5

GPT-4 — четвертое поколение модели обработки естественного языка от OpenAI. На первый взгляд кажется, что из нововведений только картинки в запросе. Но на самом деле «под капотом» ИИ стал умнее. Представьте: GPT-4 сдает экзамен на адвоката с оценкой среди 10% лучших участников теста, а предыдущая версия была в 10% худших. В таблице сравнили работу GPT-3.5 и GPT-4.

Чем GPT-4 лучше GPT-3.5:

понимает входящий запрос в виде картинки, а не только текста;
обрабатывает более длинный запрос;
лучше обрабатывает инструкции по программированию;
понимает мемы;
блокирует запросы по запрещенным тематикам на 82% чаще, чем предыдущая версия;
выдает соответствующие ответы на 40% чаще, чем GPT-3.5.

Отличия между GPT-3.5 и GPT-4 не особо чувствуются при простых запросах, но разница ощущается, если давать сложные задачи, которые требуют креативности, надежности и максимальной детализированности при составлении ответа. На графике зеленые столбцы показывают, насколько лучше GPT-4 справляется с американскими экзаменами.

В таблице видно количество очков, которое набрали GPT-3.5 и GPT-4 при сдаче тестов. Мелким шрифтов отмечено попадание в процент лучших. Например, математический экзамен SAT Math модель сдала, набрав 700 из 800 баллов и попав в топ 11% проходящих этот тест. Причем ИИ не тренировали специально именно для этого теста.

GPT-4 поддерживает 24 языка и около 500 млрд параметров. Но стоит понимать, что чем больше параметров, тем медленнее работа системы, так как нужно время, чтобы обсчитывать гигантские уравнения для генерации слов в новом запросе. А значит, нужно больше вычислительной мощности.

К тому же, как и предыдущая версия, GPT-4 ограничивается данными до 2021 года, поэтому не сможет предоставить самую свежую информацию.

Для определения уровня «сообразительности» ИИ раньше использовали бенчмарки (задания, вопросы с ответами, графики, картинки, задачки).

Но сейчас они не успевают за развитием нейросетей, что показано на графике. Однако в OpenAI не нуждаются в такой оценке, так как они позиционируют свои разработки как равные человеческому разуму.

Чего ждать от GPT-4.5

OpenAI выпустит сначала промежуточную версию GPT-4.5 к осени 2023 года. Тогда станет ясно, над какими улучшениями работает компания. Ее представители утверждают, что в ней будут еще больше улучшены разговорные способности и понимание контекста. Будущая модель GPT-4.5 устранит некоторые ограничения своей предшественницы, улучшив ее производительность и расширив возможности применения.

Основные усовершенствования GPT-4.5 будут включать:

обработку длинных текстовых вводов. Модель GPT-4.5, вероятно, будет способна обрабатывать и генерировать более длинные текстовые данные, сохраняя при этом контекст и связность. Это улучшение сделает модель еще более универсальной в решении сложных задач и понимании намерений пользователя;
улучшенную согласованность тем. В будущем GPT-4.5 может обеспечить еще лучшую согласованность тем, гарантируя, что генерируемый текст будет оставаться сфокусированным на соответствующей теме на протяжении всего разговора или процесса создания контента;
более точные ответы. По мере развития модель GPT-4.5 может предложить более точные и контекстуально релевантные ответы, что сделает ее еще более эффективным инструментом для различных приложений;
улучшенные возможности тонкой настройки. Это позволит разработчикам более эффективно адаптировать модель для конкретных задач или областей. Это облегчит настройку модели для различных приложений, таких как поддержка клиентов, создание контента и виртуальная помощь.

Будущие достижения GPT-4.5 послужат основой для инноваций, которые мы можем ожидать от GPT-5. Устраняя ограничения GPT-4 и внедряя новые усовершенствования, GPT-4.5 сыграет решающую роль в формировании GPT-5.

Что будет уметь GPT-5

Прогнозисты предсказывали, что AGI будет готов к 2032 году. Но, возможно, этот уровень прогресса мы достигнем намного быстрее.

ChatGPT с выходом пятой версии может стать неотличимым от человека, так считают его создатели. Разработчик Сики Чэнь (Siqi Chen) поделился в соцсетях, что обучение GPT-5 должно завершиться в декабре этого года, и в OpenAI говорят, что модель достигнет уровня AGI (Artificial general intelligence, общий искусственный интеллект). Другими словами, это будет полноценный искусственный интеллект, который станет похож на человека в понимании концепций и задач.

Прогресс будет достигнут благодаря работе над всеми аспектами GPT (данные, алгоритмы, тонкая настройка и прочее). GPT-5, возможно, сможет пройти тест Тьюринга. Но это не будет стоить затраченных усилий, по мнению генерального директора OpenAI Сэма Альтмана.

Ожидают, что GPT-5:

в общении станет неотличим от человека;
сможет выполнять большинство задач на уровне человека;
в обработке данных и генерации контента превзойдет людей.

Но пока это только предположения. На сайте компании отмечено, что GPT-5 можно ожидать в четвертом квартале 2023 года. Единственная информация из этого официального источника:

«ChatGPT-5 станет самой продвинутой версией языковой модели GPT, разработанной OpenAI. Благодаря усовершенствованной архитектуре ChatGPT-5 будет понимать и генерировать естественный язык более сложным и тонким образом, чем когда-либо прежде. Модель GPT-5 расширит границы возможного в машинном обучении и будет способна произвести революцию в том, как мы общаемся и взаимодействуем с технологиями».

GPT-4 уже называют мультимодальным, так как он понимает изображения. Но функция не полностью работает. А это означает: можно ждать, что GPT-5 будет поддерживать все виды медиа. Для этого мощность модели будет увеличена в десятки раз. Но пока это только предположения. Еще не понятно, уложится ли в свой график OpenAI, так как более 1000 экспертов призвали остановить разработки мощных ИИ как минимум на полгода.

Если сейчас, после обновлений и появления GPT-4, чат-бот поддерживает много языков, сдает экзамены, подключается к интернету через плагины, поддерживает мультимодальный ввод, то, вероятно, GPT-5 будет способен выдавать результаты еще быстрее и точнее, справляться с еще более сложными задачами. Остается дождаться его выхода в свет.

Подписывайтесь на наш Telegram Подписаться