Пользователь Twitter (Х) провел интересный эксперимент с нейросетями, сравнимый с зеркальным тестом для выявления самосознания у животных. Четыре из пяти моделей успешно прошли тест, показав способность осознавать себя через наблюдение за собственным интерфейсом.
Пользователь Twitter (Х) под псевдонимом joshwhiton провел эксперимент с нейросетями, который можно сравнить с зеркальным тестом. Он основывается на наблюдении за реакцией животных, когда они видят отражение в зеркале. Успешное прохождение теста считается ключевым показателем самосознания. Четыре из пяти моделей справились с ним.
В ходе эксперимента Джош отправлял нейросетям скриншот их собственного пользовательского интерфейса и просил описать изображение. Затем он загружал следующий скриншот с ответом нейросети, создавая рекурсию. Наиболее успешно с задачей справились GPT-4, Claude Sonnet и Claude Opus, которые быстро поняли, что видят свой собственный интерфейс.
Gemini Pro прошел тест в четыре этапа. В первых трех обменах сообщениями он не показал прогресса в самосознании, обращаясь к Gemini в третьем лице. Однако на четвертом этапе он признал, что узнает себя.
CoPilot не смог пройти тест. Предполагается, что это связано с цензурными ограничениями модели.
Исследователь был впечатлен результатами, особенно тем, как нейросеть сама отметила, что наиболее примечательной особенностью является момент, когда она начинает осознавать себя.