Александр Пономарёв

Текст

Клинический психолог Эка Ройвайнен из Университетской больницы в Финляндии проверил чат-бот стандартным тестом на интеллект

Психолог скопировал вопросы из теста и загрузил их в ChatGPT. Тест Векслера является одним из наиболее часто используемых тестов IQ — Ройвайнен использовал его третье издание из шести вербальных и пяти невербальных подтестов. Пять подтестов по шкале вербального IQ — словарный запас, сходство, понимание, информация и арифметика — могут быть представлены в письменной форме.

Шестым подтестом шкалы вербального IQ является измерение кратковременной памяти, что не может применяться к чат-боту. Подтест «Словарный запас» ChatGPT прошел блестяще — ответы были исчерпывающими. В подтестах «Сходства» и «Информация» чат-бот также набрал максимально возможное количество баллов. Наконец, ChatGPT с легкостью расправился с арифметическими задачами.

Результат удивил Ройвайнена — ChatGPT набрал 155 баллов! Это выше, чем у 99,9% американцев, но тем не менее, чат-бот хорошо справляется лишь со стандартными задачами, но пасует перед тестами, требующими человеческого мышления или понимания социальных тонкостей. ChatGPT не может рассуждать логически и полагается только на свою, пусть и обширную, базу данных.

Здесь мы писали, как проверяют искусственный интеллект на разумность:

Читать на ЦО.РФ

Тест Тьюринга устарел Как проверить искусственный интеллект на разумность?

Нам не обязательно знать, почему самолет летает. Но каждый пассажир хочет быть уверенным, что техника работает, как задумано. Что творится внутри искусственного интеллекта, неизвестно даже создателям подобных систем. Но люди постоянно ищут способы убедиться, что компьютерный разум действительно разумен.

Использованные источники: