Сгенерированный ИИ текст научились распознавать. Инструмент выпустила компания OpenAI

Сгенерированный ИИ текст научились распознавать Инструмент выпустила компания OpenAI

Текст Александр Пономарёв

Классификатор способен довольно точно определять, был ли текст создан при помощи инструментов искусственного интеллекта — таких как ChatGPT

Классификатор от OpenAI фактически представляет собой особым образом обученную и настроенную языковую модель GPT, которая вычисляет вероятность того, что определенный текст был сгенерирован искусственным интеллектом из различных источников. Компания предупреждает, что классификатор пока не следует использовать в качестве единственного доказательства.

Дело в том, что для точного выявления заимствований он «не совсем надежен», отмечают разработчики. К примеру, в оценках «сложного набора» английских текстов классификатор правильно выявляет лишь 26% написанного ИИ текста, а написанный человеком текст ошибочно помечает как сгенерированный в 9% случаев.

Кроме того, у классификатора есть ряд ограничений — текст должен быть не короче 1000 символов или 150 слов и написан на английском языке, причем взрослыми людьми. Работа классификатора от OpenAI, вероятно, улучшится с течением времени и обучением на дополнительных данных.

Здесь мы объясняем, как работают нейросети: