Сгенерированный ИИ текст научились распознавать Инструмент выпустила компания OpenAI
Классификатор от OpenAI фактически представляет собой особым образом обученную и настроенную языковую модель GPT, которая вычисляет вероятность того, что определенный текст был сгенерирован искусственным интеллектом из различных источников. Компания предупреждает, что классификатор пока не следует использовать в качестве единственного доказательства.
Дело в том, что для точного выявления заимствований он «не совсем надежен», отмечают разработчики. К примеру, в оценках «сложного набора» английских текстов классификатор правильно выявляет лишь 26% написанного ИИ текста, а написанный человеком текст ошибочно помечает как сгенерированный в 9% случаев.
Кроме того, у классификатора есть ряд ограничений — текст должен быть не короче 1000 символов или 150 слов и написан на английском языке, причем взрослыми людьми. Работа классификатора от OpenAI, вероятно, улучшится с течением времени и обучением на дополнительных данных.
Здесь мы объясняем, как работают нейросети:
Использованные источники: