Алгоритм научили распознавать сгенерированный ИИ текст С точностью 99%

Алгоритм позволяет с точностью 99% выявлять сгенерированный чат-ботом или текст. Для этого ученые создали чат-бот и обучили его на статьях, опубликованных в журнале Science. Затем они сгенерировали несколько сотен текстов на основе реальных научных статей и проанализировали стиль их написания, структуру и смысловые особенности.
Были выделены ключевые отличия сгенерированных ИИ текстов от «человеческих». Например, люди предпочитают более сложные структуры абзацев и часто используют наречия, а чат-боту нравится повторять слова вроде «ученые», «исследователи» и «другие». Для людей также характерна вариативная длина и структура предложений.

На основе этих данных разработан алгоритм, определяющий происхождение текста всего по 20 характерным признакам. Аналогичным образом его можно адаптировать не только для научных статей, но для любых других текстов — в том числе, докладов, сочинений, рефератов и прочего творчества учащихся.
Здесь мы рассказываем, что такое языковая модель и как она работает:
Использованные источники: Unsplash
