РЖД создает очередную нейросеть Она должна наконец разобрать уже служебные документы

Предыдущая нейросеть от РЖД сортировала вагоны, новая будет сортировать… документы! В компании насчитывается более 25 тыс. нормативных документов. Большинство из них в несвязанных форматах разных информационных систем и фактически бесполезны, потому что найти их в нужный момент не представляется возможным. Применяемые сейчас системы по управлению нормативной документацией не имеют современных инструментов поиска и анализа текстовой информации (natural language processing), а поиск по ключевикам в массиве 25 тыс. документов на одну тему может привести разве что к душевному расстройству у ищущего. (Представьте себе попытку найти что-то конкретное про вагоны в документации РЖД, если это слово встречается в КАЖДОМ документе.) Одна надежда – на Искусственный Интеллект.
Нейросети могут использоваться для проведения предобработки текста, семантического поиска данных в документах, семантического поиска по созданным векторным пространствам. Тендер на разработку такой системы объявлен в 174,4 млн рублей. Но дело того стоит.
Использованные источники:
