Нейросети читают рукописи Продолжается расшифровка архивов
Яндекс расширяет работу по обработке архивов при помощи нейросетей. Документы из Центрального государственного архива Московской области, датированные XVIII – началом XX века, теперь доступны в сервисе "Поиск по архивам". Среди них есть множество записей о людях, которые жили в окрестностях Рязани, Тулы и Владимира.
Благодаря алгоритму, основанному на системе оптического распознавания символов, неподготовленный пользователь может легко читать эти рукописи. Также, сервис облегчает поиск документов, связанных с определенными людьми, местоположением и другими ключевыми словами. Это делает поиск информации о предках, родственниках и исторических личностях проще и более эффективным.
Кроме того, в базу сервиса добавлены еще 700 000 страниц документов из Главархива Москвы и описи из архива Республики Мордовия. Это общедоступные документы, которые ранее не были доступны для поиска.
"Поиск по архивам" был запущен Яндексом в январе 2023 года. За два месяца количество расшифрованных страниц увеличилось вдвое, достигнув пяти миллионов. Более двух миллионов сканов документов уже были просмотрены пользователями. В сервисе доступны также документы из Новгородской и Оренбургской областей.
Как работают нейросети с текстом:
Использованные источники: