Павел Иевлев

Текст

Яндекс расшифровал 300 000 страниц метрических книг из Центрального государственного архива Московской области

Яндекс расширяет работу по обработке архивов при помощи нейросетей. Документы из Центрального государственного архива Московской области, датированные XVIII – началом XX века, теперь доступны в сервисе "Поиск по архивам". Среди них есть множество записей о людях, которые жили в окрестностях Рязани, Тулы и Владимира.

Благодаря алгоритму, основанному на системе оптического распознавания символов, неподготовленный пользователь может легко читать эти рукописи. Также, сервис облегчает поиск документов, связанных с определенными людьми, местоположением и другими ключевыми словами. Это делает поиск информации о предках, родственниках и исторических личностях проще и более эффективным.

Кроме того, в базу сервиса добавлены еще 700 000 страниц документов из Главархива Москвы и описи из архива Республики Мордовия. Это общедоступные документы, которые ранее не были доступны для поиска.

"Поиск по архивам" был запущен Яндексом в январе 2023 года. За два месяца количество расшифрованных страниц увеличилось вдвое, достигнув пяти миллионов. Более двух миллионов сканов документов уже были просмотрены пользователями. В сервисе доступны также документы из Новгородской и Оренбургской областей.

Как работают нейросети с текстом:

Читать на ЦО.РФ

Великий русский читатель Правила компьютерной лингвистики

Восемь миллиардов человек, населяющих Землю, — ​это сила. Пять миллиардов из них, имеющих доступ в интернет, — ​это уже стихия. Информационные цунами, которые люди с легкостью разгоняют в соцсетях, можно и нужно уметь предсказывать. Для этого достаточно всего лишь читать и понимать все, что пишут пять миллиардов человек

Использованные источники: