27.01.2023

Яндекс научился читать старинные рукописи И искать по ним

Яндекс научился читать старинные рукописи

Текст Павел Иевлев

«Яндекс» сообщил о внедрении технологии распознавания и поиска текстов в старинных рукописях

Компания «Яндекс» сумела научить свои нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. В сервисе «Поиск по архивам» система читает рукописный текст с устаревшей орфографией и неиспользуемыми в современном языке буквами. Это позволило распознать текст в более чем 2,5 миллионах отсканированных страниц исторических документов.

Первым источником стал Главархив Москвы, на материалах которого обучали нейросеть. Позднее добавились архивы Оренбургской и Новгородской областей, и ведется работа над дальнейшим расширением базы.

Поиск по историческим документам востребован не только у ученых-историков и архивистов. Метрические книги, исповедные ведомости и «ревизские сказки» с результатами переписи населения позволяют людям найти своих предков и установить исторические корни.

Использованные источники:

15.12.2023

7 причин подписаться на телеграм-канал «Цифрового океана» Плюс одна причина не подписываться

29.09.2024

Телевизоры Samsung и LG делают скриншоты контента несколько раз в секунду Это можно отключить

Телевизоры Samsung и LG делают скриншоты контента несколько раз в секунду Это можно отключить

29.09.2024

ИИ обходит 100% изображений в капчах Быстрее, чем средний человек

ИИ обходит 100% изображений в капчах Быстрее, чем средний человек

Журнал

свежий номер: ГУМАНОИДНЫЕ РОБОТЫ

Изображение статьи

16.09.2024

Двойной агент Как устроен проект мониторинга и очистки воздуха от «Норникеля»

Двойной агент Как устроен проект мониторинга и очистки воздуха от «Норникеля»

29.09.2024

Сэм Альтман предложил вложить $7 трлн в новые заводы В TSMC сочли его предложение нереалистичным

29.09.2024

Клиенты Сбера теперь могут оплачивать покупки с карт любого банка По биометрии

29.09.2024

Беспилотные грузовики пустят по М-12 «Восток» и М-4 «Дон» До конца года их станет 18

29.09.2024

Процессоры Intel сбоят из-за ошибок на уровне кремния и микрокода Почти все ломаются непоправимо

Процессоры Intel сбоят из-за ошибок на уровне кремния и микрокода Почти все ломаются непоправимо

30.09.2024

Razer выпустила вибросидушку Для настоящих геймеров

Razer выпустила вибросидушку Для настоящих геймеров

30.09.2024

Intel все таки не продалась Arm И заявила, что никому продаваться не планирует

27.08.2024

Глубокоуважаемый вагоноуважатый Как ИИ управляет питерскими трамваями

Глубокоуважаемый вагоноуважатый Как ИИ управляет питерскими трамваями

29.09.2024

Разработаны «умные» теплицы Они сами делают удобрения

29.09.2024

Миллионы автомобилей Kia можно взломать Достаточно отсканировать номерной знак

27.09.2024

Discord могут заблокировать в России Уже в ближайшие дни

27.09.2024

Ученые разработали многорецепторную кожу Вдохновленную утконосами

27.09.2024

Марк Цукерберг пообщался с цифровой копией Оригинал стоял рядом

27.09.2024

Google ограничил создание новых аккаунтов Для пользователей с российскими номерами

Google ограничил создание новых аккаунтов Для пользователей с российскими номерами

27.09.2024

«Бюро 1440» разрабатывает терминал спутниковой связи Для поездов РЖД

«Бюро 1440» разрабатывает терминал спутниковой связи Для поездов РЖД