Лайфхакер
Лайфхакер
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Бежим с Лайфхакером
Добрые новости
Стыдные вопросы
Есть мнение
Норм или стрём
Личный опыт
Объясняем за минуту
Сервисы
НовостиВеб-сервисы
25 января 2023

«Яндекс» научил нейросети расшифровывать архивные записи со сложной орфографией

Исторические рукописи, которые сложно разобрать человеку, искусственный интеллект почти мгновенно превращает в печатный текст.
Фото автора Виктор Подволоцкий
Виктор Подволоцкий

Шеф-редактор Лайфхакера

«Яндекс» научил нейросети расшифровывать архивные записи со сложной орфографией

«Яндекс» запустил новый сервис «Поиск по архивам», который при помощи нейросетей расшифровывает архивные записи со сложной дореволюционной орфографией.

Сервис открывает доступ к более чем 2,5 миллионам страниц исторических документов с текстовой расшифровкой. Его алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов.

Специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков и десятков миллионов сгенерированных примеров.

Изображение: «Яндекс»

Рукописи, которые неподготовленному человеку сложно разобрать, технология «Яндекса» почти мгновенно превращает в печатный текст. Благодаря этому в базе сервиса можно быстро находить документы с упоминанием фамилии, населённого пункта или любых других слов.

«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье.

Первым представленным в сервисе фондом стал Главархив Москвы — именно на его материалах разработчики обучали нейросеть. Также в базе есть документы из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.

Искать можно по материалам XVIII – начала XX веков, которые больше всего пользуются популярностью у пользователей. Это метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения. Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям.

Изображение: «Яндекс»

Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

Обложка: «Яндекс»
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Это интересно
Это что-то с чем-то: 5 продуктов из «ВкусВилла», которые вы не найдёте в масс-маркете

Это что-то с чем-то: 5 продуктов из «ВкусВилла», которые вы не найдёте в масс-маркете

5 способов успокоиться, если вы переживаете за экзамены ребёнка сильнее, чем он сам

5 способов успокоиться, если вы переживаете за экзамены ребёнка сильнее, чем он сам

7 мифов об уколах для похудения

7 мифов об уколах для похудения

Как сделать жизнь в своём районе комфортнее: 6 простых способов

Как сделать жизнь в своём районе комфортнее: 6 простых способов

Комментарии
Oksana Fedorova
25.01.23 10:47
А где ссылка на сервис?
Что вы могли пропустить
На Apple Design Awards 2026 выбрали 12 лучших приложений и игр
На Apple Design Awards 2026 выбрали 12 лучших приложений и игр
0
Вчера
Новости
Технологии
Обзор Dreame X60 Ultra Complete — флагманского робота-пылесоса с десятком важных апгрейдов
Обзор Dreame X60 Ultra Complete — флагманского робота-пылесоса с десятком важных апгрейдов
0
Вчера
Устройства
Устройства
Amazfit выпустила часы Balance Ultra с автономностью 30 дней и упором на восстановление
Amazfit выпустила часы Balance Ultra с автономностью 30 дней и упором на восстановление
0
Вчера
Новости
Устройства
Это не ваша мама: на Android появилась защита от мошенников, притворяющихся близкими
Это не ваша мама: на Android появилась защита от мошенников, притворяющихся близкими
0
Вчера
Android
Новости
Microsoft представила Project Solara — ОС для устройств с ИИ-агентами на основе Android
Microsoft представила Project Solara — ОС для устройств с ИИ-агентами на основе Android
0
Вчера
Новости
Технологии
Лучшие бесплатные веб-сервисы мая
Лучшие бесплатные веб-сервисы мая
0
Вчера
Веб-сервисы
Веб-сервисы
«Бесконечное» охлаждение ПК: на Computex 2026 показали долговечную альтернативу термопасте
«Бесконечное» охлаждение ПК: на Computex 2026 показали долговечную альтернативу термопасте
0
2 июня
Новости
Технологии
10 новых приложений для iOS: лучшее за май
10 новых приложений для iOS: лучшее за май
0
2 июня
iOS
iOS
На смартфонах Xiaomi заработал встроенный AirDrop для отправки файлов на устройства Apple
На смартфонах Xiaomi заработал встроенный AirDrop для отправки файлов на устройства Apple
0
2 июня
Android
Новости
В AnTuTu назвали самые мощные Android-смартфоны мая — в топе Red Magic с разогнанным чипом
В AnTuTu назвали самые мощные Android-смартфоны мая — в топе Red Magic с разогнанным чипом
0
2 июня
Новости
Устройства
Футбол, бездорожье и котики: 10 лучших игр для Android и iOS в мае
Футбол, бездорожье и котики: 10 лучших игр для Android и iOS в мае
0
1 июня
Технологии
Технологии
Самая странная утечка: неанонсированные смарт-часы Pixel Watch 5 нашли на дне океана
Самая странная утечка: неанонсированные смарт-часы Pixel Watch 5 нашли на дне океана
0
1 июня
Новости
Устройства
Новая эра ПК: Nvidia анонсировала RTX Spark — «самый эффективный чип в истории», заменяющий видеокарту
Новая эра ПК: Nvidia анонсировала RTX Spark — «самый эффективный чип в истории», заменяющий видеокарту
0
1 июня
Новости
Технологии
Как определять растения, животных и грибы с приложением iNaturalist 
Как определять растения, животных и грибы с приложением iNaturalist 
0
31 мая
Технологии
Технологии
15 аксессуаров Baseus и Ugreen, которые подешевеют на большой распродаже AliExpress
15 аксессуаров Baseus и Ugreen, которые подешевеют на большой распродаже AliExpress
0
30 мая
Устройства
Устройства

Новые комментарии

Аватар автора комментария
Алиса Орехова❤7 минут назад

0 / 0

Согласна
Почему не стоит смотреть «Кощей. Начало» — пёстрый мультфильм, вызывающий мигрень
Аватар автора комментария
Алиса Орехова❤8 минут назад

0 / 0

Да да да! Хоть один положительный комментарий!❤
Почему не стоит смотреть «Кощей. Начало» — пёстрый мультфильм, вызывающий мигрень
Аватар автора комментария
Алиса Орехова❤8 минут назад

0 / 0

Ничего не знаю! Я прочитала вашу статью, и скажу прямо: это ни капельки не убавило моей любви к мультику. Я уже 5 лет его очень сильно люблю, и каждый день так и жду, когда его покажут по телевизору. Иногда смотрю на компьютере. Мне не раз становилось лучше во время какой-либо болезни (например отравления), когда я смотрю его. Нередко смотрю по два раза в день. И знаете что? Он мне ещё ни разу не надоел! И никогда не надоест. «Кощей. Начало» - центр всех моих интересов.
Почему не стоит смотреть «Кощей. Начало» — пёстрый мультфильм, вызывающий мигрень
Аватар автора комментария
Алиса Орехова❤8 минут назад

0 / 0

Ничего не знаю! Я прочитала вашу статью, и скажу прямо: это ни капельки не убавило моей любви к мультику. Я уже 5 лет его очень сильно люблю, и каждый день так и жду, когда его покажут по телевизору. Иногда смотрю на компьютере. Мне не раз становилось лучше во время какой-либо болезни (например отравления), когда я смотрю его. Нередко смотрю по два раза в день. И знаете что? Он мне ещё ни разу не надоел! И никогда не надоест. «Кощей. Начало» - центр всех моих интересов.
Почему не стоит смотреть «Кощей. Начало» — пёстрый мультфильм, вызывающий мигрень
ИГРА: Настоящие чемпионы. Найдите своего идеального союзника в мире еды

ИГРА: Настоящие чемпионы. Найдите своего идеального союзника в мире еды

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях