В Москве искусственный интеллект помог расшифровать более девяти миллионов страниц архивных записей
Сервис «Поиск по архивам» позволяет быстро находить упоминания фамилий, имен, населенных пунктов и других слов в исторических документах. Это достигается благодаря мощному алгоритму, который проводит поиск за считанные секунды.
Москва, 13 июня - DIXINEWS.
С помощью сервиса «Поиск по архивам» можно легко и быстро получить доступ к информации, содержащейся в архивах. Это особенно важно для исследователей и историков, которые часто сталкиваются с необходимостью изучения исторических документов. Благодаря разработке им не придется тратить много времени на поиск нужной информации в огромных архивных фондах.
Эксперимент по внедрению технологий компьютерного зрения в сферу архивного дела проводится на базе столичного Главархива. С начала года работает платформа «Поиск по архивам», на которой с помощью нейросетей расшифровываются архивные записи со сложной орфографией XVIII — начала XX века.
Платформа уже стала эффективным помощником для исследователей и архивистов. Всего за несколько месяцев пользователи нашли и изучили около пяти миллионов оцифрованных страниц архивных документов с текстовыми расшифровками — более половины всех представленных материалов.
Искусственный интеллект в считанные секунды находит в исторических документах упоминания фамилий, имен, населенных пунктов и любых других слов. Это облегчает поиск информации о своих предках и помогает в составлении генеалогического древа.
Документы можно искать по каталогу или через строку поиска, также доступны фильтры по годам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями. Если навести курсор на нужный фрагмент, он подсветится на цифровой копии.
К проекту уже присоединились Московская, Оренбургская, Новгородская области, а также республика Мордовия. Нейросети, разработанные в столице, проанализировали около 1,7 миллиона электронных копий документов из региональных архивов. Сервис работает бесплатно на открытой платформе.