IBM поможет Евросоюзу создать базу редких документов

    IBM и представители Евросоюза объединят свои усилия по сканированию и составлению электронного каталога ценных исторических документов. Работа будет вестись в более чем 20 библиотеках, университетах, исследовательских лабораториях и компаниях-владельцах редких исторических документов и книг.

    Проект, известный как Impact (Improving Access to Text), использует новые технологии сканирования для обеспечения наивысшего качества и точности копий, а также ускорения совместной работы над оцифровкой исторических документов. В дальнейшем Impact предоставит полученные копии для составления веб-каталога, по которому смогут искать пользователи. Таким образом, пользователи и исследователи, не имеющие прямого доступа к документу, смогут просмотреть его копию в сети Интернет.

    Библиотеки и институты потратили около 20 лет на сканирование и распознавание документов собственными силами, однако плохое качество копий и устаревшие образцы написания букв значительно затрудняют процесс распознавания и замедляют работу.

    Новое программное обеспечение, которое готова представить IBM, ускорит процесс распознавания и увеличит его точность на 25-50% по сравнению со стандартными программами распознавания. Кроме того, система может учитывать собственные ошибки и обладает способностью к самообучению, чтобы распознавать редкие шрифты. Для увеличения количества работающих над проектом, IBM привлечет добровольцев, готовых вычитывать документы, указывать на допущенные ошибки и выбирать из предложенных веб-интерфейсом вариантов наиболее подходящий.

    Основатель Searchengines.ru. С 2005 по 2014 год работал генеральным директором компании "Яндекс.Украина". Основатель и директор крупнейшего коворкинга Одессы — "Терминал 42". Ведет блог, участвует в подкастах. Больше ничего не умеет.