Американская корпорация IBM и Евросоюз начали создание технологии, преобразующей исторически и культурно значимые тексты в цифровой формат. В проекте IMPACT (IMProving ACcess to Text) участвуют около 30 национальных библиотек, НИИ, университетов и организаций Европы, сообщает пресс-офис компании.

Новый проект позволит европейским институтам создавать высококачественные цифровые копии редких исторических текстов, размещать их в Интернете для общего доступа и редактирования в онлайн-режиме.

В разработке финансируемого Евросоюзом IMPACT используется технология crowd computing, которая адаптирует оцифровку и распознавание текста к особенностям древних шрифтов, искажениям и аномалиям, а также специфическим терминологиям и лексиконам. При ее использовании частота появления ошибок сокращается на 35%.

С помощью этой технологии продолжительность работы корректора сокращается в 16 раз.

IBM решила сосредоточиться на оцифровке данных после покупки Datacap Inc., которая производит ПО, позволяющая организациям преобразовывать методы сбора, управления и автоматизации потоков корпоративных данных.