В данном кейсе необходимо разработать систему, которая, используя сканы первых и последних листов издания, способна определять, какие страницы содержат обложку, титульный лист, оборот титульного листа (страница с аннотациями, авторскими знаками, УДК) и страницу с выпускными данными (с информацией о подготовке, выпуске и печати книги). Система должна распознавать текст и визуальные элементы на каждой странице и присваивать каждой уникальный идентификатор, отражающий её тип.
Задача предложена компанией МТС Web Services и MTS AI