Обучить за 72 часа: в НИТУ МИСИС ускорили настройку системы распознавания текста
Исследователи НИТУ МИСИС представили новый подход к обучению систем OCR, основанный на объединении инструментов машинного обучения и современных генеративных моделей искусственного интеллекта. Они создали замкнутый цикл взаимодействия OCR-движков и языковых моделей, благодаря которому система сама анализирует результаты распознавания и корректирует ошибки. Такой подход значительно ускоряет обучение: процесс, который в классических схемах занимает до двух месяцев, в ходе эксперимента был сокращён до 72 часов непрерывной работы.
«Одним из ключевых результатов стало повышение качества распознавания — оно превысило 90% для русского языка, что соответствует современным требованиям к автоматизации документооборота. Кроме того, затраты на обучение моделей удалось снизить почти на треть, а использование генеративных нейросетей сократило необходимый объём тестовой выборки», — объяснил один из авторов разработки, магистрант Института компьютерных наук НИТУ МИСИС Кирилл Пронин.
Разработчики подробно изучили поведение систем на «идеальных» документах и «реальных» сканах с неровными подписями и печатями. Полученные данные позволили определить наиболее эффективные сочетания технологий.
«Мы предложили подход, где языковая модель, понимающая контекст и смысл, помогает создавать более сложные и „хитрые“ обучающие данные — например, имитирующие плохое качество печати, нестандартные шрифты или сложную вёрстку. Это позволяет научить систему распознавать текст в реальных, „неидеальных“ условиях, существенно повышая её точность и надёжность», — добавил к.т.н. Александр Сулейкин, доцент кафедры бизнес-информатики и систем управления производством НИТУ МИСИС.
Дальнейшее развитие методов обучения на базе нейронных сетей ускорит появление более точных и доступных OCR-решений для бизнеса и научных задач. Исследование было представлено на 20-ой международной конференции в области применения ИИ и машинного обучения ISKE в г. Шунде (Китай).
Технологии
Пресс-служба НИТУ МИСИС
ОМК и Университет МИСИС разработали технологию выпуска нефтегазовых труб без швов и коррозии
Российские ученые создали «умный» сенсор для аккумуляторов будущего