Разработка программного обеспечения для распознавания текстовой информации
Автор: Александр Знатнин • Апрель 5, 2022 • Дипломная работа • 7,273 Слов (30 Страниц) • 197 Просмотры
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Саратовский государственный технический университет имени Гагарина Ю.А.»
Институт прикладных информационных технологий и телекоммуникаций
Кафедра «Информационно-коммуникационные системы
и программная инженерия»
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
На тему
«Разработка программного обеспечения для распознавания текстовой информации»
Выполнил: студент группы бПИНЖ-41
Знатнин Александр Александрович
_______________________________
подпись студента
Руководитель: Старший преподаватель кафедры ИКСП Либерман Алёна Ивановна
_______________________________
подпись руководителя
Саратов, 2021г.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 3
1 Анализ подходов к распознаванию текста 5
1.1 Вербальная постановка задачи распознавания текста 5
1.2 Анализ подходов к распознаванию текста 6
1.3 Алгоритм подготовки изображения к распознаванию текста 10
1.4 Подготовка изображения к распознаванию текста 13
1.4.1 Подготовка изображений к распознаванию текста накладной ТОРГ-12 19
1.5 Принципы использования нейронных сетей в распознавании рукописного текста 22
2 Анализ инструментов для распознания текста 28
2.1 Обзор инструментов для распознавания текста 28
2.2 Сравнительный анализ инструментов для распознания текста 30
3 Разработка проекта программного обеспечения для распознавания текста накладной ТОРГ-12 32
3.1 Обзор и анализ аналогичного программного обеспечения 32
3.2 Функциональные и нефункциональные требования к программному обеспечению для распознавания текста накладной ТОРГ-12 35
3.3 Логическая структура программного обеспечения для распознавания текста накладной ТОРГ-12 38
4 Разработка программного обеспечения для распознавания текста накладной ТОРГ-12 39
4.1 Разработка интерфейса 39
4.2 Разработка модуля предобработки 40
4.3 Разработка модуля распознавания 42
4.4 Разработка модуля постобработки 44
ЗАКЛЮЧЕНИЕ 45
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 46
ВВЕДЕНИЕ
На сегодняшний день почти весь документооборот осуществляется с помощью компьютерной техники, но задача полного электронного документооборота ещё далека от решения. Существующие системы и различное ПО, которые работают внутри организаций, а обмен данными между организациями осуществляется с помощью традиционных бумажных документов. Простейшее решение – сканирование документов, но текст на выходном изображении не является машиночитаемым. Существуют системы распознавания текстов на изображении, однако, текстовый формат документа не гарантирует, что он будет поддержан существующей системой электронного документооборота, поэтому для многих компаний требуется собственное решение для распознавания бумажного документа и конвертирования его в определенный формат. Поэтому интерес представляет именно перевод бумажных носителей в определенный формат электронного документа. Актуальность таких систем возрастает вместе с развитием электронного документооборота, внедрением бухгалтерского ПО и подобных программ, в банковских, организационно-управленческих системах.
...