Средства автоматического чтения текстовой информации
Автор: elena.uskowa2016 • Декабрь 11, 2018 • Реферат • 1,989 Слов (8 Страниц) • 510 Просмотры
ФГБОУ ВО «Волгоградский государственный медицинский университет»
Министерства здравоохранения Российской Федерации
Кафедра математики и информатики
Реферат
Средства автоматического чтения текстовой информации
Выполнил: студент 21 группы 1 курса
лечебного факультета
Ускова Е.А.
Проверил: Глоденко О.Н.,
к.п.н., ст.преподаватель
Волгоград 2018
Содержание
Ведение 3
1.Виды информации 3
1.1 Способы получения и применения информации 4
2.Понятие OCR-систем 6
2.1 Структура OCR систем 7
2.2 Принципы OCR-систем 8
2.3 Трафаретный классификатор 9
3. Вывод 9
4 Библиографический список 10
Введение
Ситуация возникновения передовых программ в области определения наступает с конца 40-х годов XX века, когда научные работники многих государств стали трудиться над мыслью изучения компьютера умению решать различные умственные задачи. Автоматическое чтение слова, определение речи, заключение шахматных задач и головоломок и в том числе и сочинение музыки и стихотворений — вот вдали не абсолютный список мыслях, которые выдвигались и разрабатывались в то время. К концу 50-х годов эти идеи оформились в
отдельную район познания — ненастоящий разум. Одной из задач, которая в скором времени выделилась в отдельное назначение, была задачка определения образов. Совершенная, идеальная компьютерная система определения обязана уметь создавать, разбирать и интерпретировать каждое изображение, в что количестве и символьное. система самодействующего чтения слова — это компьютерная программка, позволяющая конвертировать слова с картонного носителя в электрический текстовый файл, который имеет возможность быть прочитан способами обработки слов.
Виды информации:
- По отношению к окружающей среде:
- Входная (которую система воспринимает от окружающей среды);
- Выходная (которую система выдаёт в окружающую среду);
- Внутренняя или внутрисистемная (хранится, перерабатывается и используется только внутри системы);
- По изменчивости:
- Постоянная;
- Переменная;
- Смешанная;
- По восприятию органами чувств:
- Визуальная;
- Аудиальная;
- Аудиовизуальная;
- Тактильная;
- По направленности:
- Массовая;
- Специальная:
- Научная;
- Техническая.
Лингвистическая информация– большое количество определённым образом связанных сведений, данных, мнений о языке и правилах его функционирования.
Лингвистическая информатика- урок о законодательстве и способах организации и переработки лингвистической информации с поддержкой ПК.
Способы получения и применения информации:
1.Эмпирические (полученные искусным путём) - надзор, сопоставление, измерение, опыт, интервью, испытание, опрос;
2.Теоретические (теории, гипотезы) – восхождение от отвлеченного к определенному (получение познаний о системе на базе познаний о её проявлениях в сознании, мышлении человека), формализация (получение познаний о системе с поддержкой формул, знаков), виртуализация (создание искусственного происхождения среды).
3.Эмпирико-теоретические – абстрагирование (замена системы её моделью), тест (разъединение системы на подсистемы), синтез (соединение подсистем в системы), индукция (от личного к совокупному, т.е. знание системы с поддержкой подсистемы), дедукция (от совместного к частному), эвристика (знания по наблюдению, опыту), моделирование (использование приборов), исторический способ (знания с учётом предыстории системы), визуализация (уменьшение, поворот, удаление), прогноз
Для такого дабы «понять» оглавление слова, т.е. переместить графическое (точечное) изображение знаков в применимую для последующей обработки (редактирования, реферирования, перевода и т.д.) текстовую форму, важна система самодействующего чтения слова или же оптического определения знаков (OCR-система – Optical Character Recognition). В 1929 году Густав Таушек получил патент на способ оптического определения слова в Германии. Автомат Таушека давала собой механическое прибор, которое пользовалось шаблоны и фотодетектор.В 1954 году Дэвид Х. Шепард основал фирму, которая в скором времени выпустила 1-ые в мире платные системы оптического определения знаков.1-ая платная система была установлена на «Ридерс Дайджест» в 1955 году. 2-ая система была реализована фирмы «Стандарт Ойл» для чтения кредитных карт для работы с чеками.
В 1974 году Рэй Курцвейл начал трудиться над развитием 1 системы оптического определения знаков, способной различить слово, написанный хоть каким шрифтом. Последний продукт был представлен в 1976 г.Первой коммерчески удачной программой, распознающей кириллицу, была программка «AutoR» русской фирмы «ОКРУС». Программка начала распространяться в 1992 году, трудилась под управлением операционной системы DOS.В 1993 году вышла разработка определения слов русской фирмы ABBYY. На ее основе сотворено ряд корпоративных заключений и программ для глобальных юзеров.
ПОНЯТИЕ OCR-СИСТЕМ
Для скорого и высококачественного ввода слова в ПК применяется сканер, работающий по принципу фотоаппарата. Дабы «понять» слово, то есть переместить графику в цифровой вид, необходима система самодействующего определения слова или же оптического определения знаков.
...