Essays.club - Получите бесплатные рефераты, курсовые работы и научные статьи
Поиск

Средства автоматического чтения текстовой информации

Автор:   •  Декабрь 11, 2018  •  Реферат  •  1,989 Слов (8 Страниц)  •  509 Просмотры

Страница 1 из 8

ФГБОУ ВО «Волгоградский государственный медицинский университет»
Министерства здравоохранения Российской Федерации

Кафедра математики и информатики

Реферат

Средства автоматического чтения текстовой информации


Выполнил: студент 21 группы 1 курса
лечебного факультета
Ускова Е.А.
Проверил: Глоденко О.Н.,

к.п.н., ст.преподаватель


                                                 Волгоград 2018


Содержание

Ведение                                                                                                      3

1.Виды информации                                                                               3
1.1
 Способы получения и применения информации                          4
2.Понятие  OCR-систем                                                                         6
             
2.1 Структура OCR систем                                                                    7
2.2 Принципы OCR-систем                                                                   8
2.3 Трафаретный классификатор                                                          9  
3. Вывод                                                                                                  9
4 Библиографический список                                                              10      

                                                      Введение        
Ситуация возникновения передовых программ в области определения наступает с конца 40-х годов XX века, когда научные работники многих государств стали трудиться над мыслью изучения компьютера умению решать различные умственные задачи. Автоматическое чтение слова, определение речи, заключение шахматных задач и головоломок и в том числе и сочинение музыки и стихотворений — вот вдали не абсолютный список мыслях, которые выдвигались и разрабатывались в то время. К концу 50-х годов эти идеи оформились в 
отдельную район познания — ненастоящий разум. Одной из задач, которая в скором времени выделилась в отдельное назначение, была задачка определения образов. Совершенная, идеальная компьютерная система определения обязана уметь создавать, разбирать и интерпретировать каждое изображение, в что количестве и символьное. система самодействующего чтения слова — это компьютерная программка, позволяющая конвертировать слова с картонного носителя в электрический текстовый файл, который имеет возможность быть прочитан способами обработки слов.
                                        Виды информации:

  1. По отношению к окружающей среде:
  1. Входная (которую система воспринимает от окружающей среды);
  2. Выходная (которую система выдаёт в окружающую среду);
  3. Внутренняя или внутрисистемная (хранится, перерабатывается и используется только внутри системы);
  1. По изменчивости:
  1. Постоянная;
  2. Переменная;
  3. Смешанная;
  1. По восприятию органами чувств:
  1. Визуальная;
  2. Аудиальная;
  3. Аудиовизуальная;
  4. Тактильная;
  1. По направленности:
  1. Массовая;
  2. Специальная:
  • Научная;
  • Техническая.

Лингвистическая информация– большое количество определённым образом связанных сведений, данных, мнений о языке и правилах его функционирования.
Лингвистическая информатика- урок о законодательстве и способах организации и переработки лингвистической информации с поддержкой ПК.

Способы получения и применения информации:
1.Эмпирические (полученные искусным путём) - надзор, сопоставление, измерение, опыт, интервью, испытание, опрос;
2.Теоретические (теории, гипотезы) – восхождение от отвлеченного к определенному (получение познаний о системе на базе познаний о её проявлениях в сознании, мышлении человека), формализация (получение познаний о системе с поддержкой формул, знаков), виртуализация (создание искусственного происхождения среды).
3.Эмпирико-теоретические – абстрагирование (замена системы её моделью), тест (разъединение системы на подсистемы), синтез (соединение подсистем в системы), индукция (от личного к совокупному, т.е. знание системы с поддержкой подсистемы), дедукция (от совместного к частному), эвристика (знания по наблюдению, опыту), моделирование (использование приборов), исторический способ (знания с учётом предыстории системы), визуализация (уменьшение, поворот, удаление), прогноз
Для такого дабы «понять» оглавление слова, т.е. переместить графическое (точечное) изображение знаков в применимую для последующей обработки (редактирования, реферирования, перевода и т.д.) текстовую форму, важна система самодействующего чтения слова или же оптического определения знаков (OCR-система – Optical Character Recognition). В 1929 году Густав Таушек получил патент на способ оптического определения слова в Германии. Автомат Таушека давала собой механическое прибор, которое пользовалось шаблоны и фотодетектор.В 1954 году Дэвид Х. Шепард основал фирму, которая в скором времени выпустила 1-ые в мире платные системы оптического определения знаков.1-ая платная система была установлена на «Ридерс Дайджест» в 1955 году. 2-ая система была реализована фирмы «Стандарт Ойл» для чтения кредитных карт для работы с чеками.
В 1974 году Рэй Курцвейл начал трудиться над развитием 1 системы оптического определения знаков, способной различить слово, написанный хоть каким шрифтом. Последний продукт был представлен в 1976 г.Первой коммерчески удачной программой, распознающей кириллицу, была программка «AutoR» русской фирмы «ОКРУС». Программка начала распространяться в 1992 году, трудилась под управлением операционной системы DOS.В 1993 году вышла разработка определения слов русской фирмы ABBYY. На ее основе сотворено ряд корпоративных заключений и программ для глобальных юзеров.
                                       ПОНЯТИЕ OCR-СИСТЕМ
Для скорого и высококачественного ввода слова в ПК применяется сканер, работающий по принципу фотоаппарата. Дабы «понять» слово, то есть переместить графику в цифровой вид, необходима система самодействующего определения слова или же оптического определения знаков.

...

Скачать:   txt (15.9 Kb)   pdf (219.6 Kb)   docx (454 Kb)  
Продолжить читать еще 7 страниц(ы) »
Доступно только на Essays.club