Преобразование XML–PDF посредством XSLTProc и ApacheFOP
Автор: Almaz • Ноябрь 15, 2021 • Лабораторная работа • 6,073 Слов (25 Страниц) • 231 Просмотры
Лабораторная работа № 3
Преобразование XML–PDF посредством XSLTProc и ApacheFOP
Теоретическая часть.
Данные в информационных системах хранятся в каких-либо конкретных форматах и структурах. Каких именно – необходимо определять из соображений оптимальности и эффективности их хранения, использования, обработки, отображения в тех или иных рабочих процессах.
Значительная часть информационных систем в настоящее время неразрывно связана с Интернет-технологиями. Что было необходимо для того чтобы это объединение стало возможным ?
Изначально для успешного развития Интернета необходимо было определить — "как система В сможет переработать информацию, которую предоставит ей система A?". Пытаясь ответить на это, специалисты в области ИТ стали создавать способы, а в дальнейшем стандарты и протоколы, которые позволили бы системам общаться на одних языках. Вместе с тем, по мере глобализации Интернета и увеличения числа систем, обменивающихся информацией (от рабочих станций обычных пользователей — до суперсерверов с огромными базами данных), объем информации, требовавшей стандартного выражения, прогрессировал экспоненциально.
Расширяемый язык разметки XML (eXtensible Mark-up Language) — это результат довольно успешной попытки создать язык для текстового выражения структурированной информации в стандартном виде. XML — это метаязык в том смысле, что сам по себе он не имеет операторов, не определяет никакую алгоритмическую последовательность действий и не выполняет никаких вычислений, его цель — описывать новые языки документов.
Большое количество систем, стандартов и технологий приводит к тому, что эффективно связать разные источники данных в одну систему представляет собой довольно сложный и трудоемкий процесс. Даже такие, казалось бы, однородные источники, как системы управления базами данных, применяют языки запросов и форматы представления выбираемой информации, которые далеко не всегда полностью совместимы между собой. Как следствие, проекты интеграции в таких условиях требуют больших усилий — требуется вникать в детали различных баз данных, протоколов, операционных систем и так далее.
В результате интеграция нескольких приложений или систем может превратиться в схему, показанную на рис. 1. Несложно представить трудозатраты подобного рода проекта. Заставить разные системы работать вместе — чрезвычайно трудоемкая задача.
[pic 1]
Рис. 1. Типичная схема интеграции нескольких приложений
Идея использования XML в интеграции информационных систем сводится к созданию общего XML-языка, которым могла бы пользоваться каждая из них.
Такое решение сразу же намного упрощает проект — ведь вместо реализации взаимодействия между каждой парой систем следует всего лишь научить каждую из них "говорить" на созданном XML-языке. Иначе говоря, все сводится к разработке нескольких врапперов (англ. wrapper — упаковщик, программное средство создания системной оболочки для стандартизации внешних обращений и изменения функциональной ориентации действующей системы), которые будут переводить со стандартного XML-языка интегрированной системы на язык, понятный каждой системе в отдельности.
[pic 2]
Рис. 2. Интеграция на основе XML
В принципе, интеграция по XML-схеме (рис. 2) не отличается коренным образом от интеграции на основе любого другого общего стандарта. Вместе с тем, она имеет целый ряд весомых преимуществ:
- XML-языки не зависят от аппаратных и программных платформ, что позволяет связывать разнородные системы;
- выразительная мощность XML достаточно велика для того, чтобы описать данные практически любой сложности;
- средства разработки и стандартные библиотеки для XML существуют практически на всех платформах и для большинства популярных языков программирования;
- методы работы с XML достаточно стандартны для того, чтобы в разных системах можно было пользоваться одинаковыми приемами;
- информация, оформленная в виде XML, может обрабатываться не только машинами, но и человеком (что намного облегчает отладку).
Если говорить об XML как об одной из технологий создания больших объемов документации (в первую очередь технической) коллективом авторов, редакторов, технических специалистов и организации доступа к этим объемам документации со стороны различных систем и читателей, то важно помнить, что документация при ее создании с помощью XML технологий разделяется на 3 физически изолированных составляющих: 1. Содержание документов 2. Структура документов 3. Стили оформления документов.
...