Структура и работы информационно-поисковых систем
Автор: BulatID • Сентябрь 24, 2022 • Статья • 975 Слов (4 Страниц) • 155 Просмотры
СТРУКТУРА И РАБОТЫ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ
Аннотация: в данной статье объясняется, что такое информационно-поисковая система, причины их появления. Рассмотрена архитектура поисковиков. Показаны рейтинги поисковых систем, а также проблемы с персональными данными человека и их защитой.
Ключевые слова: поисковые системы, защита личной информации, алгоритмы, Интернет, запрос, веб-сайт, индекс базы данных, ссылки.
В последнее время глобальная сеть Интернет - это основное хранилище мировой информации. В связи с тем, что объем информации растет, появилась проблема информационного поиска.
Информационно-поисковая система (ИПС) - программно-аппаратный комплекс с пользовательским интерфейсом, который выполняет поиск нужной информации в сети Интернет. Под поисковой системой, в большинстве случаев, имеется в виду вебсайт, где расположена графическая составляющая поисковой системы. Программная часть поисковой системы - это часть, используемая для сбора, обработки и представления результатов пользователю. У каждого разработчика своя программная часть и это отличает одну поисковую системы от другой.
Изучим подробнее понимание поискового запроса. В качестве примера будем использовать «Google». Чтобы пользователю найти нужную информацию, ему нужно составить максимально краткий и простой запрос. Предположим, у нас цель найти информацию в «Google» о том, как выбрать смартфон. Для этой цели открываем основную страницу «Google» и печатаем наш поисковый запрос «как выбрать смартфон». Тем не менее, пользователи не всегда могут найти необходимую информацию. Тогда нужно переделать запрос, выразить другими словами, потому что в базе данных поисковой системы эта информация может отсутствовать.
Цель поисковой системы - показывать пользователю такую информацию, которую тот задал. Однако, обучить человека делать «правильный» запрос к поисковику невозможно. Из-за этого разработчики пишут такие алгоритмы, с помощью которых люди могут искать нужную информацию.
Совершенствование технологий поиска - приоритетная цель современного Интернета. Создатели этих систем изо дня в день улучшают алгоритмы, тем самым ускоряя поиск. [1]
Когда Интернет только зарождался, количество людей, использующих его было мало, соответственно, и объем информации тоже. Изначально к этой сети доступ был лишь у ученых. [2]. В этот период нужды в поисковых системах не было, чего не скажешь сейчас.
Фактически у каждой поисковой системы своя структура (рис. 1), отличающаяся от конкурентов. Но, в то же время у всех похожие принципы работы.[pic 1]
Рис. 1. Схема ИПС
Пользователь (браузер) или клиент - специализированная программа для просмотра Интернет-ресурса. Эти же сайты оказываются объектом поиска ИПС.
Пользовательский интерфейс - это внешний вид Интернет-ресурса, который служит для понятной передачи информации между человеком и программно-аппаратной системой.
Поисковый движок - алгоритм для поиска заданной информации и предоставление их пользователю.
Индекс базы данных - это индекс, созданный для поиска адреса сайта с максимальной скоростью, с возможностью оценки ценности найденного Интернет-ресурса.
Запросы пользователя остаются в базе данных самого пользователя. На обработку каждого запроса к ИПС тратиться много времени. Вот почему нужно запоминать запросы, ответы на которые знает система.
Индексный робот - создан для постоянного сканирования Интернета, чтобы базы данных были всегда новейшими. Именно этот компонент является очень важной частью информационно-поисковых систем.
Всемирная сеть (WWW - World Wide Web) - это и есть Интернет, другими словами - Интернет-ресурс, с возможностью просмотра через специальную программу (браузер).
Индекс поисковой системы (ПС) - это база данных у поисковой системы, через который происходит поиск требуемой информации. По большей части, это копии сайтов в сжатом виде и ссылки на проиндексированные веб-страницы.
Сохраненная копия сайта - файл, анализированный поисковым роботом, в котором в каждом слове перечислены позиции, где они встречаются. Каждую секунду поисковый робот добавляет новые элементы в Индекс ПС. [3]
...