Essays.club - Получите бесплатные рефераты, курсовые работы и научные статьи
Поиск

Структура и работы информационно-поисковых систем

Автор:   •  Сентябрь 24, 2022  •  Статья  •  975 Слов (4 Страниц)  •  108 Просмотры

Страница 1 из 4

СТРУКТУРА И РАБОТЫ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ

Аннотация: в данной статье объясняется, что такое информационно-поисковая система, причины их появления. Рассмотрена архитектура поисковиков. Показаны рейтинги поисковых систем, а также проблемы с персональными данными человека и их защитой.

Ключевые слова: поисковые системы, защита личной информации, алгоритмы, Интернет, запрос, веб-сайт, индекс базы данных, ссылки.

В последнее время глобальная сеть Интернет - это основное хранилище мировой информации. В связи с тем, что объем информации растет, появилась проблема информационного поиска.

Информационно-поисковая система (ИПС) - программно-аппаратный комплекс с пользовательским интерфейсом, который выполняет поиск нужной информации в сети Интернет. Под поисковой системой, в большинстве случаев, имеется в виду вебсайт, где расположена графическая составляющая поисковой системы. Программная часть поисковой системы - это часть, используемая для сбора, обработки и представления результатов пользователю. У каждого разработчика своя программная часть и это отличает одну поисковую системы от другой.

Изучим подробнее понимание поискового запроса. В качестве примера будем использовать «Google». Чтобы пользователю найти нужную информацию, ему нужно составить максимально краткий и простой запрос. Предположим, у нас цель найти информацию в «Google» о том, как выбрать смартфон. Для этой цели открываем основную страницу «Google» и печатаем наш поисковый запрос «как выбрать смартфон». Тем не менее, пользователи не всегда могут найти необходимую информацию. Тогда нужно переделать запрос, выразить другими словами, потому что в базе данных поисковой системы эта информация может отсутствовать.

Цель поисковой системы - показывать пользователю такую информацию, которую тот задал. Однако, обучить человека делать «правильный» запрос к поисковику невозможно. Из-за этого разработчики пишут такие алгоритмы, с помощью которых люди могут искать нужную информацию.

Совершенствование технологий поиска - приоритетная цель современного Интернета. Создатели этих систем изо дня в день улучшают алгоритмы, тем самым ускоряя поиск. [1]

Когда Интернет только зарождался, количество людей, использующих его было мало, соответственно, и объем информации тоже. Изначально к этой сети доступ был лишь у ученых. [2]. В этот период нужды в поисковых системах не было, чего не скажешь сейчас.

Фактически у каждой поисковой системы своя структура (рис. 1), отличающаяся от конкурентов. Но, в то же время у всех похожие принципы работы.[pic 1]

Рис. 1. Схема ИПС

Пользователь (браузер) или клиент - специализированная программа для просмотра Интернет-ресурса. Эти же сайты оказываются объектом поиска ИПС.

Пользовательский интерфейс - это внешний вид Интернет-ресурса, который служит для понятной передачи информации между человеком и программно-аппаратной системой.

Поисковый движок - алгоритм для поиска заданной информации и предоставление их пользователю.

Индекс базы данных - это индекс, созданный для поиска адреса сайта с максимальной скоростью, с возможностью оценки ценности найденного Интернет-ресурса.

Запросы пользователя остаются в базе данных самого пользователя. На обработку каждого запроса к ИПС тратиться много времени. Вот почему нужно запоминать запросы, ответы на которые знает система.

Индексный робот - создан для постоянного сканирования Интернета, чтобы базы данных были всегда новейшими. Именно этот компонент является очень важной частью информационно-поисковых систем.

Всемирная сеть (WWW - World Wide Web) - это и есть Интернет, другими словами - Интернет-ресурс, с возможностью просмотра через специальную программу (браузер).

Индекс поисковой системы (ПС) - это база данных у поисковой системы, через который происходит поиск требуемой информации. По большей части, это копии сайтов в сжатом виде и ссылки на проиндексированные веб-страницы.

Сохраненная копия сайта - файл, анализированный поисковым роботом, в котором в каждом слове перечислены позиции, где они встречаются. Каждую секунду поисковый робот добавляет новые элементы в Индекс ПС. [3]

...

Скачать:   txt (12.8 Kb)   pdf (182.9 Kb)   docx (121.3 Kb)  
Продолжить читать еще 3 страниц(ы) »
Доступно только на Essays.club