Поиск информации в Интернет
Автор: asu_shilov • Май 27, 2023 • Лабораторная работа • 1,590 Слов (7 Страниц) • 189 Просмотры
Лаб4 Зуев 2.201-2ВИ
Тема. Поиск информации в Интернет (2 часа)
Цель работы: изучение принципов организации поиска в сети Internet и приобретение практических навыков составления поисковых запросов.
Порядок выполнения работы:
- Создайте копию этого файла и сохраните под именем: Лаб4 Фамилия студента № группы.
- Вставьте в файл верхний колонтитул и добавьте в него информацию следующего содержания: «Лаб4 Фамилия студента № группы».
- Ознакомьтесь с теоретическим материалом.
- Выполните «задание», заполнив соответствующие таблицы и ответив на вопросы.
- Отчет предоставить в Moodle в формате Word.
Теоретический материал
Системы поиска информации создаются с учетом особенностей информационных ресурсов и типов данных. Это позволяет разрабатывать адекватные алгоритмы поиска и повышать их эффективность.
Классификация сетевых информационных ресурсов зависит от выбранного признака классификации.
- По способу представления информации:
- Web-страницы (технология WWW);
- Gopher (другой гипертекстовый стандарт,
практически не развивающимся сегодня, т.к. поддерживает только текстовую форму представления информации); - базы данных;
- файловые серверы (FTP – серверы);
- телеконференции (делятся на модерируемые (управляемые - размещение статей производится специальным человеком - модератором, осуществляющим цензуру, и не модерируемые, размещение статей в которых производится автоматически по запросу любого пользователя Сети).
2. По национально-территориальному признаку:
- по языковому признаку:
- основной язык в сети Интернет - английский,
- все основные языки мира также представлены в Сети,
- некоторые сайты поддерживают несколько языков
- по географическому признаку
- принадлежность какой-либо организации, осуществляющей свою деятельность на определенной территории,
- направленность на аудиторию в пределах другого региона
- По виду и характеру информации (content):
- тематическая информация - наиболее ценный тип информации, относящейся к конкретной предметной области: техническая, технологическая, маркетинговая и др.;
- научные публикации - статьи, рефераты, обзоры и пр. публикации научного характера;
- рекламная информация
содержат информацию о фирме - профиль компании (company profile), о предлагаемых ею товарах или услугах, о занимающих ключевые посты людях; через сайт может осуществляться часть работы по поддержке клиентов, FAQ и т.п.; - справочная информация - справочные материалы, ссылки на Web-сайты компаний, нормативную базу и т.д.;
- новости - информация легко доступна, представляет собой вид "сырой", необработанной информации, которая ценна не столько сама по себе, сколько в контексте прочих событий или в динамике развития, и часто нуждается в последующей обработке;
- вторичная информация - систематизированная и предварительно обработанную информацию, обладает значительной ценностью: специализированные тематические сайты, обзоры, подборки рефератов, каталоги и др.
4. По принципу организации и использования средства поиска:
- каталоги - справочники, директории - содержат списки адресов Интернет, сгруппированные по определенным признакам, бъединяются по тематике: наука, искусство, новости и т.д. Особенность - создание структуры, базы данных и их обновление осуществляется "вручную", коллективом редакторов и программистов, и процесс поиска требует непосредственного участия пользователя, самостоятельно переходящего по ссылкам.
- поисковые машины - постоянно исследуют узлы Интернет, доступные данной системе поиска, со всеми их связями. Осуществляют - постоянное обновление информации - машина поиска регулярно возвращается через определенный срок к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, т.е. создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет. При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте. Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.
Для повышения релевантности поиска информации в Интернет применяют различны приемы для формирования поисковых запросов.
...