Essays.club - Получите бесплатные рефераты, курсовые работы и научные статьи
Поиск

Оценка качества поиска информации

Автор:   •  Июнь 7, 2018  •  Лабораторная работа  •  558 Слов (3 Страниц)  •  1,023 Просмотры

Страница 1 из 3

Московский авиационный институт

(Национальный исследовательский университет)

Факультет № 3.

Системы управления, информатика и электроэнергетика.

Кафедра 304.

Отчет по работе

по учебной дисциплине

«Информационный менеджмент»

на тему

«Оценка качества поиска информации»

Группа:

М30-110Б-17

Выполнила:

Луканова Е.А.

Москва 2018

Исходные данные: поисковая система «Google».

Оценивается поиск книги: «Задачи и упражнения по математическому анализу для втузов. Под редакцией Б.П.Демидовича»

Оцениваются полученные данные после ввода в поисковую систему Google запроса: «Задачи и упражнения по математическому анализу для втузов Демидович».

Система нашла 14500 результатов, проведена выборка в 30 штук.

Основные категории документов в ответах системы при первом запросе:

Обозначение

Наименование

Количество (шт)

а

Количество документов, найденных системой

и релевантных запросу.

9

b

Количество документов, найденных системой,

но не релевантных запросу.

20

с

Количество релевантных документов,

не найденных системой.

1

d

Количество нерелевантных документов,

не найденных системой

0

 

Метрики оценки качества работы системы:

Наименование метрики

Формула подсчета

Численное значение (%)

Полнота (recall)

[pic 1]

90

Точность (precision)

[pic 2]

31

Аккуратность (accuracy)

[pic 3]

30

Ошибка (error)

[pic 4]

70

Полнота и точность в одной метрике (F-measure)

[pic 5]

46,1


Для оценки качества поиска запрос системе меняется на запрос: «Задачи  по математическому анализу Демидович».

При таком запросе количество найденных документов увеличилось до 15000 штук.

Проведена выборка в 30 штук.

Обозначение

Наименование

Количество

11IT.

а

Количество документов, найденных системой

и релевантных запросу.

11

b

Количество документов, найденных системой,

но не релевантных запросу.

18

с

Количество релевантных документов,

не найденных системой.

1

d

Количество нерелевантных документов,

не найденных системой

0

Метрики оценки качества работы системы:

Наименование метрики

Формула подсчета

Численное значение (%)

Полнота (recall)

[pic 6]

91,7

Точность (precision)

[pic 7]

37,9

Аккуратность (accuracy)

[pic 8]

36,7

Ошибка (error)

[pic 9]

63,3

Полнота и точность в одной метрике (F-measure)

[pic 10]

53,6


Усреднение множественных метрик (макроусреднение):

Наименование метрики

Формула усреднения

Численное значение (%)

Полнота (recall)

[pic 11]

90,85

Точность (precision)

[pic 12]

34,45

Аккуратность (accuracy)

[pic 13]

33,35

Ошибка (error)

[pic 14]

66,65

Полнота и точность в одной метрике (F-mcasure)

[pic 15]

49,85

...

Скачать:   txt (8.6 Kb)   pdf (411.5 Kb)   docx (306.4 Kb)  
Продолжить читать еще 2 страниц(ы) »
Доступно только на Essays.club