Адаптація алгоритму Хаффмана для кодування та декодування інформації

Автор: andee13 • Май 14, 2019 • Курсовая работа • 3,343 Слов (14 Страниц) • 827 Просмотры

Страница 1 из 14

Мiнiстерство освiти i науки Укра"iни

Сумський державний унiверситет

Кафедра комп'ютерних наук

Секцiя iнформацiйний та комунiкацiйних технологiй

Обов’язкове домашнє завдання

з дисциплiни " Алгоритми і структурі данних"

Тема: "Адаптація алгоритму Хаффмана для кодування та декодування інформації"

Виконав студент групи ІН-71

Ваценко А. В.

Перевiрив Шаповалов С.П.

Зміст

Вступ 3

Алгоритм рішення 4

Теоритична частина 5

Код програми 7

Тестові приклади 13

Порівняльний аналіз 15

Асимптотична оцінка 15

Висновок 16

Список літератури 16

Вступ

Коди Хаффмана - дуже ефективний метод стиснення даних, який, в залежності від характеристик цих даних, зазвичай дозволяє заощадити від 20 до 90% обсягу. Ми розглядаємо дані, що представляють собою послідовність символів. У жадібному алгоритмі Хаффмана використовується таблиця, що містить частоти появи тих чи інших символів. За допомогою цієї таблиці визначається оптимальне представлення кожного символу у вигляді бінарного рядка.

Припустимо, що є файл даних, що складається з 100 тисяч символів, який потрібно стиснути. Символи в цьому файлі зустрічаються з частотою,. Таким чином, всього файл містить шість різних символів, а, наприклад, символ а зустрічається в ньому 45 тисяч раз.

	a	b	c	d	e	f
Частота тисяч	45	13	12	16	9	5
Кодове слово фіксованої довжини	000	001	010	011	100	101
Кодове слове змінної довжини	0	101	100	111	1101	1100

. Завдання про кодування послідовності символів. Файл даних містить тільки символи а-f з зазначеними частотами. Якщо призначити кожному символу трехбітовое кодове слово, файл можна закодувати за допомогою 300 тисяч бітів. При використанні показаних кодових слів змінної довжини файл кодується тільки 224 тисячами бітів.

Існує безліч способів уявити подібний файл даних.Розглянемо завдання по розробці бінарного символьного коду , в якому кожен символ представляється унікальним бінарної рядком. Якщо використовується код фіксованої довжини, або рівномірний код, в якому кожен символ представлений унікальним бінарної рядком, то для подання шести символів знадобиться три біта: а = 000, 6 = 001, ..., / = 101. При використанні такого методу для кодування всього файлу знадобиться 300 тисяч бітів. Чи можна домогтися кращих результатів?

За допомогою коду змінної довжини, або нерівномірного коду, вдається отримати значно кращі результати, ніж за допомогою коду фіксованої довжини. Це досягається за рахунок того, що частоти, що зустрічаються асоціюються символам і зіставляються короткі кодові слова, а менш часто зустрічающимся довгі.

Для подання файла за допомогою цього коду буде потрібно

(45.1 + 13-3 + 12.3 + 16.3 + 9.4 + 5-4). 1000 = 224000 бітів.

Завдяки цьому економиться 25% обсягу.

Алгоритм рішення

Можна довести, що оптимальне стиснення даних, якого можна досягти за допомогою кодів, завжди може бути досягнуто при використанні префіксного коду, тому розгляд одних лише префіксних кодів не приводить до втрати спільності.

...

Скачать: txt (26.1 Kb) pdf (664 Kb) docx (211.6 Kb)

Продолжить читать еще 13 страниц(ы) »

Читать полный текст Сохранить

Доступно только на Essays.club