Кодирование и измерение информации. Запись формул в языках программирования и Excel
Автор: Евгений Луганский • Июнь 7, 2019 • Практическая работа • 717 Слов (3 Страниц) • 517 Просмотры
Практическая работа 1 и 2 Кодирование и измерение информации. Запись формул в языках программирования и Excel
Цель: освоить расчет объёмов информации по формулам Шеннона и Хартли, перевод чисел из одной системы счисления в другую, запись формул в Excel.
Задание 1. Найдите по формуле Шеннона количество информации в сообщении следующего вида:
Ваша фамилия, имя, отчество (символ пробела не учитывается к длине сообщения) с учетом вероятностей появления символов русского алфавита из нижеследующей таблицы1
Таблица 1 – Вероятность появления букв в русскоязычных текстах
Буквы | о | а, е, н, п | в, и, к | б, р, т | м, у, г | Остальные буквы и знаки «.» и «,» (одинаковая вероятность) | э, ц, ъ, ф | Сумма вероят-ностей |
Вероятности | 0,11 | 0,081 | 0,08 | 0,1 | 0,07 | 0,56:17=0,033 | 0,0018 | 1,00 |
Пример расчета.
Иванов Иван Иванович – всего 18 символов в сообщении
буква в имени | кол-во букв K | вероятность pi | log2(1/pi) | K*log | |
и | 4 | 0,08 | 3,644 | 14,575 | |
в | 5 | 0,08 | 3,644 | 18,219 | |
а | 3 | 0,081 | 3,626 | 10,878 | |
н | 3 | 0,081 | 3,626 | 10,878 | |
о | 2 | 0,11 | 3,184 | 6,369 | |
ч | 1 | 0,033 | 4,756 | 4,921 | всего байт |
18 | всего бит | 65,841 | 8,230 |
Таким образом, в данной фамилии, имени, отчестве содержится 65,8 бит информации или 65,85/8=8,2 байта
Методические указания к выполнению
- Выпишите все буквы ваших ФИО и посчитайте количество одинаковых. Для контроля подсчитайте количество символов в сообщении и количество символов по графе 2
- Вероятности piвозьмите из таблицы 1
- Рассчитайте графу 4
- Вычислите графу 5 как произведение граф 4 и 2
- Найдите сумму по графе 5 (в битах)
- Разделите указанную сумму на 8, чтобы получить объем в байтах
Формула Шеннона (1)[pic 2]
Задание 2. По формуле Хартли найдите объём информации, который содержится в вашем ФИО
Формула Хартли [pic 3]
Пример расчета.
В тексте Иванов Иван Иванович содержится без учёта пробелов 18 символов русского алфавита. Мощность одного символа в русском алфавите составляет 5,8 бита. Следовательно, по формуле Хартли объём информации в данном сообщении равен =104/8=13 байт. Более точным является метод 1, метод 2 даёт переизбыток информации. Это касается обычных и научных текстов (без учета узкоспециальных).[pic 4]
Задание 3. Переведите в троичную систему счисления следующее число:
- запишите сокращённую дату вашего рождения в формате дд.мм.гг
- сложите три двузначных числа дд+мм+гг
- получившееся число разделите на 3 по алгоритму, приведённому в лекции или в примере расчёта. Деление производите до тех пор, пока последнее частное не станет меньше 3 (т.е. будет равно 1 или 2). В троичной системе счисления 3 цифры, это 0, 1 и 2, число 10 означает 3 (т.е. переход в следующий разряд - число троек в первой степени = )
- запишите полученные цифры снизу вверх, начиная с последнего частного[pic 5]
...