Презентация, доклад на тему Кодирование информации

Содержание

Кодирование информацииТема 1. Язык и кодирование

Слайд 1Кодирование информации
Язык и кодирование
Двоичное кодирование
Кодирование чисел и символов
Кодирование рисунков
Кодирование звука и

видео

Кодирование информацииЯзык и кодированиеДвоичное кодированиеКодирование чисел и символовКодирование рисунковКодирование звука и видео

Слайд 2Кодирование информации
Тема 1. Язык и кодирование

Кодирование информацииТема 1. Язык и кодирование

Слайд 3


Что такое кодирование?
Кодирование – это запись информации с помощью некоторой знаковой

системы (языка).

кодирование

10101001010

данные (код)


обработка


11111100010

данные (код)

хранение

борьба с помехами (специальные способы кодирования)

передача

передача

Информация передается, обрабатывается и хранится в виде кодов.

Что такое кодирование?Кодирование – это запись информации с помощью некоторой знаковой системы (языка).кодирование10101001010данные (код)обработка11111100010данные (код)хранениеборьба с помехами

Слайд 4Языки
Язык – знаковая система, используемая для хранения и передачи информации.
естественные (русский,

английский, …) есть правила и исключения
формальные (строгие правила)




Грамматика – правила по которым из символов алфавита строятся слова.
Синтаксис – правила, по которым из слов строятся предложения.

program qq;
begin
writeln("Привет!");
end.

ЯзыкиЯзык – знаковая система, используемая для хранения и передачи информации.естественные (русский, английский, …) есть правила и исключенияформальные

Слайд 5Задача 1. Закодируйте свое имя с помощью азбуки Морзе.
ВАСЯ
Азбука Морзе

Задача 1. Закодируйте свое имя с помощью азбуки Морзе.ВАСЯАзбука Морзе

Слайд 6Задача 2. Закодируйте свое имя с помощью кодовой таблицы (Windows-1251):
Кодовые таблицы

Задача 2. Закодируйте свое имя с помощью кодовой таблицы (Windows-1251):Кодовые таблицы

Слайд 7Текст:
в России: Привет, Вася!
Windows-1251: CFF0E8E2E52C20C2E0F1FF21
передача за рубеж (транслит): Privet, Vasya!
стенография:
шифрование: Рсйгжу-!Гбта”

Числа:
для

вычислений: 25
прописью: двадцать пять
римская система: XXV

Цели и способы кодирования

Текст:в России: Привет, Вася!Windows-1251: CFF0E8E2E52C20C2E0F1FF21передача за рубеж (транслит): Privet, Vasya!стенография:шифрование: Рсйгжу-!Гбта”Числа:для вычислений: 25прописью: двадцать пятьримская система: XXVЦели

Слайд 8Кодирование информации
Тема 2. Двоичное кодирование

Кодирование информацииТема 2. Двоичное кодирование

Слайд 9Двоичное кодирование
Двоичное кодирование – это кодирование всех видов информации с помощью

двух знаков (обычно 0 и 1).
Передача электрических сигналов:

сигнал с помехами


«1»

«0»




полезный сигнал

сигнал с помехами

полезный сигнал

Двоичное кодированиеДвоичное кодирование – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1).Передача

Слайд 10Двоичное кодирование
в такой форме можно закодировать (почти) все виды информации
нужны только

устройства с двумя состояниями
почти нет ошибок при передаче данных
компьютеру легче обрабатывать данные

человеку сложно воспринимать двоичные коды

числа

символы

рисунки

звук

101011011101110110101

Двоичное кодированиев такой форме можно закодировать (почти) все виды информациинужны только устройства с двумя состояниямипочти нет ошибок

Слайд 11Декодирование
Декодирование – это восстановление сообщения из последовательности кодов.
МАМА МЫЛА ЛАМУ →

00 1 00 1 11 00 01 0 1 11 0 1 00 10

0010011100010111010010 → ???

ЛЛАЛЛАААЛЛЛАЛАААЛАЛЛАЛ

Приняли сообщение:

ДекодированиеДекодирование – это восстановление сообщения из последовательности кодов.МАМА МЫЛА ЛАМУ → 00 1 00 1 11 00

Слайд 12Равномерные коды
Равномерные коды – все кодовые слова (коды отдельных букв) имеют

одинаковую длину.

МАМА МЫЛА ЛАМУ: 000 001 000 001 101 000 010 011 001 101 011 001 000 100

сообщения получаются длинными

Равномерные кодыРавномерные коды – все кодовые слова (коды отдельных букв) имеют одинаковую длину.МАМА МЫЛА ЛАМУ: 000 001

Слайд 13Неравномерные коды
кодовые слова имеют разную длину

0100010011011011100001110000011010
М
А
М
А

М
Ы
Л
А
А

Л
М
У













Префиксный код – ни одно кодовое

слово не совпадает с началом другого кодового слова (условие Фано).
Неравномерные кодыкодовые слова имеют разную длину0100010011011011100001110000011010МАМАМЫЛААЛМУПрефиксный код – ни одно кодовое слово не совпадает с началом другого

Слайд 14Постфиксные коды
Постфикс = окончание слова.
Постфиксный код – ни одно кодовое слово

не совпадает с концом другого кодового слова («обратное» условие Фано).

для декодирования нужно получить всё сообщение целиком

Постфиксные кодыПостфикс = окончание слова.Постфиксный код – ни одно кодовое слово не совпадает с концом другого кодового

Слайд 15Задачи на построение кода
Для передачи по каналу связи сообщения, состоящего только

из букв А, Б, В, Г, решили использовать неравномерный по длине код:


Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?
1) 00 2) 01 3) 11 4) 010

Решение:
для букв А-Б-В выполнятся условие Фано
при Г=00 условие Фано нарушится (пары Г-Б, Г-В)
при Г=01 условие Фано выполняется
при Г=11 условие Фано нарушится (пара А-Г)
при Г=010 условие Фано выполняется (но длиннее 01)

Задачи на построение кодаДля передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г,

Слайд 16Комбинаторика
Задача 1. Сколько существует четырёхзначных чисел, составленных из чётных цифр?
0, 2,

4, 6, 8


5

4


2, 4, 6, 8









КомбинаторикаЗадача 1. Сколько существует четырёхзначных чисел, составленных из чётных цифр?0, 2, 4, 6, 8542, 4, 6, 8

Слайд 17Комбинаторика
Задача 2. Сколько существует четырёхзначных чисел, составленных из чётных цифр, в

которых цифры не повторяются?

0, 2, 4, 6, 8


5

4


2, 4, 6, 8









одна цифра уже использована!

КомбинаторикаЗадача 2. Сколько существует четырёхзначных чисел, составленных из чётных цифр, в которых цифры не повторяются?0, 2, 4,

Слайд 18
Комбинаторика
Задача 3. Сколько существует двоичных кодов длиной 4 бита?
0, 1

2



=24=16




длина сообщения
мощность

алфавита
КомбинаторикаЗадача 3. Сколько существует двоичных кодов длиной 4 бита?0, 12=24=16длина сообщениямощность алфавита

Слайд 19Комбинаторика
Задача 4. Сколько существует двоичных кодов длиной от 2 до 5

битов?

L = 2: N2 = 22 = 4

L = 3: N2 = 23 = 8

L = 4: N4 = 24 = 16

L = 5: N5 = 25 = 32

КомбинаторикаЗадача 4. Сколько существует двоичных кодов длиной от 2 до 5 битов?L = 2:   N2

Слайд 20Комбинаторика
Задача 5. В некоторой стране живут 1000 человек. Правительство решило присвоить

каждому собственный код, причем все коды должны быть одинаковой длины и состоять только из цифр 1, 2, 3 и 4. Определите наименьшую длину таких кодов.



N = 4L

≥ 1000

L = 1: 41 = 4 < 1000

L = 2: 42 = 16 < 1000

L = 3: 43 = 64 < 1000

L = 4: 44 = 256 < 1000

L = 5: 45 = 1024 > 1000

КомбинаторикаЗадача 5. В некоторой стране живут 1000 человек. Правительство решило присвоить каждому собственный код, причем все коды

Слайд 21Кодирование информации
Тема 2. Кодирование чисел и символов

Кодирование информацииТема 2. Кодирование чисел и символов

Слайд 22Кодирование чисел (двоичная система)
Алфавит: 0, 1 Основание (количество цифр): 2
10 → 2
2

→ 10

19

19 = 100112

система счисления

100112

4 3 2 1 0

разряды

= 1·24 + 0·23 + 0·22 + 1·21 + 1·20
= 16 + 2 + 1 = 19


Кодирование чисел (двоичная система)Алфавит: 0, 1 Основание (количество цифр): 210 → 22 → 101919 = 100112система счисления1001124

Слайд 23Кодирование символов
Текстовый файл
на экране (символы)

в памяти – двоичные коды
А где же

хранятся изображения?
Кодирование символовТекстовый файлна экране (символы)в памяти – двоичные  кодыА где же хранятся изображения?

Слайд 24Кодирование символов
Сколько символов надо использовать одновременно?

или 65536 (UNICODE)
Сколько места надо выделить на символ:

Выбрать 256 любых символов (или 65536) - алфавит.
Каждому символу – уникальный код 0..255 (или 0..65535). Таблица символов:
Коды – в двоичную систему.

256

коды

Кодирование символовСколько символов надо использовать одновременно?        или 65536 (UNICODE)Сколько места

Слайд 258-битные кодировки (1 байт на символ)

таблица ASCII
(международная)

расширение
(национальный алфавит)
ASCII = American

Standard Code for Information Interchange
0-31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.
32 пробел
знаки препинания: . , : ; ! ?
специальные знаки: + - * / () {} []
48-57 цифры 0..9
65-90 заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z
Кодовая страница (расширенная таблица ASCII) для русского языка:
CP-866 для системы MS DOS
CP-1251 для системы Windows (Интернет)
КОИ8-Р для системы UNIX (Интернет)
8-битные кодировки (1 байт на символ)таблица ASCII (международная)расширение(национальный алфавит)ASCII = American Standard Code for Information Interchange0-31	 управляющие

Слайд 261 байт на символ – файлы небольшого размера!
просто обрабатывать в программах
нельзя

использовать символы разных кодовых страниц одновременно (русские и французские буквы, и т.п.)
неясно, в какой кодировке текст (перебор вариантов!)
для каждой кодировки нужен свой шрифт (изображения символов)

8-битные кодировки (1 байт на символ)

1 байт на символ – файлы небольшого размера!просто обрабатывать в программахнельзя использовать символы разных кодовых страниц одновременно

Слайд 27Стандарт UNICODE
110 182 символа (2012)
каждому символу присвоен код
кириллица:
А – 041016, Б

– 041116, …
а – 043016, б – 043116, …
коды 0..10FFFF16, всего 1 114 112
Стандарт UNICODE110 182 символа (2012)каждому символу присвоен код	кириллица: 		А – 041016,	Б – 041116, …		а – 043016, 	б

Слайд 28UNICODE в Windows (UTF-16)
можно одновременно использовать символы разных языков (Интернет)
размер файла

увеличивается

общеупотребительные символы 0..65535 = 216-1 (0..FFFF16)
эти символы можно закодировать с помощью 16 бит
кодировка UTF-16 (почти все символы по 16 бит)

UNICODE в Windows (UTF-16)можно одновременно использовать символы разных языков (Интернет)размер файла увеличиваетсяобщеупотребительные символы 	0..65535 = 216-1 (0..FFFF16)эти

Слайд 29UNICODE в Linux (кодировка UТF-8)
символы ASCII – 1 байт на символ


остальные символы от 2 до 4 байт
более 50% сайтов используют UTF-8

тексты, состоящие только из кодов ASCII (коды 0 – 127) не увеличиваются в размере

переменное число байтов на символ
замедление работы программ

UNICODE в Linux (кодировка UТF-8)символы ASCII – 1 байт на символ остальные символы от 2 до 4

Слайд 30Кодирование информации
Тема 4. Кодирование рисунков

Кодирование информацииТема 4. Кодирование рисунков

Слайд 31Два типа кодирования рисунков
растровое кодирование точечный рисунок, состоит из пикселей
фотографии, размытые

изображения
векторное кодирование рисунок, состоит из отдельных геометрических фигур

чертежи, схемы, карты





Два типа кодирования рисунковрастровое кодирование  точечный рисунок, состоит из пикселей     фотографии, размытые

Слайд 32Растровое кодирование
Шаг 1. Дискретизация: разбивка на пиксели.
Шаг 2. Для каждого

пикселя определяется единый цвет.

Пиксель – это наименьший элемент рисунка, для которого можно независимо установить цвет.

Разрешение: число пикселей на дюйм, pixels per inch (ppi)
экран 96 ppi, печать 300-600 ppi, типография 1200 ppi

Растровое кодированиеШаг 1. Дискретизация: разбивка на пиксели. Шаг 2. Для каждого пикселя определяется  единый цвет.Пиксель –

Слайд 33Растровое кодирование (True Color)
Шаг 3. От цвета – к числам: модель

RGB

цвет = R + G + B

red
красный
0..255

blue
синий
0..255

green
зеленый
0..255

R = 218 G = 164 B = 32

R = 135 G = 206 B = 250



Шаг 4. Числа – в двоичную систему.

256·256·256 = 16 777 216 (True Color)

R: 256=28 вариантов, нужно 8 бит = 1 байт R G B: всего 3 байта

Глубина цвета

Растровое кодирование (True Color)Шаг 3. От цвета – к числам: модель RGB цвет =  R

Слайд 34Растровое кодирование с палитрой
Шаг 1. Выбрать количество цветов: 2, 4, …

256.

Шаг 2. Выбрать 256 цветов из палитры:

Шаг 3. Составить палитру (каждому цвету – номер 0..255) палитра хранится в начале файла

Шаг 4. Код пикселя = номеру его цвета в палитре







Растровое кодирование с палитройШаг 1. Выбрать количество цветов: 2, 4, … 256.Шаг 2. Выбрать 256 цветов из

Слайд 35Растровое кодирование с палитрой
Файл с палитрой:
256 = 28 цветов: палитра 256·3 =

768 байт
рисунок 8 бит на пиксель
16 цветов: палитра 16·3 = 48 байт
рисунок 4 бита на пиксель
2 цвета: палитра 2·3 = 6 байт
рисунок 1 бит на пиксель

Один цвет в палитре: 3 байта (RGB)

Глубина цвета

Растровое кодирование с палитройФайл с палитрой:256 = 28 цветов:	 	палитра 	256·3 = 768 байт	рисунок	8 бит на пиксель16

Слайд 36Форматы файлов (растровые рисунки)

Форматы файлов (растровые рисунки)

Слайд 37



Кодирование цвета при печати

Белый – красный = голубой C = Cyan
Белый –

зелёный = пурпурный M = Magenta
Белый – синий = желтый Y = Yellow

Модель CMY

C

M

Y

0

0

0

255

255

0



255

0

255


0

255

255


255

255

255


Модель CMYK: + Key color

Меньший расход краски и лучшее качество для чёрного и серого цветов.


Кодирование цвета при печатиБелый – красный 	= голубой	C = CyanБелый – зелёный 	= пурпурный	M = Magenta

Слайд 38Растровые рисунки
лучший способ для хранения фотографий и изображений без четких границ
спецэффекты

(тени, ореолы, и т.д.)

есть потеря информации (почему?)
при изменении размеров рисунка он искажается
размер файла не зависит от сложности рисунка (а от чего зависит?)

Растровые рисункилучший способ для хранения фотографий и изображений без четких границспецэффекты (тени, ореолы, и т.д.)есть потеря информации

Слайд 39Векторные рисунки
Строятся из геометрических фигур:
отрезки, ломаные, прямоугольники
окружности, эллипсы, дуги
сглаженные линии (кривые

Безье)
Для каждой фигуры в памяти хранятся:
размеры и координаты на рисунке
цвет и стиль границы
цвет и стиль заливки (для замкнутых фигур)
Форматы файлов:
WMF (Windows Metafile)
CDR (CorelDraw)


AI (Adobe Illustrator)
SVG (Inkscape)

для Web

Векторные рисункиСтроятся из геометрических фигур:отрезки, ломаные, прямоугольникиокружности, эллипсы, дугисглаженные линии (кривые Безье)Для каждой фигуры в памяти хранятся:размеры

Слайд 40Векторные рисунки

stroke-width="1" stroke="rgb(0,0,0)"
fill="rgb(255,255,255)"/>
stroke-width="1" stroke="rgb(0,0,0)"
fill="rgb(0,0,255)"/>
stroke-width="1" stroke="rgb(0,0,0)"
fill="rgb(255,0,0)"/>
x2="0" y2="150"
stroke-width="15" stroke="rgb(0,0,0)" />

прямоугольник

размеры

координаты

контур

заливка





Векторные рисункипрямоугольникразмерыкоординатыконтурзаливка

Слайд 41Векторные рисунки
лучший способ для хранения чертежей, схем, карт;
при кодировании нет потери

информации;
при изменении размера нет искажений;
меньше размер файла, зависит от сложности рисунка;

неэффективно использовать для фотографий и размытых изображений

Векторные рисункилучший способ для хранения чертежей, схем, карт;при кодировании нет потери информации;при изменении размера нет искажений;меньше размер

Слайд 42Кодирование информации
Тема 5. Кодирование звука и видео

Кодирование информацииТема 5. Кодирование звука и видео

Слайд 43Оцифровка звука

Оцифровка – это преобразование аналогового сигнала в цифровой код (дискретизация).



– интервал дискретизации (с)

– частота дискретизации (Гц, кГц)

8 кГц – минимальная частота для распознавания речи
11 кГц, 22 кГц,
44,1 кГц – качество CD-дисков
48 кГц – фильмы на DVD
96 кГц, 192 кГц

Человек слышит
16 Гц … 20 кГц

Оцифровка звукаОцифровка – это преобразование аналогового сигнала в цифровой код (дискретизация). – интервал дискретизации (с)– частота дискретизации

Слайд 44Оцифровка звука: квантование

3-битное кодирование:
8 битов = 256 уровней
16 битов =

65536 уровней
24 бита = 224 уровней

АЦП = Аналого-Цифровой Преобразователь

Квантование (дискретизация по уровню) – это представление числа в виде цифрового кода конечной длины.

Разрядность кодирования — это число битов, используемое
для хранения одного отсчёта.

Оцифровка звука: квантование3-битное кодирование: 8 битов = 256 уровней16 битов = 65536 уровней24 бита = 224 уровнейАЦП

Слайд 45Оцифровка звука
Задача. Определите информационный объем данных, полученных при оцифровке звука длительностью

1 минута с частотой 44 кГц с помощью 16-битной звуковой карты. Запись выполнена в режиме «стерео».

За 1 сек каждый канал записывает 44000 значений, каждое занимает 16 битов = 2 байта
всего 44000 ⋅ 2 байта = 88000 байтов
С учётом «стерео»
всего 88000 ⋅ 2 = 176000 байтов
За 1 минуту
176000 ⋅ 60 = 1056000 байтов
≈ 10313 Кбайт ≈ 10 Мбайт

Оцифровка звукаЗадача. Определите информационный объем данных, полученных при оцифровке звука длительностью  1 минута с частотой 44

Слайд 46
Оцифровка звука
Как восстановить сигнал?


без сглаживания
после сглаживания

уменьшать T
↑ размер файла
аналоговые устройства!
ЦАП =

Цифро-Аналоговый Преобразователь

было до оцифровки

Оцифровка звукаКак восстановить сигнал?без сглаживанияпосле сглаживанияуменьшать T↑ размер файлааналоговые устройства!ЦАП = Цифро-Аналоговый Преобразовательбыло до оцифровки

Слайд 47Оцифровка – итог
можно закодировать любой звук (в т.ч. голос, свист, шорох,

…)

есть потеря информации
большой объем файлов

Форматы файлов:
WAV (Waveform audio format), часто без сжатия (размер!)
MP3 (MPEG-1 Audio Layer 3, сжатие с учётом восприятия человеком)
AAC (Advanced Audio Coding, 48 каналов, сжатие)
WMA (Windows Media Audio, потоковый звук, сжатие)
OGG (Ogg Vorbis, открытый формат, сжатие)


Оцифровка – итогможно закодировать любой звук (в т.ч. голос, свист, шорох, …)есть потеря информациибольшой объем файловФорматы файлов:WAV

Слайд 48Инструментальное кодирование
MIDI (Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов).
в

файле .mid:
нота (высота, длительность)
музыкальный инструмент
параметры звука (громкость, тембр)
до 1024 каналов
в памяти звуковой карты:
образцы звуков (волновые таблицы)

MIDI-клавиатура:

нет потери информации при кодировании инструментальной музыки
небольшой размер файлов

невозможно закодировать
нестандартный звук, голос


программа для звуковой карты!

128 мелодических и 47 ударных

Инструментальное кодированиеMIDI (Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов).в файле .mid:нота (высота, длительность)музыкальный инструментпараметры звука

Слайд 49Трекерная музыка
В файле (модуле):
образцы звуков (сэмплы)
нотная запись, трек (track) – дорожка
музыкальный

инструмент
до 32 каналов

Использование: демосцены (важен размер файла)

Форматы файлов:
MOD разработан для компьютеров Amiga
S3M оцифрованные каналы + синтезированный звук, 99 инструментов
XM, STM, …

Трекерная музыкаВ файле (модуле):образцы звуков (сэмплы)нотная запись, трек (track) – дорожкамузыкальный инструментдо 32 каналовИспользование: демосцены (важен размер

Слайд 50Кодирование видео
Синхронность!
изображения:
≥ 25 кадров в секунду
PAL: 768×576, 24 бита

за 1 с: 768×576×3 байта ≈ 32 Мб
за 1 мин: 60×32 Мбайта ≈ 1,85 Гб
HDTV: 1280×720, 1920×1080.
исходный кадр + изменения (10-15 с)
сжатие (кодеки – алгоритмы сжатия)
DivX, Xvid, H.264, WMV, Ogg Theora…
звук:
48 кГц, 16 бит
сжатие (кодеки – алгоритмы сжатия)
MP3, AAC, WMA, …
Кодирование видеоСинхронность!изображения:≥ 25 кадров в секундуPAL: 768×576, 24 бита     за 1 с: 768×576×3

Слайд 51Форматы видеофайлов
AVI – Audio Video Interleave – чередующиеся звук и видео;

контейнер – могут использоваться разные кодеки
MPEG – Motion Picture Expert Group
WMV – Windows Media Video, формат фирмы Microsoft
MP4 – MPEG-4, сжатое видео и звук
MOV – Quick Time Movie, формат фирмы Apple
WebM – открытый формат, поддерживается браузерами
Форматы видеофайловAVI 	– Audio Video Interleave – чередующиеся звук и видео; контейнер – могут использоваться разные кодекиMPEG

Слайд 52Конец фильма
ПОЛЯКОВ Константин Юрьевич
д.т.н., учитель информатики высшей категории,
ГОУ СОШ № 163,

г. Санкт-Петербург
kpolyakov@mail.ru
Конец фильмаПОЛЯКОВ Константин Юрьевичд.т.н., учитель информатики высшей категории,ГОУ СОШ № 163, г. Санкт-Петербургkpolyakov@mail.ru

Что такое shareslide.ru?

Это сайт презентаций, где можно хранить и обмениваться своими презентациями, докладами, проектами, шаблонами в формате PowerPoint с другими пользователями. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами.


Для правообладателей

Яндекс.Метрика

Обратная связь

Email: Нажмите что бы посмотреть