Основано на: демонстрационных вариантах ЕГЭ по информатике за 2015 год, http://wiki.vspu.ru/

Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А - 0; Б - 100; В - 1010; Г - 111; Д - 110. Требуется сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно. Коды остальных букв меняться не должны. Как это можно сделать?

Для того чтобы понять что от нас требуют, давайте разберемся с каждым словом в этом задании. Кодирование, последовательность, - это всем нам с вами знакомые и хорошо понятные слова и что они означяают, мы прекрасно понимаем. И вот после перечисления букв мы сталкиваемся с не всем знакомым словосочетанием НЕРАВНОМЕРНЫЙ двоичный код. Неравномерное двоичное кодирование - кодирование при котором символы некоторого первичного алфавита кодируются комбинациями символов двоичного алфавита (т.е. 0 и 1), причем, длина кодов и, соответственно, длительность передачи отдельного кода, могут различаться. Данная идея двоичного кодирования положена в основу Кода Хаффмана, в котором символ, который встречается в последовательности чаще всего, получает очень маленький код, а символ, который встречается реже всего, получает, наоборот, очень длинный код, тем самым позволяя уменьшить объем информации.

Предположим, у нас есть строка «тор тут тёр», для которой, в её текущем виде, на каждый знак тратится по одному байту. Это означает, что вся строка целиком занимает 11*8 = 88 бит памяти. После кодирования строка займёт 27 бит.

Чтобы получить код для каждого символа строки «тор тут тёр», на основе его частотности, нам надо построить дерево (граф), такое, что каждый лист этого дерева будет содержать символ. Дерево будет строиться от листьев к корню, в том смысле, что символы с меньшей частотой будут дальше от корня, чем символы с большей.

Чтобы построить дерево, мы воспользуемся слегка модифицированной очередью с приоритетами — первыми из неё будут извлекаться элементы с наименьшим приоритетом, а не наибольшим. Это нужно, чтобы строить дерево от листьев к корню.

И так, подсчитаем частотность символов Т Р пробел О У Е

Символ Частотность
Т 4
Р 2
" " 2
У 1
О 1
Е 1

После вычисления частот мы создадим узлы бинарного дерева для каждого знака и добавим их в очередь, используя частоту в качестве приоритета:

Теперь мы достаём два первых элемента из очереди и связываем их, создавая новый узел дерева, в котором они оба будут потомками, а приоритет нового узла будет равен сумме их приоритетов. После этого мы добавим получившийся новый узел обратно в очередь.

Повторим те же шаги и в итоге мы получим:

После связывания веток в одно дерево, мы с вами получим следующие коды для наших символов

Т - 00; Р - 10; пробел -01; О - 1110; У - 110; Е - 1111 более подробно можно прочитать

Задание 1 ЕГЭ:

Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А - 0; Б - 100; В - 1010; Г - 111; Д - 110. Требуется сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно. Коды остальных букв меняться не должны. Как это можно сделать?

Урок посвящен тому, как решать 5 задание ЕГЭ по информатике


5-я тема характеризуется, как задания базового уровня сложности, время выполнения – примерно 2 минуты, максимальный балл — 1

  • Кодирование - это представление информации в форме, удобной для её хранения, передачи и обработки. Правило преобразования информации к такому представлению называется кодом .
  • Кодирование бывает равномерным и неравномерным :
  • при равномерном кодировании всем символам соответствуют коды одинаковой длины;
  • при неравномерном кодировании разным символам соответствуют коды разной длины, это затрудняет декодирование.

Пример: Зашифруем буквы А, Б, В, Г при помощи двоичного кодирования равномерным кодом и посчитаем количество возможных сообщений:

Таким образом, мы получили равномерный код , т.к. длина каждого кодового слова одинакова для всех кодов (2).

Кодирование и расшифровка сообщений

Декодирование (расшифровка) - это восстановление сообщения из последовательности кодов.

Для решения задач с декодированием, необходимо знать условие Фано:

Условие Фано: ни одно кодовое слово не должно являться началом другого кодового слова (что обеспечивает однозначное декодирование сообщений с начала)

Префиксный код - это код, в котором ни одно кодовое слово не совпадает с началом другого кодового слова. Сообщения при использовании такого кода декодируются однозначно.


Однозначное декодирование обеспечивается:


Решение 5 заданий ЕГЭ

ЕГЭ 5.1: Для кодирования букв О, В, Д, П, А решили использовать двоичное представление чисел 0 , 1 , 2 , 3 и 4 соответственно (с сохранением одного незначащего нуля в случае одноразрядного представления).

Закодируйте последовательность букв ВОДОПАД таким способом и результат запишите восьмеричным кодом.


✍ Решение:
  • Переведем числа в двоичные коды и поставим их в соответствие нашим буквам:
О -> 0 -> 00 В -> 1 -> 01 Д -> 2 -> 10 П -> 3 -> 11 А -> 4 -> 100
  • Теперь закодируем последовательность букв из слова ВОДОПАД:
  • 010010001110010
  • Разобьем результат на группы из трех символов справа налево, чтобы перевести их в восьмеричную систему счисления:
  • 010 010 001 110 010 ↓ ↓ ↓ ↓ ↓ 2 2 1 6 2

    Результат: 22162

    Решение ЕГЭ данного задания по информатике, видео:

    Рассмотрим еще разбор 5 задания ЕГЭ:

    ЕГЭ 5.2: Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв - из двух бит, для некоторых - из трех). Эти коды представлены в таблице:

    a b c d e
    000 110 01 001 10

    Какой набор букв закодирован двоичной строкой 1100000100110 ?


    ✍ Решение:
    • Во-первых, проверяем условие Фано: никакое кодовое слово не является началом другого кодового слова. Условие верно.
    • ✎ 1 вариант решения:

    • Код разбиваем слева направо согласно данным, представленным в таблице. Затем переведём его в буквы:
    110 000 01 001 10 ↓ ↓ ↓ ↓ ↓ b a c d e

    Результат: b a c d e.

    ✎ 2 вариант решения:


    110 000 01 001 10

    Результат: b a c d e.

    Кроме того, вы можете посмотреть видео решения этого задания ЕГЭ по информатике:

    Решим следующее 5 задание:

    ЕГЭ 5.3:
    Для передачи чисел по каналу с помехами используется код проверки четности. Каждая его цифра записывается в двоичном представлении, с добавлением ведущих нулей до длины 4 , и к получившейся последовательности дописывается сумма её элементов по модулю 2 (например, если передаём 23 , то получим последовательность 0010100110).

    Определите, какое число пе­ре­да­ва­лось по ка­на­лу в виде 01100010100100100110 .


    ✍ Решение:
    • Рассмотрим пример из условия задачи:
    Было 23 10 Стало 0010100110 2
  • Где сами цифры исходного числа (выделим их красным цветом):
  • 0010 10011 0 (0010 - 2, 0011 - 3)
  • Первая добавленная цифра 1 после двоичной двойки — это проверка четности (1 единица в 0010 — значит нечетное), 0 после двоичной тройки — это также проверка нечетности (2 единицы в 0011 , значит — четное).
  • Исходя из разбора примера решаем нашу задачу так: поскольку «нужные» нам цифры образуются из групп по 4 числа в каждой плюс одно число на проверку четности, то разобьем закодированное сообщение на группы по 5, и отбросим из каждой группы последний символ:
  • разбиваем по 5:
  • 01100 01010 01001 00110
  • отбрасываем из каждой группы последний символ:
  • 0110 0101 0100 0011
  • Результат переводим в десятичную систему:
  • 0110 0101 0100 0011 ↓ ↓ ↓ ↓ 6 5 4 3

    Ответ: 6 5 4 3

    Вы можете посмотреть видео решения этого задания ЕГЭ по информатике:



    ЕГЭ 5.4:
    Для кодирования некоторой последовательности, состоящей из букв К, Л, М, Н решили использовать неравномерный двоичный код, удовлетворяющий условию Фано. Для буквы Н использовали кодовое слово 0 , для буквы К - кодовое слово 10 .

    Какова наименьшая возможная суммарная длина всех четырёх кодовых слов?


    ✍ Решение:

    1 вариант решения основан на логических умозаключениях:

    • Найдём самые короткие возможные кодовые слова для всех букв.
    • Кодовые слова 01 и 00 использовать нельзя, так как тогда нарушается условие Фано (начинаются с 0, а 0 — это Н ).
    • Начнем с двухразрядных кодовых слов. Возьмем для буквы Л кодовое слово 11 . Тогда для четвёртой буквы нельзя подобрать кодовое слово, не нарушая условие Фано (если потом взять 110 или 111, то они начинаются с 11).
    • Значит, надо использовать трёхзначные кодовые слова. Закодируем буквы Л и М кодовыми словами 110 и 111 . Условие Фано соблюдается.
    (Н)1 + (К)2 + (Л)3 + (М)3 = 9

    2 вариант решения :

    (Н) -> 0 -> 1 символ (К) -> 10 -> 2 символа (Л) -> 110 -> 3 символа (М) -> 111 -> 3 символа
  • Суммарная длина всех четырёх кодовых слов равна:
  • (Н)1 + (К)2 + (Л)3 + (М)3 = 9

    Ответ: 9

    ЕГЭ по информатике 5 задание 2017 ФИПИ вариант 2 (под редакцией Крылова С.С., Чуркиной Т.Е.):

    По каналу связи передаются сообщения, содержащие только 4 буквы: А, Б, В, Г; для передачи используется двоичный код, допускающий однозначное декодирование. Для букв А, Б, В используются такие кодовые слова: А: 101010 , Б: 011011 , В: 01000 .

    Г, при котором код будет допускать однозначное декодирование. наименьшим числовым значением.


    ✍ Решение:
    • Наименьшие коды могли бы выглядеть, как 0 и 1 (одноразрядные). Но это не удовлетворяло бы условию Фано (А начинается с единицы — 101010 , Б начинается с нуля — 011011 ).
    • Следующим наименьшим кодом было бы двухбуквенное слово 00 . Так как оно не является префиксом ни одного из представленных кодовых слов, то Г = 00 .

    Результат: 00

    ЕГЭ по информатике 5 задание 2017 ФИПИ вариант 16 (под редакцией Крылова С.С., Чуркиной Т.Е.):

    Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приемной стороне канала связи. Использовали код: А — 01 , Б — 00 , В — 11 , Г — 100 .

    Укажите, каким кодовым словом должна быть закодирована буква Д. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования. Если таких кодов несколько, укажите код с наименьшим числовым значением.


    ✍ Решение:

    Результат: 101

    Подробней разбор урока можно посмотреть на видео ЕГЭ по информатике 2017:

    ЕГЭ по информатике 5 задание 2017 ФИПИ вариант 17 (Крылов С.С., Чуркина Т.Е.):

    Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г, Д и Е, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приемной стороне канала связи. Использовали код: А — 0 , Б — 111 , В — 11001 , Г — 11000 , Д — 10 .

    Укажите, каким кодовым словом должна быть закодирована буква Е. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования. Если таких кодов несколько, укажите код с наименьшим числовым значением.


    ✍ Решение:

    1 - не подходит (все буквы кроме А начинаются с 1) 10 - не подходит (соответствует коду Д) 11 - не подходит (начало кодов Б, В и Г) 100 - не подходит (код Д - 10 - является началом данного кода) 101 - не подходит (код Д - 10 - является началом данного кода) 110 - не подходит (начало кода В и Г) 111 - не подходит (соответствует коду Б) 1000 - не подходит (код Д - 10 - является началом данного кода) 1001 - не подходит (код Д - 10 - является началом данного кода) 1010 - не подходит (код Д - 10 - является началом данного кода) 1011 - не подходит (код Д - 10 - является началом данного кода) 1100 - не подходит (начало кода В и Г) 1101 - подходит

    Результат: 1101

    Более подробное решение данного задания представлено в видеоуроке:

    5 задание. Демоверсия ЕГЭ 2018 информатика (ФИПИ):

    По каналу связи передаются шифрованные сообщения, содержащие только десять букв: А, Б, Е, И, К, Л, Р, С, Т, У. Для передачи используется неравномерный двоичный код. Для девяти букв используются кодовые слова.

    Укажите кратчайшее кодовое слово для буквы Б , при котором код будет удовлетворять условию Фано. Если таких кодов несколько, укажите код с наименьшим числовым значением.


    ✍ Решение:

    Результат: 1100

    Подробное решение данного 5 задания из демоверсии ЕГЭ 2018 года смотрите на видео:

    Задание 5_9. Типовые экзаменационные варианты 2017. Вариант 4 (Крылов С.С., Чуркина Т.Е.):

    По каналу связи передаются шифрованные сообщения, содержащие только четыре букв: А, Б, В, Г; для передачи используется двоичный код, допускающий однозначное декодирование. Для букв А , Б , В используются кодовые слова:

    А: 00011 Б: 111 В: 1010

    Укажите кратчайшее кодовое слово для буквы Г , при котором код будет допускать однозначное декодирование. Если таких кодов несколько, укажите код с наименьшим числовым значением.


    ✍ Решение:

    Результат: 00

    Задание 5_10. Тренировочный вариант №3 от 01.10.2018 (ФИПИ):

    По каналу связи передаются сообщения, содержащие только буквы: А, Е, Д, К, М, Р ; для передачи используется двоичный код, удовлетворяющий условию Фано. Известно, что используются следующие коды:

    Е – 000 Д – 10 К – 111

    Укажите наименьшую возможную длину закодированного сообщения ДЕДМАКАР .
    В ответе напишите число – количество бит.


    ✍ Решение:

    Д Е Д М А К А Р 10 000 10 001 01 111 01 110

  • Посчитаем количество цифр в итоговом коде и получим 20 .
  • Результат: 20

    Смотрите виде решения задания:

    Задание:

    1) Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов ГБАВ и записать результат в шестнадцатеричной системе счисления, то получится:
    1) 132 16 2) D2 16 3) 3102 16 4) 2D 16

    Решение и ответ:

    Из условия соответственно:
    А - 00
    Б - 01
    В - 10
    Г - 11
    ГБАВ = 11010010 - переведем данную двоичную запись в шестнадцатеричную систему и получим D2
    Ответ: 2

    2) Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов ГБВА и записать результат шестнадцатеричным кодом, то получится:

    1) 138 16 2) DBCA 16 3) D8 16 4) 3120 16

    Решение и ответ:

    По условию:
    А = 00
    Б = 01
    В = 10
    Г = 11
    Значит:
    ГБВА = 11011000 в двоичной системе. Переведем в шестнадцатеричную и получим D8
    Ответ: 3

    3) Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв - из двух бит, для некоторых - из трех). Эти коды представлены в таблице:
    a b c d e
    000 110 01 001 10
    Определите, какой набор букв закодирован двоичной строкой 1100000100110
    1) baade 2) badde 3) bacde 4) bacdb

    Решение и ответ:

    Первая буква - b, так как стоит двоичный код 110
    Вторая буква - a, так как стоит двоичный код 000
    Третья буква - с, так как стоит двоичный код 01
    Четвертая буква - d, так как стоит двоичный код 001
    Пятая буква - e, так как стоит двоичный код 10
    Итог: bacde, что соответствует варианту под номером 3.
    Ответ: 3

    4) Для кодирования букв А, Б, В, Г используются четырехразрядные последовательные двоичные числа от 1000 до 1011 соответственно. Если таким способом закодировать последовательность символов БГАВ и записать результат в восьмеричном коде, то получится:
    1) 175423 2) 115612 3) 62577 4) 12376

    Решение и ответ:

    По условию:
    А = 1000
    Б = 1001
    В = 1010
    Г = 1011
    БГАВ = 1001101110001010, теперь слудует перевести данное число из двоичной в восьмеричную, и получить ответ.
    1001101110001010 2 = 115612 8

    Ответ: 2

    5)

    Для кодирования букв А, В, С, D используются трехразрядные последовательные двоичные числа, начинающиеся с 1 (от 100 до 111 соответственно). Если таким способом закодировать последовательность символов CDAB и записать результат в шестнадцатеричном коде, то получится:
    1) А52 16 2) 4С8 16 3) 15D 16 4) DE5 16

    Решение и ответ:

    По условию: Соответственно
    A = 100
    B = 101
    C = 110
    D = 111
    СDAB = 110111100101, переведем двоичное число в шестнадцатеричную:
    110111100101 2 = DE5 16
    Ответ: 4

    6) Для кодирования букв К, L, М, N используются четырехразрядные последовательные двоичные числа от 1000 до 1011 соответственно. Если таким способом закодировать последовательность символов KMLN и записать результат в восьмеричном коде, то получится:
    1) 84613 8 2) 105233 8 3) 12345 8 4) 776325 8

    Решение и ответ:

    По условию: соответственно
    K = 1000
    L = 1001
    M = 1010
    N = 1011
    KMLN = 1000101010011011, переведем в восьмеричное число:

    1000101010011011 2 = 105233 8

    Ответ: 2

    7) Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв - из двух бит, для некоторых - из трех). Эти коды представлены в таблице:

    А b с d е
    100 110 011 01 10
    Определите, какой набор букв закодирован двоичной строкой 1000110110110, если известно, что все буквы в последовательности - разные:
    1) cbade 2) acdeb 3) acbed 4) bacde

    Решение и ответ:

    Запишем двоичный код в виде битов: Методом перебора возможных вариантов, чтобы не повторялись буквы.
    Получается: 100 011 01 10 110
    Следовательно: acdeb
    Ответ: 2

    8) Для 6 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых - из трех). Эти коды представлены в таблице:
    А В С D Е F
    00 100 10 011 11 101
    Определите, какая последовательность из 6 букв закодирована двоичной строкой 011111000101100.
    1) DEFBAC 2) ABDEFC 3) DECAFB 4) EFCABD

    Решение и ответ:

    Решим методом перебора, так как буквы в ответах не повторяются, значит и коды не должны повторяться:

    Получаем:
    011 11 10 00 101 100
    Соответственно: DECAFB
    Ответ: 3

    9) Для кодирования букв А, В, С, D используются четырехразрядные последовательные двоичные числа, начинающиеся с 1 (от 1001 до 1100 соответственно). Если таким способом закодировать последовательность символов CADB и записать результат в шестнадцатеричном коде, то получится:
    1) AF52 16 2) 4CB8 16 3) F15D 16 4) В9СА 16

    Решение и ответ: соответственно..
    A - 1001
    B - 1010
    C - 1011
    D - 1100
    Значит: CADB = 1011100111001010, переведем 1011100111001010 из двоичной в шестнадцатеричную:
    1011 1001 1100 1010 2 = B9CA 16 , что соответствует четвертому варианту.
    Ответ: 4

    10)
    А Б В Г
    00 11 010 011
    Если таким способом закодировать последовательность символов ВГАГБВ и записать результат в шестнадцатеричном коде, то получится:
    1) CDADBC 16 2) A7C4 16 3) 412710 16 4) 4С7А 16

    Решение и ответ:

    ВГАГБВ = 0100110001111010, переведем в шестнадцатеричную:
    0100 1100 0111 1010 2 = 4C7A 16

    Ответ: 4

    11) Для кодирования сообщения, состоящего только из букв А, Б, В и Г, используется неравномерный по длине двоичный код:
    А Б В Г
    00 11 010 011
    Если таким способом закодировать последовательность символов ГАВБВГ и записать результат в шестнадцатеричном коде, то получится:
    1) 62D3 16 2) 3D26 16 3) 31326 16 4) 62133 16

    Решение и ответ:
    ГАВБВГ = 0110001011010011 2 - Переведем в шестнадцатеричную систему:
    0110 0010 1101 0011 2 = 62D3 16

    Ответ: 1

    12) Для кодирования сообщения, состоящего только из букв А, Б, В и Г, используется неравномерный по длине

    двоичный код:
    А Б В Г
    00 11 010 011
    Если таким способом закодировать последовательность символов ГБВАВГ и записать результат в шестнадцатеричном

    коде, то получится:
    1) 71013 16 2) DBCACD 16 3) 31A7 16 4) 7A13 16

    Решение и ответ:
    ГБВАВГ = 0111101000010011 2 - переведем в шестнадцатеричную.
    0111 1010 0001 0011 2 = 7A13 16
    Ответ: 4

    13) Для кодирования сообщения, состоящего только из букв А, Б, В и Г, используется неравномерный по длине двоичный код:
    А Б В Г
    00 11 010 011
    Если таким способом закодировать последовательность символов ГАВБГВ и записать результат в шестнадцатеричном коде, то получится:
    1) DACBDC 16 2) AD26 16 3) 621310 16 4) 62DA 16
    Решение и ответ: соответственно..

    ГАВБГВ = 0110001011011010 2 , переведем в шестнадцатеричную:
    0110 0010 1101 1010 2 = 62DA 16
    Ответ: 4

    14) Для кодирования сообщения, состоящего только из букв A, B, C, D и E, используется неравномерный по длине двоичный код:
    A B C D E
    000 11 01 001 10
    Какое (только одно!) из четырех полученных сообщений было передано без ошибок и может быть раскодировано:
    1) 110000010011110
    2) 110000011011110
    3) 110001001001110
    4) 110000001011110

    Решение и ответ:

    Возьмем первый код:
    11 000 001 001 11 10 = BADDBE
    Второй код:
    11 000 001 10 11 110 = с ошибкой в конце.
    Третий код:
    11 000 10 01 001 110 = с ошибкой в конце.
    Четвертый код:
    11 000 000 10 11 110 = с ошибкой в конце.
    Ответ: 1

    15)

    кодирование: А-00, Б-11, В-010, Г-011. Через канал связи передается сообщение: ВАГБГВ. Закодируйте сообщение

    данным кодом. Полученную двоичную последовательность переведите в шестнадцатеричный вид.
    1) AD34 2) 43DA 3) 101334 4) CADBCD
    Решение и ответ:

    ВАГБГВ = 0100001111011010 2 , переведем в шестнадцатеричную систему:
    0100 0011 1101 1010 2 = 43DA 16
    Ответ: 2

    16) Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=1, Б=01, В=001. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?
    1) 0001 2) 000 3) 11 4) 101
    Решение и ответ:
    Для того, чтобы сообщение раскодировалось, требуется, чтобы ни один код не был началом другого - более длинного кода.

    1, 3 и 4 варианты не подходят, являются началом других кодов.
    2 вариант - не является началом других кодов.
    Ответ: 2

    17) Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=0, Б=100, В=101. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

    1) 1 2) 11 3) 01 4) 010

    Аналогично заданию номер 16.

    Ответ: 2

    18) Черно-белое растровое изображение кодируется построчно, начиная с левого верхнего угла и заканчивая в правом нижнем углу. При кодировании 1 обозначает черный цвет, а 0 - белый.

    Для компактности результат записали в восьмеричной системе счисления. Выберите правильную запись кода.
    1) 57414 2) 53414 3) 53412 4) 53012

    Решение и ответ:
    После кодирования мы получаем данный код:

    101011100001010 2 , переведем данный код в восьмеричную:
    101 011 100 001 010 2 = 53412 8

    Ответ: 3

    19) Для передачи по каналу связи сообщения, состоящего только из символов А, Б, В и Г используется посимвольное

    кодирование: А-0, Б-11, В-100, Г-011. Через канал связи передается сообщение: ГБАВАВГ. Закодируйте сообщение

    данным кодом. Полученную двоичную последовательность переведите в восьмеричный код.
    1) DBACACD 2) 75043 3) 7A23 4) 3304043
    Решение и ответ: Соответственно:
    ГБАВАВГ = 0111101000100011 2 , переведем в восьмеричную систему.
    0 111 101 000 100 011 2 = 75043 8 , первый нолик не значащий.
    Ответ: 2

    20) Для передачи данных по каналу связи используется 5-битовый код. Сообщение содержит только

    буквы А, Б и В, которые кодируются следующими кодовыми словами:

    A — 11010, Б — 00110, В — 10101.

    При передаче возможны помехи. Однако некоторые ошибки можно попытаться исправить. Любые два из этих трёх кодовых слов отличаются друг от друга не менее чем в трёх позициях. Поэтому если при передаче слова произошла ошибка не более чем в одной позиции, то можно сделать обоснованное предположение о том, какая буква передавалась. (Говорят, что «код исправляет одну ошибку».) Например, если получено кодовое слово 10110, считается, что передавалась буква Б. (Отличие от кодового слова для Б — только в одной позиции, для остальных кодовых слов отличий больше.) Если принятое кодовое слово отличается от кодовых слов для букв А, Б, В более чем в одной позиции, то считается, что произошла ошибка(она обозначается‘x’).

    Получено сообщение 00111 11110 11000 10111. Декодируйте это сообщение — выберите правильный вариант.

    1) БААx
    2) БААВ
    3) xxxx
    4) xAAx

    Решение:
    1) 00111 = Б, так как 1 ошибка в последней цифре.
    2) 11110 = A, так как 1 ошибка в третьей цифре.
    3) 11000 = А, так как 1 ошибка в четвертой цифре.
    4) 10111 = В, так как 1 ошибка в четвертой цифре

    00111 11110 11000 10111 = БААВ .
    Ответ: 2

    ГБПОУ города Москвы «Спортивно-педагогический колледж»

    Департамент спорта и туризма города Москвы

    Преподаватель информатики и ИКТ: Макеева Е.С.

    Задачи ЕГЭ. Кодирование текстовой информации

    Задача 1

    Считая, что каждый символ кодируется одним байтом, оцените объем следующего предложения (в битах) в кодировке ASCII : http :// www . fipi . ru

    Задача 2

    В кодировке КОИ-8 каждый символ кодируется 8 битами. Определите информационный объем (в байтах) следующего предложения: Mail . ru - почтовый сервер. В ответе укажите только число.

    Задача 3

    Каждый символ в Unicode закодирован двухбайтовым словом. Определите информационный объем (в битах) следующей фразы А.П. Чехова в этой кодировке: Что непонятно, то и чудо. В ответе укажите только число.

    Задача 4

    В текстовом редакторе включена кодировка текста КОИ-8 (1 байт на 1 символ). Мальчик набрал несколько слов. Сколько символов набрано в редакторе, если общий объем информации, набранный мальчиком, составил 592 бита?

    Задача 5

    Информационный объем предложения Кашу маслом не испортишь. составляет 50 байт. Определите, сколькими битами кодируется один символ. В ответе укажите только число.

    Задача 6

    Во сколько раз уменьшится информационный объем страницы текста (текст не содержит управляющих символов форматирования) при его преобразовании из кодировки Unicode (таблица кодировки содержит 65 536 символов) в кодировку Windows (таблица кодировки содержит 256 символов)? В ответе укажите только число.

    Задача 7

    Используется кодовая таблица CP1251 (Windows Cyrillic). Сколько килобайт будет занимать файл в простом текстовом формате (plain text), если в тексте 200 страниц, на странице 32 строки, а в строке в среднем 48 символов? В ответе укажите только число.

    Задача 8

    Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65 536 символов. Какое количество информации (в килобайтах) будет нести текстовый документ, каждая страница которого содержит 40 строк по 50 символов, после 10 минут работы приложения? В ответе укажите только число.

    Задача 9

    Сообщение на греческом языке, содержащее 150 символов, было записано в 16-битном коде Unicode . Каков информационный объем сообщения в байтах? В ответе укажите только число.

    Задача 10

    Автоматическое устройство осуществило автоматическую перекодировку информационного сообщения на русском языке из 16-битного представления Unicode в 8-битную кодировку КОИ-8. До перекодировки информационный объем сообщения составлял 30 байт. Определите информационный объем сообщения (в битах) после перекодировки. В ответе укажите только число.

    Задачи ЕГЭ. Кодирование текстовой информации.

    Задача 1

    Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 640 бит. Какова длина сообщения в символах?

    Задача 2

    Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 50 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения?

    Задача 3

    Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 55 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения? В ответе запишите только число.

    Задача 4

    Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 100 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения? В ответе запишите только число.

    Задача 5

    Сообщение на русском языке первоначально было записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 80 бит. Сколько символов содержит сообщение?

    Задача 6

    Сообщение на русском языке первоначально было записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 320 бит. Сколько символов содержит сообщение?

    Задача 7

    Текстовый документ, состоящий из 10240 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.

    Задача 8

    Текстовый документ, состоящий из 11264 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.

    Задача 9

    Сообщение на русском языке первоначально было записано в 16-битном коде Unicode. Автоматическое устройство осуществило его перекодировку в 8-битную кодировку Windows 1251. При этом информационное сообщение уменьшилось на 320 байт. Определите длину сообщения в символах.

    Задача 10

    Пользователь электронного почтового ящика написал письмо на русском языке, выбрав кодировку Unicode . Но потом он решил использовать 8-битную кодировку КОИ-8. При этом информационный объем его письма уменьшился на 2 Кбайта. Какова длина сообщения в символах?

    Задачи ЕГЭ. Кодирование графической информации

    Задача 1

    Черно-белое (без градаций серого цвета) растровое графическое изображение имеет размер 10х10 точек. Какой объем памяти в битах займет это изображение? В ответе запишите только число.

    Задача 2

    Черно-белое (без градаций серого цвета) растровое графическое изображение имеет размер 20х20 точек. Какой объем памяти в байтах займет это изображение? В ответе запишите только число.

    Задача 3

    Цветное (с палитрой из 256 цветов) растровое графическое изображение имеет размер 10х10 точек. Какой объем памяти в битах займет это изображение? В ответе запишите только число.

    Задача 4

    В процессе преобразования растрового графического изображения количество цветов уменьшилось с 65 536 до 16. Во сколько раз уменьшился информационный объем графического файла?

    Задача 5

    В процессе преобразования растрового графического файла количество цветов уменьшилось с 1024 до 32. Во сколько раз уменьшился информационный объем файла?

    Задача 6

    Для хранения растрового изображения размером 32×32 пикселя отвели 512 байтов памяти. Каково максимально возможное число цветов в палитре изображения? В ответе запишите только число.

    Задача 7

    Для хранения растрового изображения размером 64×64 пикселя отвели 3 килобайта памяти. Каково максимально возможное количество цветов в палитре изображения? В ответе запишите только число.

    Задача 8

    Какой объем памяти в килобайтах необходимо выделить под хранение растрового изображения размером 240×192 пикселей, если в палитре изображения 65 тысяч цветов? В ответе запишите только число.

    Задача 9

    Разрешение экрана монитора 1024х768 точек, глубина цвета - 16 бит. Каков необходимый объем видеопамяти (в мегабайтах) для данного графического режима? В ответе запишите только число.

    Задача 10

    Какой объем памяти в килобайтах необходимо выделить под хранение растрового изображения размером 640×480 пикселей, если в палитре изображения 16 миллионов цветов? В ответе запишите только число.

    Задачи ЕГЭ. Кодирование звуковой информации.

    Задача 1

    Аналоговый звуковой сигнал был дискретизирован сначала с использованием 65 536 уровней интенсивности сигнала (качество звучания аудио-CD), а затем - с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции). Во сколько раз различаются информационные объемы оцифрованных звуковых сигналов? В ответе запишите только число.

    Задача 2

    Производится двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. Запись длится 8 минут, ее результаты записываются в файл, сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

    Задача 3

    Двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением велась в течение 5 минут. Сжатие данных не производилось. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

    Задача 4

    Двухканальная (стерео) звукозапись с частотой дискретизации 32 кГц и 24-битным разрешением велась в течение 5 минут. Сжатие данных не производилось. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

    Задача 5

    Проводилась одноканальная (моно) звукозапись с частотой дискретизации 32 кГц и 32-битным разрешением. В результате был получен файл размером 20 Мбайт, сжатие данных не производилось. Какая из приведенных ниже величин наиболее близка к времени, в течение которого проводилась запись?

    Задача 6

    Проводилась одноканальная (моно) звукозапись с частотой дискретизации 32 кГц и 32-битным разрешением. В результате был получен файл размером 40 Мбайт, сжатие данных не производилось. Какая из приведенных ниже величин наиболее близка к времени, в течение которого проводилась запись?

    Задача 7

    Производилась двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. В результате был получен файл размером 30 Мбайт, сжатие данных не производилось. Какая из приведенных ниже величин наиболее близка к времени, в течение которого производилась запись?

    Задача 8

    Двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением велась в течение 10 минут. Сжатие данных не производится. Какая из приведенных ниже величин наиболее близка к размеру полученного файла?

    Задача 9

    Пользователю необходимо записать цифровой аудиофайл (моно) длительностью 1 минута и разрешением 16 бит. Какой должна быть частота дискретизации, если в распоряжении пользователя есть 2,6 Мбайт памяти?

    Задача 10

    Цифровой аудиофайл (моно) имеет продолжительность звучания 1 минута. При этом он занимает 2,52 Мбайт. С какой частотой дискретизации записан звук, если разрядность звуковой платы 8 бит?

    Контрольная работа. Вариант 1

    Задача 1

    Фразу на русском языке закодировали 16-битным кодом Unicode :

    «Не стыдно чего-нибудь не знать, но стыдно не хотеть учиться» (Сократ)

    Каков информационный объем этой фразы (взятой в кавычки) в байтах. В ответе запишите только число.

    Задача 2

    Текстовый документ, состоящий из 20480 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.

    Задача 3

    Какой объем памяти в килобайтах необходимо выделить под хранение растрового изображения размером 128×128 пикселей, если в палитре изображения 64 цвета? В ответе запишите только число.

    Задача 4

    Для хранения растрового изображения размером 160×128 пикселей отвели 5 килобайт памяти. Каково максимально возможное количество цветов в палитре изображения? В ответе запишите только число.

    Задача 5

    Цифровой аудиофайл (моно) занимает 2,7 Мбайт памяти, разрешение 16 бит. С какой частотой дискретизации записан звук, если длительность звучания 1 минута?

    Контрольная работа. Вариант 2

    Задача 1

    Каждый символ в Unicode закодирован двухбайтным словом. Оцените информационный объем следующего предложения в байтах.

    «Вкладка - раздел (страница) диалогового окна»

    В ответе запишите только число.

    Задача 2

    Некоторое сообщение первоначально было записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 1040 бит. Укажите длину сообщения в символах. В ответе запишите только число.

    Задача 3

    Какой объем памяти в килобайтах необходимо выделить под хранение растрового изображения размером 128×128 пикселей, если в палитре изображения 256 цветов? В ответе запишите только число.

    Задача 4

    Для хранения растрового изображения размером 64×64 пикселей отвели 3 килобайта памяти. Каково максимально возможное количество цветов в палитре изображения? В ответе запишите только число.

    Задача 5

    Объем свободной памяти на диске 10,1 Мбайт, разрядность звуковой платы - 16 бит. Какой может быть продолжительность звучания аудиофайла (стерео), записанного с частотой дискретизации 44,1 кГц?

    Ответы к задачам ЕГЭ:

    1

    144

    400

    300

    156

    300

    120

    2

    400

    440

    800

    320

    2048

    3

    100

    800

    1,5

    900

    4

    Контр. раб.
    Вариант1

    118

    Контр. раб.
    Вариант2

    130

    Информация и ее кодирование

    Различные подходы к определению понятия «информация». Виды информационных процессов. Информационный аспект в деятельности человека

    Информация (лат. informatio — разъяснение, изложение, набор сведений) — базовое понятие в информатике, которому нельзя дать строгого определения, а можно только пояснить:

    • информация — это новые факты, новые знания;
    • информация — это сведения об объектах и явлениях окружающей среды, которые повышают уровень осведомленности человека;
    • информация — это сведения об объектах и явлениях окружающей среды, которые уменьшают степень неопределенности знаний об этих объектах или явлениях при принятии определенных решений.

    Понятие «информация» является общенаучным, т. е. используется в различных науках: физике, биологии, кибернетике, информатике и др. При этом в каждой науке данное понятие связано с различными системами понятий. Так, в физике информация рассматривается как антиэнтропия (мера упорядоченности и сложности системы). В биологии понятие «информация» связывается с целесообразным поведением живых организмов, а также с исследованиями механизмов наследственности. В кибернетике понятие «информация» связано с процессами управления в сложных системах.

    Основными социально значимыми свойствами информации являются:

    • полезность;
    • доступность (понятность);
    • актуальность;
    • полнота;
    • достоверность;
    • адекватность.

    В человеческом обществе непрерывно протекают информационные процессы: люди воспринимают информацию из окружающего мира с помощью органов чувств, осмысливают ее и принимают определенные решения, которые, воплощаясь в реальные действия, воздействуют на окружающий мир.

    Информационный процесс — это процесс сбора (приема), передачи (обмена), хранения, обработки (преобразования) информации.

    Сбор информации — это процесс поиска и отбора необходимых сообщений из разных источников (работа со специальной литературой, справочниками; проведение экспериментов; наблюдения; опрос, анкетирование; поиск в информационно-справочных сетях и системах и т. д.).

    Передача информации — это процесс перемещения сообщений от источника к приемнику по каналу передачи. Информация передается в форме сигналов — звуковых, световых, ультразвуковых, электрических, текстовых, графических и др. Каналами передачи могут быть воздушное пространство, электрические и оптоволоконные кабели, отдельные люди, нервные клетки человека и т. д.

    Хранение информации — это процесс фиксирования сообщений на материальном носителе. Сейчас для хранения информации используются бумага, деревянные, тканевые, металлические и другие поверхности, кино- и фотопленки, магнитные ленты, магнитные и лазерные диски, флэш-карты и др.

    Обработка информации — это процесс получения новых сообщений из имеющихся. Обработка информации является одним из основных способов увеличения ее количества. В результате обработки из сообщения одного вида можно получить сообщения других видов.

    Защита информации — это процесс создания условий, которые не допускают случайной потери, повреждения, изменения информации или несанкционированного доступа к ней. Способами защиты информации являются создание ее резервных копий, хранение в защищенном помещении, предоставление пользователям соответствующих прав доступа к информации, шифрование сообщений и др.

    Язык как способ представления и передачи информации

    В зависимости от способа восприятия знаки делятся на:

    • зрительные (буквы и цифры, математические знаки, музыкальные ноты, дорожные знаки и др.);
    • слуховые (устная речь, звонки, сирены, гудки и др.);
    • осязательные (азбука Брайля для слепых, жесты-касания и др.);
    • обонятельные;
    • вкусовые.

    Для долговременного хранения знаки записывают на носители информации.

    Для передачи информации используются знаки в виде сигналов (световые сигналы светофора, звуковой сигнал школьного звонка и т. д.).

    По способу связи между формой и значением знаки делятся на:

    • иконические — их форма похожа на отображаемый объект (например, значок папки «Мой компьютер» на «Рабочем столе» компьютера);
    • символы — связь между их формой и значением устанавливается по общепринятому соглашению (например, буквы, математические символы ∫, ≤, ⊆, ∞; символы химических элементов).

    Для представления информации используются знаковые системы, которые называются языками . Основу любого языка составляет алфавит — набор символов, из которых формируется сообщение, и набор правил выполнения операций над символами.

    Языки делятся на:

    • естественные (разговорные) — русский, английский, немецкий и др.;
    • формальные — встречающиеся в специальных областях человеческой деятельности (например, язык алгебры, языки программирования, электрических схем и др.)

    Системы счисления также можно рассматривать как формальные языки. Так, десятичная система счисления — это язык, алфавит которого состоит из десяти цифр 0..9, двоичная система счисления — язык, алфавит которого состоит из двух цифр — 0 и 1.

    Методы измерения количества информации: вероятностный и алфавитный

    Единицей измерения количества информации является бит . 1 бит — это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо.

    Связь между количеством возможных событий N и количеством информации I определяется формулой Хартли:

    Например, пусть шарик находится в одной из четырех коробок. Таким образом, имеется четыре равновероятных события (N = 4). Тогда по формуле Хартли 4 = 2 I . Отсюда I = 2. То есть сообщение о том, в какой именно коробке находится шарик, содержит 2 бита информации.

    Алфавитный подход

    При алфавитном подходе к определению количества информации отвлекаются от содержания (смысла) информации и рассматривают ее как последовательность знаков определенной знаковой системы. Набор символов языка (алфавит) можно рассматривать как различные возможные события. Тогда, если считать, что появление символов в сообщении равновероятно, по формуле Хартли можно рассчитать, какое количество информации несет каждый символ:

    Например, в русском языке 32 буквы (буква ё обычно не используется), т. е. количество событий будет равно 32. Тогда информационный объем одного символа будет равен:

    I = log 2 32 = 5 битов.

    Если N не является целой степенью 2, то число log 2 N не является целым числом, и для I надо выполнять округление в большую сторону. При решении задач в таком случае I можно найти как log 2 N", где N′ — ближайшая к N степень двойки — такая, что N′ > N.

    Например, в английском языке 26 букв. Информационный объем одного символа можно найти так:

    N = 26; N" = 32; I = log 2 N" = log 2 (2 5) = 5 битов.

    Если количество символов алфавита равно N, а количество символов в записи сообщения равно М, то информационный объем данного сообщения вычисляется по формуле:

    I = M · log 2 N.

    Примеры решения задач

    Пример 1. Световое табло состоит из лампочек, каждая из которых может находиться в одном из двух состояний («включено» или «выключено»). Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 50 различных сигналов?

    Решение. С помощью n лампочек, каждая из которых может находиться в одном из двух состояний, можно закодировать 2 n сигналов. 2 5 < 50 < 2 6 , поэтому пяти лампочек недостаточно, а шести хватит.

    Ответ: 6.

    Пример 2. Метеорологическая станция ведет наблюдения за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100, которое записывается при помощи минимально возможного количества битов. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.

    Решение. В данном случае алфавитом является множество целых чисел от 0 до 100. Всего таких значений 101. Поэтому информационный объем результатов одного измерения I = log 2 101. Это значение не будет целочисленным. Заменим число 101 ближайшей к нему степенью двойки, большей 101. Это число 128 = 27. Принимаем для одного измерения I = log 2 128 = 7 битов. Для 80 измерений общий информационный объем равен:

    80 · 7 = 560 битов = 70 байтов.

    Ответ: 70 байтов.

    Вероятностный подход

    Вероятностный подход к измерению количества информации применяют, когда возможные события имеют различные вероятности реализации. В этом случае количество информации определяют по формуле Шеннона:

    $I=-∑↙{i=1}↖{N}p_ilog_2p_i$,

    где $I$ — количество информации;

    $N$ — количество возможных событий;

    $p_i$ — вероятность $i$-го события.

    Например, пусть при бросании несимметричной четырехгранной пирамидки вероятности отдельных событий будут равны:

    $p_1={1}/{2}, p_2={1}/{4}, p_3={1}/{8}, p_4={1}/{8}$.

    Тогда количество информации, которое будет получено после реализации одного из них, можно вычислить по формуле Шеннона:

    $I=-({1}/{2}·log_2{1}/{2}+{1}/{4}·log_2{1}/{4}+{1}/{8}·log_2{1}/{8}+{1}/{8}·log_2{1}/{8})={14}/{8}$ битов $= 1.75 $бита.

    Единицы измерения количества информации

    Наименьшей единицей информации является бит (англ. binary digit (bit) — двоичная единица информации).

    Бит — это количество информации, необходимое для однозначного определения одного из двух равновероятных событий. Например, один бит информации получает человек, когда он узнает, опаздывает с прибытием нужный ему поезд или нет, был ночью мороз или нет, присутствует на лекции студент Иванов или нет и т. д.

    В информатике принято рассматривать последовательности длиной 8 битов. Такая последовательность называется байтом.

    Производные единицы измерения количества информации:

    1 байт = 8 битов

    1 килобайт (Кб) = 1024 байта = 2 10 байтов

    1 мегабайт (Мб) = 1024 килобайта = 2 20 байтов

    1 гигабайт (Гб) = 1024 мегабайта = 2 30 байтов

    1 терабайт (Тб) = 1024 гигабайта = 2 40 байтов

    Процесс передачи информации. Виды и свойства источников и приемников информации. Сигнал, кодирование и декодирование, причины искажения информации при передаче

    Информация передается в виде сообщений от некоторого источника информации к ее приемнику посредством канала связи между ними.

    В качестве источника информации может выступать живое существо или техническое устройство. Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал.

    Сигнал — это материально-энергетическая форма представления информации. Другими словами, сигнал — это переносчик информации, один или несколько параметров которого, изменяясь, отображают сообщение. Сигналы могут быть аналоговыми (непрерывными) или дискретными (импульсными).

    Сигнал посылается по каналу связи. В результате в приемнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением.

    Передача информации по каналам связи часто сопровождается воздействием помех, вызывающих искажение и потерю информации.

    Примеры решения задач

    Пример 1. Для кодирования букв А, З, Р, О используются двухразрядные двоичные числа 00, 01, 10, 11 соответственно. Этим способом закодировали слово РОЗА и результат записали шестнадцатеричным кодом. Указать полученное число.

    Решение. Запишем последовательность кодов для каждого символа слова РОЗА: 10 11 01 00. Если рассматривать полученную последовательность как двоичное число, то в шестнадцатеричном коде оно будет равно: 1011 0100 2 = В4 16 .

    Ответ: В4 16 .

    Скорость передачи информации и пропускная способность канала связи

    Прием/передача информации может происходить с разной скоростью. Количество информации, передаваемое за единицу времени, есть скорость передачи информации , или скорость информационного потока.

    Скорость выражается в битах в секунду (бит/с) и кратных им Кбит/с и Мбит/с, а также в байтах в секунду (байт/с) и кратных им Кбайт/с и Мбайт/с.

    Максимальная скорость передачи информации по каналу связи называется пропускной способностью канала.

    Примеры решения задач

    Пример 1. Скорость передачи данных через ADSL-соединение равна 256000 бит/с. Передача файла через данное соединение заняла 3 мин. Определите размер файла в килобайтах.

    Решение. Размер файла можно вычислить, если умножить скорость передачи информации на время передачи. Выразим время в секундах: 3 мин = 3 ⋅ 60 = 180 с. Выразим скорость в килобайтах в секунду: 256000 бит/с = 256000: 8: 1024 Кбайт/с. При вычислении размера файла для упрощения расчетов выделим степени двойки:

    Размер файла = (256000: 8: 1024) ⋅ (3 ⋅ 60) = (2 8 ⋅ 10 3: 2 3: 2 10) ⋅ (3 ⋅ 15 ⋅ 2 2) = (2 8 ⋅ 125 ⋅ 2 3: 2 3: 2 10) ⋅ (3 ⋅ 15 ⋅ 2 2) = 125 ⋅ 45 = 5625 Кбайт.

    Ответ: 5625 Кбайт.

    Представление числовой информации. Сложение и умножение в разных системах счисления

    Представление числовой информации с помощью систем счисления

    Для представления информации в компьютере используется двоичный код, алфавит которого состоит из двух цифр — 0 и 1. Каждая цифра машинного двоичного кода несет количество информации, равное одному биту.

    Система счисления — это система записи чисел с помощью определенного набора цифр.

    Система счисления называется позиционной , если одна и та же цифра имеет различное значение, которое определяется ее местом в числе.

    Позиционной является десятичная система счисления. Например, в числе 999 цифра «9» в зависимости от позиции означает 9, 90, 900.

    Римская система счисления является непозиционной . Например, значение цифры Х в числе ХХІ остается неизменным при вариации ее положения в числе.

    Позиция цифры в числе называется разрядом . Разряд числа возрастает справа налево, от младших разрядов к старшим.

    Количество различных цифр, употребляемых в позиционной системе счисления, называется ее основанием .

    Развернутая форма числа — это запись, которая представляет собой сумму произведений цифр числа на значение позиций.

    Например: 8527 = 8 ⋅ 10 3 + 5 ⋅ 10 2 + 2 ⋅ 10 1 + 7 ⋅ 10 0 .

    Развернутая форма записи чисел произвольной системы счисления имеет вид

    $∑↙{i=n-1}↖{-m}a_iq^i$,

    где $X$ — число;

    $a$ — цифры численной записи, соответствующие разрядам;

    $i$ — индекс;

    $m$ — количество разрядов числа дробной части;

    $n$ — количество разрядов числа целой части;

    $q$ — основание системы счисления.

    Например, запишем развернутую форму десятичного числа $327.46$:

    $n=3, m=2, q=10.$

    $X=∑↙{i=2}↖{-2}a_iq^i=a_2·10^2+a_1·10^1+a_0·10^0+a_{-1}·10^{-1}+a_{-2}·10^{-2}=3·10^2+2·10^1+7·10^0+4·10^{-1}+6·10^{-2}$

    Если основание используемой системы счисления больше десяти, то для цифр вводят условное обозначение со скобкой вверху или буквенное обозначение: В — двоичная система, О — восмеричная, Н — шестнадцатиричная.

    Например, если в двенадцатеричной системе счисления 10 = А, а 11 = В, то число 7А,5В 12 можно расписать так:

    7А,5В 12 = В ⋅ 12 -2 + 5 ⋅ 2 -1 + А ⋅ 12 0 + 7 ⋅ 12 1 .

    В шестнадцатеричной системе счисления 16 цифр, обозначаемых 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, что соответствует следующим числам десятеричной системы счисления: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15. Примеры чисел: 17D,ECH; F12AH.

    Перевод чисел в позиционных системах счисления

    Перевод чисел из произвольной системы счисления в десятичную

    Для перевода числа из любой позиционной системы счисления в десятичную необходимо использовать развернутую форму числа, заменяя, если это необходимо, буквенные обозначения соответствующими цифрами. Например:

    1101 2 = 1 ⋅ 2 3 + 1 ⋅ 2 2 + 0 ⋅ 2 1 + 1 ⋅ 2 0 = 13 10 ;

    17D,ECH = 12 ⋅ 16 -2 + 14 ⋅ 16 -1 + 13 ⋅ 160 + 7 ⋅ 16 1 + 1 ⋅ 16 2 = 381,921875.

    Перевод чисел из десятичной системы счисления в заданную

    Для преобразования целого числа десятичной системы счисления в число любой другой системы счисления последовательно выполняют деление нацело на основание системы счисления, пока не получат нуль. Числа, которые возникают как остаток от деления на основание системы, представляют собой последовательную запись разрядов числа в выбранной системе счисления от младшего разряда к старшему. Поэтому для записи самого числа остатки от деления записывают в обратном порядке.

    Например, переведем десятичное число 475 в двоичную систему счисления. Для этого будем последовательно выполнять деление нацело на основание новой системы счисления, т. е. на 2:

    Читая остатки от деления снизу вверх, получим 111011011.

    Проверка:

    1 ⋅ 2 8 + 1 ⋅ 2 7 + 1 ⋅ 2 6 + 0 ⋅ 2 5 + 1 ⋅ 2 4 + 1 ⋅ 2 3 + 0 ⋅ 2 2 + 1 ⋅ 2 1 + 1 ⋅ 2 0 = 1 + 2 + 8 + 16 + 64 + 128 + 256 = 475 10 .

    Для преобразования десятичных дробей в число любой системы счисления последовательно выполняют умножение на основание системы счисления, пока дробная часть произведения не будет равна нулю. Полученные целые части являются разрядами числа в новой системе, и их необходимо представлять цифрами этой новой системы счисления. Целые части в дальнейшем отбрасываются.

    Например, переведем десятичную дробь 0,375 10 в двоичную систему счисления:

    Полученный результат — 0,011 2 .

    Не каждое число может быть точно выражено в новой системе счисления, поэтому иногда вычисляют только требуемое количество разрядов дробной части.

    Перевод чисел из двоичной системы счисления в восьмеричную и шестнадцатеричную и обратно

    Для записи восьмеричных чисел используются восемь цифр, т. е. в каждом разряде числа возможны 8 вариантов записи. Каждый разряд восьмеричного числа содержит 3 бита информации (8 = 2 І ; І = 3).

    Таким образом, чтобы из восьмеричной системы счисления перевести число в двоичный код, необходимо каждую цифру этого числа представить триадой двоичных символов. Лишние нули в старших разрядах отбрасываются.

    Например:

    1234,777 8 = 001 010 011 100,111 111 111 2 = 1 010 011 100,111 111 111 2 ;

    1234567 8 = 001 010 011 100 101 110 111 2 = 1 010 011 100 101 110 111 2 .

    При переводе двоичного числа в восьмеричную систему счисления нужно каждую триаду двоичных цифр заменить восьмеричной цифрой. При этом, если необходимо, число выравнивается путем дописывания нулей перед целой частью или после дробной.

    Например:

    1100111 2 = 001 100 111 2 = 147 8 ;

    11,1001 2 = 011,100 100 2 = 3,44 8 ;

    110,0111 2 = 110,011 100 2 = 6,34 8 .

    Для записи шестнадцатеричных чисел используются шестнадцать цифр, т. е. для каждого разряда числа возможны 16 вариантов записи. Каждый разряд шестнадцатеричного числа содержит 4 бита информации (16 = 2 І ; І = 4).

    Таким образом, для перевода двоичного числа в шестнадцатеричное его нужно разбить на группы по четыре цифры и преобразовать каждую группу в шестнадцатеричную цифру.

    Например:

    1100111 2 = 0110 0111 2 = 67 16 ;

    11,1001 2 = 0011,1001 2 = 3,9 16 ;

    110,0111001 2 = 0110,0111 0010 2 = 65,72 16 .

    Для перевода шестнадцатеричного числа в двоичный код необходимо каждую цифру этого числа представить четверкой двоичных цифр.

    Например:

    1234,AB77 16 = 0001 0010 0011 0100,1010 1011 0111 0111 2 = 1 0010 0011 0100,1010 1011 0111 0111 2 ;

    CE4567 16 = 1100 1110 0100 0101 0110 0111 2 .

    При переводе числа из одной произвольной системы счисления в другую нужно выполнить промежуточное преобразование в десятичное число. При переходе из восьмеричного счисления в шестнадцатеричное и обратно используется вспомогательный двоичный код числа.

    Например, переведем троичное число 211 3 в семеричную систему счисления. Для этого сначала преобразуем число 211 3 в десятичное, записав его развернутую форму:

    211 3 = 2 ⋅ 3 2 + 1 ⋅ 3 1 + 1 ⋅ 3 0 = 18 + 3 + 1 = 22 10 .

    Затем переведем десятичное число 22 10 в семеричную систему счисления делением нацело на основание новой системы счисления, т. е. на 7:

    Итак, 211 3 = 31 7 .

    Примеры решения задач

    Пример 1. В системе счисления с некоторым основанием число 12 записывается в виде 110. Указать это основание.

    Решение. Обозначим искомое основание п. По правилу записи чисел в позиционных системах счисления 12 10 = 110 n = 0 ·n 0 + 1 · n 1 + 1 · n 2 . Составим уравнение: n 2 + n = 12 . Найдем натуральный корень уравнения (отрицательный корень не подходит, т. к. основание системы счисления, по определению, натуральное число большее единицы): n = 3 . Проверим полученный ответ: 110 3 = 0· 3 0 + 1 · 3 1 + 1 · 3 2 = 0 + 3 + 9 = 12 .

    Ответ: 3.

    Пример 2. Указать через запятую в порядке возрастания все основания систем счисления, в которых запись числа 22 оканчивается на 4.

    Решение. Последняя цифра в записи числа представляет собой остаток от деления числа на основание системы счисления. 22 - 4 = 18. Найдем делители числа 18. Это числа 2, 3, 6, 9, 18. Числа 2 и 3 не подходят, т. к. в системах счисления с основаниями 2 и 3 нет цифры 4. Значит, искомыми основаниями являются числа 6, 9 и 18. Проверим полученный результат, записав число 22 в указанных системах счисления: 22 10 = 34 6 = 24 9 = 14 18 .

    Ответ: 6, 9, 18.

    Пример 3. Указать через запятую в порядке возрастания все числа, не превосходящие 25, запись которых в двоичной системе счисления оканчивается на 101. Ответ записать в десятичной системе счисления.

    Решение. Для удобства воспользуемся восьмеричной системой счисления. 101 2 = 5 8 . Тогда число х можно представить как x = 5 · 8 0 + a 1 · 8 1 + a 2 · 8 2 + a 3 · 8 3 + ... , где a 1 , a 2 , a 3 , … — цифры восьмеричной системы. Искомые числа не должны превосходить 25, поэтому разложение нужно ограничить двумя первыми слагаемыми (8 2 > 25), т. е. такие числа должны иметь представление x = 5 + a 1 · 8. Поскольку x ≤ 25 , допустимыми значениями a 1 будут 0, 1, 2. Подставив эти значения в выражение для х, получим искомые числа:

    a 1 = 0; x = 5 + 0 · 8 = 5;.

    a 1 =1; x = 5 + 1 · 8 = 13;.

    a 1 = 2; x = 5 + 2 · 8 = 21;.

    Выполним проверку:

    13 10 = 1101 2 ;

    21 10 = 10101 2 .

    Ответ: 5, 13, 21.

    Арифметические операции в позиционных системах счисления

    Правила выполнения арифметических действий над двоичными числами задаются таблицами сложения, вычитания и умножения.

    Правило выполнения операции сложения одинаково для всех систем счисления: если сумма складываемых цифр больше или равна основанию системы счисления, то единица переносится в следующий слева разряд. При вычитании, если необходимо, делают заем.

    Пример выполнения сложения : сложим двоичные числа 111 и 101, 10101 и 1111:

    Пример выполнения вычитания: вычтем двоичные числа 10001 - 101 и 11011 - 1101:

    Пример выполнения умножения: умножим двоичные числа 110 и 11, 111 и 101:

    Аналогично выполняются арифметические действия в восьмеричной, шестнадцатеричной и других системах счисления. При этом необходимо учитывать, что величина переноса в следующий разряд при сложении и заем из старшего разряда при вычитании определяется величиной основания системы счисления.

    Например, выполним сложение восьмеричных чисел 36 8 и 15 8 , а также вычитание шестнадцатеричных чисел 9С 16 и 67 16:

    При выполнении арифметических операций над числами, представленными в разных системах счисления, нужно предварительно перевести их в одну и ту же систему.

    Представление чисел в компьютере

    Формат с фиксированной запятой

    В памяти компьютера целые числа хранятся в формате с фиксированной запятой : каждому разряду ячейки памяти соответствует один и тот же разряд числа, «запятая» находится вне разрядной сетки.

    Для хранения целых неотрицательных чисел отводится 8 битов памяти. Минимальное число соответствует восьми нулям, хранящимся в восьми битах ячейки памяти, и равно 0. Максимальное число соответствует восьми единицам и равно

    1 ⋅ 2 7 + 1 ⋅ 2 6 + 1 ⋅ 2 5 + 1 ⋅ 2 4 + 1 ⋅ 2 3 + 1 ⋅ 2 2 + 1 ⋅ 2 1 + 1 ⋅ 2 0 = 255 10 .

    Таким образом, диапазон изменения целых неотрицательных чисел — от 0 до 255.

    Для п-разрядного представления диапазон будет составлять от 0 до 2 n - 1.

    Для хранения целых чисел со знаком отводится 2 байта памяти (16 битов). Старший разряд отводится под знак числа: если число положительное, то в знаковый разряд записывается 0, если число отрицательное — 1. Такое представление чисел в компьютере называется прямым кодом .

    Для представления отрицательных чисел используется дополнительный код . Он позволяет заменить арифметическую операцию вычитания операцией сложения, что существенно упрощает работу процессора и увеличивает его быстродействие. Дополнительный код отрицательного числа А, хранящегося в п ячейках, равен 2 n − |А|.

    Алгоритм получения дополнительного кода отрицательного числа:

    1. Записать прямой код числа в п двоичных разрядах.

    2. Получить обратный код числа . (Обратный код образуется из прямого кода заменой нулей единицами, а единиц — нулями, кроме цифр знакового разряда. Для положительных чисел обратный код совпадает с прямым. Используется как промежуточное звено для получения дополнительного кода.)

    3. Прибавить единицу к полученному обратному коду.

    Например, получим дополнительный код числа -2014 10 для шестнадцатиразрядного представления:

    При алгебраическом сложении двоичных чисел с использованием дополнительного кода положительные слагаемые представляют в прямом коде, а отрицательные — в дополнительном коде. Затем суммируют эти коды, включая знаковые разряды, которые при этом рассматриваются как старшие разряды. При переносе из знакового разряда единицу переноса отбрасывают. В результате получают алгебраическую сумму в прямом коде, если эта сумма положительная, и в дополнительном — если сумма отрицательная.

    Например:

    1) Найдем разность 13 10 - 12 10 для восьмибитного представления. Представим заданные числа в двоичной системе счисления:

    13 10 = 1101 2 и 12 10 = 1100 2 .

    Запишем прямой, обратный и дополнительный коды для числа -12 10 и прямой код для числа 13 10 в восьми битах:

    Вычитание заменим сложением (для удобства контроля за знаковым разрядом условно отделим его знаком «_»):

    Так как произошел перенос из знакового разряда, первую единицу отбрасываем, и в результате получаем 00000001.

    2) Найдем разность 8 10 - 13 10 для восьмибитного представления.

    Запишем прямой, обратный и дополнительный коды для числа -13 10 и прямой код для числа 8 10 в восьми битах:

    Вычитание заменим сложением:

    В знаковом разряде стоит единица, а значит, результат получен в дополнительном коде. Перейдем от дополнительного кода к обратному, вычтя единицу:

    11111011 - 00000001 = 11111010.

    Перейдем от обратного кода к прямому, инвертируя все цифры, за исключением знакового (старшего) разряда: 10000101. Это десятичное число -5 10 .

    Так как при п-разрядном представлении отрицательного числа А в дополнительном коде старший разряд выделяется для хранения знака числа, минимальное отрицательное число равно: А = -2 n-1 , а максимальное: |А| = 2 n-1 или А = -2 n-1 - 1.

    Определим диапазон чисел, которые могут храниться в оперативной памяти в формате длинных целых чисел со знаком (для хранения таких чисел отводится 32 бита памяти). Минимальное отрицательное число равно

    А = -2 31 = -2147483648 10 .

    Максимальное положительное число равно

    А = 2 31 - 1 = 2147483647 10 .

    Достоинствами формата с фиксированной запятой являются простота и наглядность представления чисел, простота алгоритмов реализации арифметических операций. Недостатком является небольшой диапазон представимых чисел, недостаточный для решения большинства прикладных задач.

    Формат с плавающей запятой

    Вещественные числа хранятся и обрабатываются в компьютере в формате с плавающей запятой , использующем экспоненциальную форму записи чисел.

    Число в экспоненциальном формате представляется в таком виде:

    где $m$ — мантисса числа (правильная отличная от нуля дробь);

    $q$ — основание системы счисления;

    $n$ — порядок числа.

    Например, десятичное число 2674,381 в экспоненциальной форме запишется так:

    2674,381 = 0,2674381 ⋅ 10 4 .

    Число в формате с плавающей запятой может занимать в памяти 4 байта (обычная точность ) или 8 байтов (двойная точность ). При записи числа выделяются разряды для хранения знака мантиссы, знака порядка, порядка и мантиссы. Две последние величины определяют диапазон изменения чисел и их точность.

    Определим диапазон (порядок) и точность (мантиссу) для формата чисел обычной точности, т. е. четырехбайтных. Из 32 битов 8 выделяется для хранения порядка и его знака и 24 — для хранения мантиссы и ее знака.

    Найдем максимальное значение порядка числа. Из 8 разрядов старший разряд используется для хранения знака порядка, остальные 7 — для записи величины порядка. Значит, максимальное значение равно 1111111 2 = 127 10 . Так как числа представляются в двоичной системе счисления, то

    $q^n = 2^{127}≈ 1.7 · 10^{38}$.

    Аналогично, максимальное значение мантиссы равно

    $m = 2^{23} - 1 ≈ 2^{23} = 2^{(10 · 2.3)} ≈ 1000^{2.3} = 10^{(3 · 2.3)} ≈ 10^7$.

    Таким образом, диапазон чисел обычной точности составляет $±1.7 · 10^{38}$.

    Кодирование текстовой информации. Кодировка ASCII. Основные используемые кодировки кириллицы

    Соответствие между набором символов и набором числовых значений называется кодировкой символа. При вводе в компьютер текстовой информации происходит ее двоичное кодирование. Код символа хранится в оперативной памяти компьютера. В процессе вывода символа на экран производится обратная операция — декодирование , т. е. преобразование кода символа в его изображение.

    Присвоенный каждому символу конкретный числовой код фиксируется в кодовых таблицах. Одному и тому же символу в разных кодовых таблицах могут соответствовать разные числовые коды. Необходимые перекодировки текста обычно выполняют специальные программы-конверторы, встроенные в большинство приложений.

    Как правило, для хранения кода символа используется один байт (восемь битов), поэтому коды символов могут принимать значение от 0 до 255. Такие кодировки называют однобайтными . Они позволяют использовать 256 символов (N = 2 I = 2 8 = 256). Таблица однобайтных кодов символов называется ASCII (American Standard Code for Information Interchange — Американский стандартный код для обмена информацией). Первая часть таблицы ASCII-кодов (от 0 до 127) одинакова для всех IBM-PC совместимых компьютеров и содержит:

    • коды управляющих символов;
    • коды цифр, арифметических операций, знаков препинания;
    • некоторые специальные символы;
    • коды больших и маленьких латинских букв.

    Вторая часть таблицы (коды от 128 до 255) бывает различной в различных компьютерах. Она содержит коды букв национального алфавита, коды некоторых математических символов, коды символов псевдографики. Для русских букв в настоящее время используется пять различных кодовых таблиц: КОИ-8, СР1251, СР866, Мас, ISO.

    В последнее время широкое распространение получил новый международный стандарт Unicode . В нем отводится по два байта (16 битов) для кодирования каждого символа, поэтому с его помощью можно закодировать 65536 различных символов (N = 2 16 = 65536). Коды символов могут принимать значение от 0 до 65535.

    Примеры решения задач

    Пример. С помощью кодировки Unicode закодирована следующая фраза:

    Я хочу поступить в университет!

    Оценить информационный объем этой фразы.

    Решение. В данной фразе содержится 31 символ (включая пробелы и знак препинания). Поскольку в кодировке Unicode каждому символу отводится 2 байта памяти, для всей фразы понадобится 31 ⋅ 2 = 62 байта или 31 ⋅ 2 ⋅ 8 = 496 битов.

    Ответ: 32 байта или 496 битов.