Единицы измерения количества и объема информации.

N – формула Хартли.

В компьютере наименьшей единицей информации является бит . Представление каждого бита зависит от типа носителя информации. На бумаге бит представляется единицей или нулем, во внутренней памяти этому соответствует одно из двух состояний элемента ячейки. На магнитной поверхности это точка (намагниченная или ненамагниченная), а на поверхности оптического диска этому соответствует наличие или отсутствие углубления. Любая информация кодируется определенной комбинацией, т.е. двоичных знаков.

Количество информации.

Поскольку каждый бит может принимать одно из двух значений (0 или 1), то последовательность из i – битов может принимать N=2 ͥ различных значений => для любого N – значного алфавита (т.е.состоящего из N знаков), количество бит кот. требуется для представления любого из этих знаков, вычисляется по формуле: i = log2 N. Эта величина принимается в качестве количества информации, содержащейся в сообщении, состоящем из одного знака N-значного алфавита. Мощность – количество знаков в алфавите. Из формулы Хартли следует, что количество информации, содержащейся в сообщении, состоящем из М-знаков (m-разрядное сообщение), когда каждый знак равновероятно взят из алфавита мощностью N равно i = m*log2 N.

Например:

В слове ИНФОРМАТИКА 11 знаков, т.е. m=11. Если используется 32-значный алфавит, то получаем: i=11* log2 32 = 11*5 = 55.

Объём информации.

В отличие от количества, объём информации, записанный двоичными знаками в памяти компьютера или на внешнем носителе, вычисляется по количеству требуемых для такой записи двоичных знаков. Обычно в качестве наименьшей единицы измерения объёма информации используется байт, состоящий из 8 бит => каждый байт может принимать 256 (2^8) различных значений, при этом наименьшим будет 00000000, а наибольшим 11111111. Байты объединяются в более крупные наборы в зависимости от цели использования (ввод, вывод и другие). Для измерения объёма памяти используются и более крупные единицы измерения (Кб, Мб и Гб). Переход от меньшей единицы измерения к большей осуществляется с помощью коэффициента 2^10 = 1024.

1 Кб = 1024 байта

1 Мб = 1024 Кб

1 Гб = 1024 Мб

Для измерения памяти большего объема используют Терабайт (Тб) = 1024 Гб; и Петабайт (Пб) = 1024 Тб.

Любая информация представляется в компьютере как последовательность байтов, при этом в самих байтах нет ничего, что позволяет их трактовать как числа, текстовые или другие данные. В любом случае информация кодируется в виде последовательностей нулей и единиц, т.е. положительных целых двоичных чисел. Их интерпретация (понимание) зависит от того, какая программа и какое действие с ними совершает в данный и конкретный момент. Если в программе предполагается работа с числами, то байты представляются как числа, к которым применяемы арифметические действия.


Системы счисления.

Число – это знак, обозначающий определенное количество чего-либо.

Такие знаки записываются на основании правил, которые составляют систему счисления. Числа записываются с помощью специальных, отличных друг от друга знаков, которые называют цифрами. Существуют различные системы (непозиционные и позиционные). В непозиционных системах смысл каждой цифры не зависит от её расположения в числе.

Например:

В Римской системе V-пять, L-пятьдесят, X-десять. Недостатком таких систем является сложность записи чисел и отсутствие стандартных правил.

В позиционных системах счисления смысл цифры зависит от места её расположения в числе, а запись чисел и правила выполнения арифметических действий с ними стандартизированы и формализированы. В такой системе счисления число – это краткая запись суммы.

Например:

Число это последовательность коэффициентов при степенях числа 10. Число 10 называется основанием десятичной системы счисления. Если в качестве основания задать другое число, то получим другую систему счисления.

Позиционная система счисления задается величиной основания и множеству чисел. Основания равны количеству цифр. Наименьшее ноль, каждая следующая на единицу больше предыдущей. Любое количество можно представить в виде числа в различных системах счисления и эти представления будут взаимно однозначны соответствующие друг другу, обозначая одно и то же количество.

(10.10.2012 г.)

Например, рассмотрим представление чисел в 16-ричной системе счисления. Тогда основание равно 16. Цифры: первые десять цифр (от 0 до 9) мы можем позаимствовать из 10-ричной системы счисления, остальные шесть цифр, соответствующих числовым значениям от 10 до 15 обозначим A, B, C, D, E, F. При этом A = цифра 10, B = цифра 11 и т.д. F = цифра 15. Мы вынуждены сделать такое обозначение в связи с тем, что нельзя цифры обозначать с помощью с помощью других цифр.

Арифметические действия в любой системе счисления выполняется аналогично тому, как это делается в десятеричной системе, следует лишь учитывать величину основания. Например: 15+14=31 (восьмеричная система счисления). В компьютере все данные представляются в двоичной системе счисления. Например:

Четырьмя битами можно представить 16 десятичных чисел (от 0 до 15). В качестве краткой записи при просмотре или изменении двоичных данных используется 16-ричная система счисления. Программы , обеспечивающие «непосредственную» работу человека с данными, хранящимися в памяти компьютера, при взаимодействии с человеком автоматически преобразовывают двоичное представлении данных в 16-ричное и обратно.

Любое данное, записанное в одном байте представляется двумя 16-ричными цифрами, первая из которых соответствует первой четверки битов, а вторая – второй четверки битов. В этом и состоит причина использования 16-ричной системы.

Для представления информации в памяти ЭВМ (как числовой, так и не числовой) используется двоичный способ кодирования.

Элементарная ячейка памяти ЭВМ имеет длину 8 бит (байт). Каждый байт имеет свой номер (его называют адресом ). Наибольшую последовательность бит, которую ЭВМ может обрабатывать как единое целое, называют машинным словом . Длина машинного слова зависит от разрядности процессора и может быть равной 16, 32, 64 битам и т.д.

Двоично-десятичное кодирование

В некоторых случаях при представлении чисел в памяти ЭВМ используется смешанная двоично-десятичная "система счисления", где для хранения каждого десятичного знака нужен полубайт (4 бита) и десятичные цифры от 0 до 9 представляются соответствующими двоичными числами от 0000 до 1001. Например, упакованный десятичный формат, предназначенный для хранения целых чисел с 18-ю значащими цифрами и занимающий в памяти 10 байт (старший из которых знаковый), использует именно этот вариант.

Представление целых чисел в дополнительном коде

Другой способ представления целых чисел - дополнительный код . Диапазон значений величин зависит от количества бит памяти, отведенных для их хранения. Например, величины типа Integer (все названия типов данных здесь и ниже представлены в том виде, в каком они приняты в языке программирования Turbo Pascal. В других языках такие типы данных тоже есть, но могут иметь другие названия) лежат в диапазоне от -32768 (-2 15) до 32767 (2 15 - 1) и для их хранения отводится 2 байта (16 бит); типа LongInt - в диапазоне от -2 31 до 2 31 - 1 и размещаются в 4 байтах (32 бита); типа Word - в диапазоне от 0 до 65535 (2 16 - 1) (используется 2 байта) и т.д.

Как видно из примеров, данные могут быть интерпретированы как числа со знаком , так и без знака . В случае представления величины со знаком самый левый (старший) разряд указывает на положительное число, если содержит нуль, и на отрицательное, если - единицу.

Вообще, разряды нумеруются справа налево, начиная с 0. Ниже показана нумерация бит в двухбайтовом машинном слове.

Дополнительный код положительного числа совпадает с его прямым кодом . Прямой код целого числа может быть получен следующим образом: число переводится в двоичную систему счисления, а затем его двоичную запись слева дополняют таким количеством незначащих нулей, сколько требует тип данных, к которому принадлежит число.

Например, если число 37 (10) = 100101 (2) объявлено величиной типа Integer (шестнадцатибитовое со знаком ), то его прямым кодом будет 0000000000100101, а если величиной типа LongInt (тридцатидвухбитовое со знаком ), то его прямой код будет. Для более компактной записи чаще используют шестнадцатеричное представление кода. Полученные коды можно переписать соответственно как 0025 (16) и 00000025 (16) .

Дополнительный код целого отрицательного числа может быть получен по следующему алгоритму:

  1. записать прямой код модуля числа;
  2. инвертировать его (заменить единицы нулями, нули - единицами);
  3. прибавить к инверсному коду единицу.

Например, запишем дополнительный код числа -37, интерпретируя его как величину типа LongInt (тридцатидвухбитовое со знаком):

  1. прямой код числа 37 есть;
  2. инверсный код;
  3. дополнительный код или FFFFFFDB (16) .

При получении числа по его дополнительному коду прежде всего необходимо определить его знак. Если число окажется положительным, то просто перевести его код в десятичную систему счисления. В случае отрицательного числа необходимо выполнить следующий алгоритм.

ЛЕКЦИЯ №1 «Понятие информации, общая характеристика процессов сбора, передачи, обработки и накопления информации»

Информация. Виды существования информации. Свойства информации. Представление данных в ЭВМ. Система счисления. Позиционные системы счисления. Перевод чисел из одной системы счисления в другую. Кодирование информации. Единицы измерения информации. Передача информации. Обработка информации. Хранение информации. Магнитная память. Оптическая память.

Информация

Термин "информация" происходит от латинского слова "informatio" , что означает сведения, разъяснения, изложение. Несмотря на широкое распространение этого термина, понятие информации является одним из самых дискуссионных в науке. В настоящее время наука пытается найти общие свойства и закономерности, присущие многогранному понятию информация , но пока это понятие во многом остается интуитивным и получает различные смысловые наполнения в различных отраслях человеческой деятельности.

В обиходе, например, информацией называют любые данные или сведения, которые кого-либо интересуют. "Информировать" в этом смысле означает "сообщить нечто , неизвестное раньше" .

Современное научное представление об информации очень точно сформулировал Норберт Винер, "отец" кибернетики. А именно: Информация – это обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств.

Люди обмениваются информацией в форме сообщений. Сообщение – это форма представления информации в виде речи, текстов, жестов, взглядов, изображений, цифровых данных, графиков, таблиц и т.п.

В случаях, когда говорят об автоматизированной работе с информацией посредством каких-либо технических устройств, обычно в первую очередь интересуются не содержанием сообщения, а тем, сколько символов это сообщение содержит.

Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объём сообщения.



Виды существования информации

Информация может существовать в виде:

Текстов, рисунков, чертежей, фотографий;

Световых или звуковых сигналов;

Радиоволн;

Электрических и нервных импульсов;

Магнитных записей; и т.д.

Предметы, процессы, явления материального или нематериального свойства, рассматриваемые с точки зрения их информационных свойств, называются информационными объектами.

Информацию можно:

Все эти процессы, связанные с определенными операциями над информацией, называются информационными процессами.

Свойства информации

Информация достоверна, если она отражает истинное положение дел . Недостоверная информация может привести к неправильному пониманию или принятию неправильных решений.

Достоверная информация со временем может стать недостоверной, так как она обладает свойством устаревать, то есть перестаёт отражать истинное положение дел.

Информация полна , если её достаточно для понимания и принятия решений. Как неполная, так и избыточная информация сдерживает принятие решений или может повлечь ошибки.

Точность информации определяется степенью ее близости к реальному состоянию объекта, процесса, явления и т.п.

Ценность информации зависит от того, насколько она важна для решения задачи, а также от того, насколько в дальнейшем она найдёт применение в каких-либо видах деятельности человека.

Только своевременно полученная информация может принести ожидаемую пользу. Одинаково нежелательны как преждевременная подача информации (когда она ещё не может быть усвоена), так и её задержка.

Если ценная и своевременная информация выражена непонятным образом, она может стать бесполезной.

Информация становится понятной , если она выражена языком, на котором говорят те, кому предназначена эта информация.

Информация должна преподноситься в доступной (по уровню восприятия) форме. Поэтому одни и те же вопросы по разному излагаются в школьных учебниках и научных изданиях.

Информацию по одному и тому же вопросу можно изложить кратко (сжато, без несущественных деталей) или пространно (подробно, многословно). Краткость информации необходима в справочниках, энциклопедиях, учебниках, всевозможных инструкциях.

Представление данных в ЭВМ

Вся информация в ЭВМ хранится в виде наборов бит, то есть комбинаций 0 и 1. Числа представляются двоичными комбинациями в соответствии с числовыми форматами, принятыми для работы в данной ЭВМ, а символьный код устанавливает соответствие букв и других символов двоичным комбинациям.

Для чисел имеется три числовых формата:

Двоичный с фиксированной точкой;

Двоичный с плавающей запятой;

Двоично-кодированный десятичный (BCD).

Числа с плавающей запятой обрабатываются на специальном сопроцессоре (FPU - floating point unit), который, начиная с МП I486, входит в состав БИС микропроцессора. Данные в нем хранятся в 80-разрядных регистрах.

Система счисления.

Способ представления изображения произвольных чисел с помощью некоторого конечного множества символов назовем системой счисления.

В повседневной практике мы пользуемся, как правило, десятичной системой счисления.

Системы счисления принято подразделять на…

1. Позиционные.

2. Непозиционные.

3. Символические.

Символические . В этих системах каждому числу ставится в соответствие свой символ. Эти системы не находят широкого применения в силу естественной их ограниченности (алхимия, кодированные сообщения) - бесчисленного множества символов, которое требуется для изображения всех возможных чисел. Поэтому эти системы из рассмотрения опустим.

Форматы представления данных в памяти ЭВМ. Машинные коды.

План.

1. Форматы представления данных в памяти ЭВМ.

a. Представление чисел в форме с фиксированной точкой

b. Представление чисел в форме с плавающей точкой

2. Машинные коды: прямой, обратный, дополнительный.

Форматы представления данных в памяти ЭВМ.

Для представления чисел (данных) в памяти ЭВМ выделяется оп­ределенное количество битов. В отличие от нумерации разрядов числа биты в байте нумеруются слева направо, начиная с 0. Каждый байт в памяти ЭВМ имеет свой порядковый номер, который называется абсолютным адресам байта . Байт является основной единицей хранения данных, это наименьшая адресуемая единица обмена информации в оперативной па­мяти ЭВМ, то есть минимальная единица обмена информации, имеющая адрес в памяти ЭВМ.

Последовательность нескольких смежных байтов образует поле данных . Количество байтов поля называется длиной поля , а адрес само­го левого байта поля - адресом поля . Обработка информации может вестись либо побайтно, либо полями данных (или форматом данных). Форматы данных показывают, как информация размещается в оперативной памяти и регистрах ЭВМ. Форматы данных различают по длине, типу данных и структуре, а каждое значение, содержащееся в байте может быть интерпретировано по разному:

– кодированное представление символа внешнего алфавита (при вводе и выводе данных);

– целым знаковым или беззнаковым числом (при внутреннем представлении чисел в памяти ЭВМ);

– частью команды или более сложной единицы данных и т.д.

В ЭВМ существуют следующие формы представления целых чисел: полуслово (байт), слово (два последовательных байта, пронумерованных слева направо от 0 до 15), двойное слово (4 байта).

Если в указанных форматах размещаются числа, то веса их разрядов возрастают справа налево.

В ЭВМ для представления чисел используется естественная (представление числа с фиксированной точкой) и полулогарифмическая (представление числа с плавающей точкой) формы.

Представление чисел в форме с фиксированной точкой.

В используемых представлениях чисел “запятая” или “десятичная точка” - это условный символ, предназначенный для разделения целой и дробной частей числа. Запятая имеет, следовательно, точный математический смысл, независимо от используемой системы счисления, и ее положение нисколько не меняет алгоритм вычислений или форму результата.

Если обрабатываемые числа имеют величину одного порядка, можно фиксировать позицию запятой или точки (такое представление называется представлением с фиксированной точкой). Тогда при обработке чисел в машине нет необходимости учитывать положение (представлять) десятичной точки. И тогда ее положение на уровне программы считается одинаковым и учитывается только в результате.

Существует в основном 2 способа фиксирования десятичной точки:

1) точка располагается справа от младшей цифры числа, и мы имеем целые числа;

2) точка располагается слева от старшей цифры числа, и мы имеем дробные числа по абсолютному значению меньше единицы.

Целые положительные числа можно представлять непосредственно в двоичной системе счисления (двоичном коде). В такой форме представления легко реализуется на компьютере двоичная арифметика.

Если же нужны и отрицательные числа, то знак числа может быть закодирован отдельным битом (обычно это старший бит). Старший разряд является знаковым, если он содержит 1 , то число отрицательное , если 0 , то число положительное .

При шестнадцатиразрядной сетке мы имеем:

В общем случае диапазон представления целых чисел равен (n – число разрядов в формате):

– для беззнаковых 0 ≤ x ≤ 2 n -1 (при n=8 от 0 до 255)

– для знаковых -2 n -1 ≤ x ≤ +2 n -1 -1 (при n=8 от -128 до 127);

Существенным недостатком такого способа представления является ограниченный диапазон представления величин, что приводит к переполнению разрядной сетки при выходе за допустимые границы и искажению результата, например, если рассмотреть пяти разрядную знаковую сетку, то при сложении двух чисел +22 и +13 получим:

Представление чисел в форме с плавающей точкой.

Действительные числа в математике представляются конечными или бесконечными дробями. Однако в компьютере числа хранятся в регистрах и ячейках памяти, которые являются последовательностью байтов с ограниченным количеством разрядов. Следовательно, бесконечные или очень длинные числа усекаются до некоторой длины и в компьютерном представлении выступают как приближенные.

Для представления действительных чисел, как очень маленьких, так и очень больших, удобно использовать форму записи чисел в виде произведения:

А = ± М·n ± p

где n - основание системы счисления;

M – мантисса;

р – целое число, называемое порядком (определяет местоположение десятичной точки в числе).

Такой способ записи чисел называется представлением числа с плавающей точкой .

Пример: -245,62=-0,24565·10 3 , 0,00123=0,123·10 -2 =1,23·10 -3 =12,3·10 -4

Очевидно, такое представление не однозначно.

Если мантисса заключена между n -1 и 1 (т.е. 1/n £ |M| <1), то представление числа становится однозначным, а такая форма назы­вается нормализованной .

Пример : для десятичной системы счисления - 0,1 < |m| < 1 (мантисса - число меньше 1, и первая цифра после запятой отлична от нуля, т.е. значащая).

Действительные числа в компьютерах различных типов записываются по-разному, тем не менее, существует несколько международных стандартных форматов, различающихся по точности, но имею­щих одинаковую структуру. Для основанного на стандарте IEEE – 754 (определяет представление чисел с одинарной точностью (float ) и с двойной точностью (double )) представление вещественного числа в ЭВМ используется m+p+1 бит, распределяемые следующим образом: один разряд (S)- используется для знака мантиссы, p – разрядов определяют порядок, m разрядов определяют абсолютную величину мантиссы. Для записи числа в формате с плавающей запятой одинарной точности требуется тридцатидвухбитовое слово. Для записи чисел с двойной точностью требуется шестидесятичетырёхбитовое слово.

1 p-1 0 m-1 0
S Порядок Дробная часть М

Так как порядок может быть положительным или отрицатель­ным, нужно решить проблему его знака. Величина порядка представляется с избытком, т.е., вместо истинного значения порядка хранится число, называемое характеристикой (или смещенным порядком ).

Смещение требуется, чтобы не вводить в число еще один знак. Смещённый порядок всегда положительное число. Для одинарной точности смещение принято равным 127, а для двойной точности – 1023 (2 p -1 -1) . В десятичной мантиссе после запятой могут присутствовать цифры 1:9, а в двоичной - только 1. Поэтому для хранения единицы после двоичной запятой не выделяется отдельный бит в числе с плавающей запятой. Единица подразумевается, как и двоичная запятая . Кроме того, в формате чисел с плавающей запятой принято, что мантисса всегда больше 1. То есть диапазон значений мантиссы лежит в диапазоне от 1 до 2.

Примеры :

1) Определить число с плавающей запятой, лежащее в четырёх соседних байтах:

11000001 01001000 00000000 00000000

Разделим двоичное представление на знак (1 бит), порядок (8 бит) и мантиссу (23 бита):

1 10000010 10010000000000000000000

– Знаковый бит, равный 1 показывает, что число отрицательное.

– Экспонента 10000010 в десятичном виде соответствует числу 130. Скорректируем порядок: вычтем число 127 из 130, получим число 3.

– К мантиссе добавим слева скрытую единицу 1 ,100 1000 0000 0000 0000 0000, перенесем порядок от скрытой единицы вправо на полученную величину порядка: 1 100, 1000 0000 0000 0000 0000.

– И, наконец, определим десятичное число: 1100,1 2 = 12,5 10

– Окончательно имеем -12,5

2) Определить число с плавающей запятой, лежащее в четырёх соседних байтах:

01000011 00110100 00000000 00000000

– Знаковый бит, равный 0 показывает, что число положительное.

– Экспонента 10000110 в десятичном виде соответствует числу 134. Вычтя число 127 из 134, получим число 7.

– Теперь запишем мантиссу: 1 ,011 0100 0000 0000 0000 0000

– И, наконец, определим десятичное число: 10110100 2 =180 10

Поскольку под мантиссу и порядок отводится определенное число разрядов, соответственно m и p , то можно оценить диапазон чисел, которые можно представить в нормализованном виде в системе счисления с основанием n .

Если m=23 и p=8 (4 байта), то диапазон представленных чисел от 1,5·10 -45 до 3,4·10 +38 (обеспечивает точность с 7-8 значащими цифрами).

Если m=52 и p=11 (8 байт), то диапазон представленных чисел от 5,0·10 -324 до 1,7·10 +308 (обеспечивает точность с 15-16 значащими цифрами).

Чем больше разрядов отводится под запись мантиссы, тем выше точность представления числа. Чем больше разрядов занимает поря­док, тем шире диапазон от наименьшего отличного от нуля числа до наибольшего числа, представимого в компьютере при заданном формате.

При выполнении операций с плавающей точкой возникает меньше проблем с переполнением разрядной сетки, чем для операций с фиксированной точкой. Однако операции с плавающей точкой более сложные, так как они требуют нормализации и денормализации мантисс.

Любая информация представляется в компьютере как последовательность байтов . В самих байтах нет информации о том, как их надо трактовать (числа/текстовые знаки/графическое изображение). В любом случае информация кодируется в виде последовательности 0 и 1, т.е. положительных целых двоичных чисел (число записывается с помощью двух цифр – 0/1). Их интерпретация зависит от того, какая программа и какое действие с ними совершает в данный конкретный момент. Если в программе присутствует последовательность команд, ориентированных на работу с числами, то байты рассматриваются, как числа. Если в программе предполагается действие с текстовыми данными, то байты интерпретируются, как условные числовые коды, обозначающие знаки текста.

I.Системы счисления

Любое число представляет собой кратную запись суммы (например, 168 = 100 + 60 + 8 = 1 10 2 + 6 10 1 + 8 10 0), т.е. число – последовательность коэффициентов при степенях числа 10 => если имеем число d = a 1 a 2 …a n (a 1 a 2 …a n – цифры), то d = a 1 10 n-1 + a 2 10 n-2 +…a n 10 0 .

Кратко подобные суммы записываются следующим образом: n

d = ∑ a i 10 n-i

Число 10 – основание десятичной системы счисления, если в качестве основания взять другое число, то получим другую систему записи чисел, т.е. другую систему счисления .

Система счисления задается величиной основания и множеством цифр. Цифры – специальные знаки, используемые для записи чисел. Их количество обязательно должно быть равно величине основания.

Любое число можно представить в различных системах счисления, эти представления будут строго (взаимно однозначно) соответствовать друг другу.

К примеру, определим 16-ричную систему счисления: основание = 16 =>должно быть 16 цифр (0-15) = 1,2,3,4,5,6,7,8,9,A,B,C,D,E,F. Здесь A-F – цифры 10,11,12,13,14,15. Такие обозначения используют в связи с тем, что цифры нельзя записывать с помощью других цифр, иначе возникнет путаница в чтении чисел. Запишем, как будет выглядеть в этой системе счисления десятичное число 168, имея в виду общий закон записи числа, а также то, что здесь основанием является 16, имеем: 168 (10) = А 16 1 + 8 16 0 => А8 (16).

Арифметические действия в любой системе счисления выполняются аналогично тому, как это делается в 10-ричной системе счисления. Следует лишь величину основания.

К примеру, в 8-ричной системе счисления + 15 = 1 8 1 + 5 8 0 => + 13

14 = 1 8 1 + 4 8 0 => = 12

В компьютере все данные представляются в двоичной системе счисления. Например, число 5 в двоичной форме запишется как 101. Аналогично двоичное число 1111 соответствует десятичному числу 15: 1111 (2) = 1 2 3 + 1 2 2 + 1 2 1 + 1 2 0


Т.е. четырьмя битами можно представить не более 16 десятичных чисел (0-15).

В качестве краткой записи при просмотре или исправлении двоичных данных, находящихся в памяти ЭВМ, используется 16-ричная система счисления. Программы, обеспечивающие «непосредственную» работу человека с памятью ЭВМ, при взаимодействии с ним автоматически преобразовывают двоичное представление данных в 16-ричное и обратно. Любое данное, записанное в 1 байте, представляется всего двумя 16-ричными цифрами, первая из которых соответствует первое четверке битов, а вторая цифра – второй четверке битов.

Такая форма представления двоичных чисел (данных), находящаяся в памяти ЭВМ, - компромисс между человеком и его понятиями об удобстве и компьютером, где вся информация представляется только в двоичной форме.

II.Типы данных и их представления

Одним байтом (8 бит) можно представить 256 положительных целых чисел (0-255). Такой тип данных называется однобайтовым целым без знака.

Числа, превышающие 255, требуют более одного байта для своего представления. Для работы с ними используются типы:

- двухбайтовые целые без знака – обеспечивают представление целых положительных чисел (0-65535)

- четырехбайтовые целые без знака - обеспечивают представление целых положительных чисел (0-≈4,2 млрд.)

Вышеперечисленные типы предполагают, что число должно быть только положительным => называются «без знака». Они отличаются объемом памяти, который отводится для хранения числа. Такие типы используются для числового кодирования знаков текста, цвета, интенсивности графических точек, нумерации элементов и т.д.

Для работы с целыми числами, которые могут быть не только положительными, но и отрицательными, используют типы:

- однобайтовые целые со знаком

- двухбайтовые целые со знаком

- четырехбайтовые целые со знаком

Они отличаются объемом памяти, который отводится для хранения каждого числа.

В основе представление как положительных, так и отрицательных чисел лежит следующий принцип: общее количество числовых кодов, возможных для данного количества байтов (например, для однобайтового – 256), делится пополам, одна половина используется для представления положительных чисел и нуля, другая – отрицательных чисел. Отрицательные числа представляются, как дополнение до общего количества числовых кодов. Например, для однобайтового число (-1) = 255, (-2) – 254 и т.д. до 128, которое обозначает число (-128) => однобайтовое целое со знаком позволяет работать с целыми числами от (-128) до 127, двухбайтовое – от (- 32768) до 32767, четырехбайтовое – от (≈-2,1 млрд.) до 2,1 млрд. (2147483648).

Числа со знаками используются для представления числовых данных, с которыми производятся арифметические действия.

При взаимодействии с программами используются следующие типы данных :

- целый коротк ий (SHORT)

- целый обычный (INTEGER)

- целый длинный (LONG INTEGER)

- вещественный с одинарной точностью (FLOAT/REAL)

- вещественный с двойной точностью (DOUBLEFLOAT/REAL)

- символьный (строковый, текстовый) (CHAR)

- логический (LOGIKAL)

Целый короткий, целый обычный и целый длинный – типы соответственно однобайтовое целое со знаком, двухбайтовое целое со знаком, четырехбайтовое целое со знаком.

В информатике при записи чисел в качестве знака, разделяющего дробную и целую часть, используется не запятая, а точка (например, 68.314). Эта точка фиксирует позицию, после которой указана дробная часть. Изменение местоположения точки приводит к изменению числа => такой вид записи (формат записи) вещественных чисел называется форматом с фиксированной точкой .

Вещественное число с плавающей точкой состоит из 2 частей:

- мантисса

- порядок

Они разделены специальным знаком (E,D). Мантисса представляет собой вещественное число с фиксированной точкой, порядок задается целым числом, указывающим в какую степень надо возвести число 10, чтобы при умножении на мантиссу получить число, которое имеется в виду. Например, 68.314 в таком формате можно записать как 6.8314Е+1 = 0.68314Е+2 = 683.14Е-1, что означает 6.8314 10 1 = 0.68314 10 2 = 68.314 10 -1 .

При таком виде записи местоположение точки не фиксировано, ее положение в мантиссе определяется величиной порядка. Мантисса и порядок могут иметь знак. Если мантисса по модулю <1, причем первая цифра не равна 0, то такой вид записи вещественного числа с плавающей точкой называется нормализованным (0.68314Е+2).

В компьютере вещественное число представляется в формате с плавающей точкой в нормализованном виде. Мантисса и порядок располагаются в соседних байтах, разделитель (E,D) отсутствует.

Обычно различают число с одинарной и двойной точностью . В первом случае при вводе или выводе числа в качестве разделителя мантиссы и порядка указывается E . В памяти ЭВМ такое число занимает обычно 4 байта. Во втором случае в качестве разделителя – D , в памяти ЭВМ число с двойной точностью занимает обычно 8 байтов. Этот тип обеспечивает значительно большую точность вычисления, чем одинарная точность.

Символьные данные составлены из отдельных текстовых знаков. Каждый знак представляется в памяти ЭВМ определенным числовым кодом. Для числового кодирования текстовых знаков используются специальные таблицы кодирования (однобайтовые, двухбайтовые и др.). Имеется в виду тип целого без знака, который использован для числового кодирования. Разные программы могут основываться на разных таблицах => тестовый документ, созданный с помощью одной программы, не обязательно может быть прочитан с помощью другой.

Величины логического типа принимают только два значения:

- TRUE (истина)

- FALSE (ложь)

К ним можно применять логические операции, основными из которых являются and (и), or (или), not (отрицание). And, or –к двум логическим величинам (a>c and a = b). Not – к одной логической величине (not a = b). Результатом выражения с логическими данными (логического выражения) является логическая величина. Результат операции and = TRUE только в одном случае, если обе величины = TRUE. Результат операции or = FALSE только в одном случае, если обе величины = FALSE. Операция not изменяет значение логической величины.

В смешанных выражениях приоритет у арифметических операций, затем – у сравнения, в последнюю очередь – у логических операций. Среди них наибольший приоритет у операции not, затем – and, после – or.

Файлы и их хранение

Любой информационный объект (отдельный документ, отдельная программа), хранящийся на диске и имеющий название является файлом . Информация о файлах (их название, размер, дата и время создания, место размещения на диске и т.д.) хранится в каталогах. Каталог – таблица, в каждой строке которой содержится информация о каком-либо файле или другом каталоге. Каталог = файл (кроме корневого) специального вида. При записи файлов на диск сведения о них автоматически записываются в те каталоги, которые указал пользователь. Условно для краткости речи говорят: «копировать файл из каталога в каталог», «создать каталог в каталоге», «удалить файл в каталоге» и т.п. Однако это на самом деле не происходит, поскольку в каталогах нет ни каталогов, ни файлов, там лишь сведения о них.

При формировании каждого диска на нем автоматически создается каталог, который называется корневым. Он занимает определенное место фиксируемого размера на диске. Его название состоит из 2 знаков : имя диска и двоеточие.

В корневом каталоге можно создать другие каталоги, которые называются подкаталогами или каталогами первого уровня иерархии. В свою очередь каталоги первого уровня иерархии могут создать каталоги второго уровня и т.д. Таким образом формируется иерархическая (древовидная) файловая структура данных на диске. Созданные пользователем каталоги – файлы. Каждый файл или каталог имеет название, состоящее из двух частей, разделенных точкой. Левая часть – имя , правая – расширение . Расширение вместе с точкой можно не указывать. В имени допустимо указывать не более 8 знаков (короткое имя) или не более 256 знаков (длинное имя). В расширении – не более 3 знаков. Стандартным считается использование в названии только латинских букв, цифр и знака подчеркивания. Рекомендуется для работы со списками файлы именовать с указанием расширения, а каталоги – без расширения.

Если требуется использовать какой-либо файл, необходимо указать в каком каталоге этот файл находится. Это делается с помощью указания пути (маршрута) к файлу по дереву каталога.

Маршрут (путь) – это список каталогов по мере их вложенности (от внешнего к внутреннему), разделенных знаком обратной черты (\ - обратный слеш). При указании файлов перед его названием указывается маршрут, а затем через \ - название файла (например, C:\Windows\win.com - означает, что файл win.com находится в каталоге Windows, который находится в корневом каталоге диска C). Такая запись называется полной спецификацией файла . Краткая включает в себя только название файла. Создаваемые пользователем каталоги и файлы размещаются при записи на своем месте памяти диска. Файлы могут быть записаны частями в разных местах диска. В процессе записи файл автоматически разбивается на такие части, и каждая из них записывается на то место, которое свободно в данный момент. Эти части называются кластерами . Размер кластера зависит от объема дисковой памяти, он обычно занимает несколько секторов. В связи с таким принципом записи вся область диска как бы делится на такие кластеры, и они используются для записи файлов. Считывание файлов также производится частями размером в один кластер: файл собирается из отдельных частей, записанных в разных местах диска. Такой способ хранения файлов осуществляется с помощью так называемой таблицы размещения файлов FAT. Она создается на каждом диске автоматически при его формировании и используется для запоминания мест хранения частей файла. Клетки FAT пронумерованы, начиная с «0», и соответствуют частям памяти диска размером в 1 кластер. В каждой клетке может содержаться 0 (указывает, что соответствующий кластер свободен), номер следующего кластера данного файла или специальный числовой код, обозначающий окончание цепочки кластеров для данного файла. Для представления чисел, находящихся в FAT, используются типы данных целое без знака. В зависимости от количества битов, используемых для представления каждого числа, различают 16 битовый FAT (16 разрядный), 32 битовый FAT (32 разрядный). В качестве специального кода, означающего окончание цепочки кластера, используется максимальное число, которое может быть представлено в клетке FAT. Для 16 разрядного таким числом является 65535 (в шестнадцатиричной форме – FFFFF). Программы, обеспечивающие просмотр и корректировку FAT, показывают этот код на экране в текстовой форме (E OF). В каталоге содержится информация о файле и в частности порядковый номер кластера, с которого начинается файл. Эта информация вместе с информацией, содержащейся в FAT (ссылки на следующие кластеры), используется для поиска и считывания файлов.

Компьютерные сети

I.Основные особенности

Компьютерная сеть – совокупность взаимосвязанных через каналы передачи информации компьютеров, обеспечивающих пользователей средствами обмена информации и коллективного использования ресурсов (аппаратных, программных, информационных).

Виды сетей:

- локальные – главная отличительная особенность заключается в том, что, как правило, все объединенные ею компьютеры связаны единым каналом связи. Расстояние между компьютерами – до 10 км (при использовании проводной связи), до 20 км (радиоканалы связи). Локальные сети связывают ЭВМ одного или нескольких близлежащих зданий одного учреждения.

- глобальные – для них свойственно разнообразие каналов связи и использование спутниковых каналов, позволяющих соединять узлы связи и ЭВМ, находящиеся на расстоянии 10-15 тыс. км друг от друга. Обычно имеют узловую структуру, состоят из подсетей, каждая из которых включает в себя коммуникационные узлы и каналы связи. Коммуникационные узлы обеспечивают эффективность функционирования сети, к ним подключаются компьютеры, локальные сети, большие ЭВМ и т.д.

- интрасети – объединяют пользователей, работающих в одной организации. Часть используют возможности имеющихся локальных и глобальных сетей. Такая сеть может связывать компьютеры, находящиеся как в одном здании, так и в разных местах мира.

В сети имеются общедоступные компьютеры, которые предоставляют информацию или вычислительные услуги пользователям. Сервером может называться компьютер, используемый для этой цели или место (в глобальных сетях), куда можно отправить запрос на выполнение какой-либо услуги. Таким местом может быть компьютер-сервер, локальная сеть, большая ЭВМ и т.п.

Компьютеры пользователей могут работать в сетях в двух режимах :

Режим рабочей станции – компьютер используется не только для отправки запроса к серверу и получения от него информации, но и для обработки этой информации

Режим терминала – последнее не производится: обработка информации осуществляется на сервере, а пользователю отправляется лишь результат этой обработки.

Компьютер-сервер по своим возможностям значительно превосходит рабочие станции и комплектуется множеством сетевых плат (адаптеров ), обеспечивающих подключение к сетям. Комплекс программ, которые обеспечивают работу в сети, - сетевое программное обеспечение. Оно определяет тот вид услуг, выполнение которых возможно в данной сети. В настоящее время распространены 2 основные концепции построения такого программного обеспечения:

- «концепция файлового сервера» – основана на том, что сетевое программное обеспечение должно предоставлять многим пользователем информационные ресурсы в виде файлов => сервер в такой сети называется файловым , а сетевое программное обеспечение – сетевой оперативной системой . Ее основная часть размещается на файловом сервере, а на рабочих станциях устанавливается ее небольшая часть, называемая оболочкой . Оболочка выполняет роль интерфейса между программами, обращающимися за ресурсом, и файловым сервером. Такой сервер представляет собой хранилище файлов, использующихся всеми пользователями. При этом как программы, так и файлы данных, находящиеся на файловом сервере, автоматически перемещаются на рабочую станцию, где и происходит обработка этих данных.

- «архитектура клиент-сервер» - в этом случае сетевое программное обеспечение состоит из программных систем 2 классов :

- программы-серверы – так называют программные системы, обеспечивающие работу сервера

- программы-клиенты – программные системы, обеспечивающие пользователей-клиентов

Работа систем этих классов организуется следующим образом: программы-клиенты посылают запросы программе-серверу, основная обработка данных производится на компьютере-сервере, а на компьютер пользователя посылается лишь результаты выполнения запроса.

В локальных сетях обычно используется концепция первого типа с одним файловым сервером. В глобальных основной является «архитектура клиент-сервер».

Представление информации и передача ее по сети производится в соответствии со стандартными соглашениями. Набор таких стандартных соглашений называется протоколом .

II.Типология локальной сети

Типология сети – логическая схема соединения каналами связи компьютеров (компьютеров).

Чаще всего в локальных сетях используются 3 основных типологии :

- моноканальная

- кольцевая

- звездообразная

Использование канала передачи информации, соединяющего узлы сети на физическом уровне, определяется протоколом, который называется методом доступа . Эти методы доступа реализуются соответствующими сетевыми платами (адаптерами). Такие адаптеры устанавливаются в каждом компьютере сети и обеспечивают передачу и прием информации по каналам связи.

Моноканальная типология – используется незамкнутый канал связи, к которому подключаются все компьютеры. Он называется моноканал-шиной (общей шиной).


Терминатор

Терминал служит для подключения к открытым кабелям сети, предназначен для поглощения передаваемого сигнала. В такой типологии, как правило, используется метод доступа с предварительным прослушиванием канала для определения свободен ли он.

Ethernet (скорость – 10 Мбит/сек) – название метода доступа. Может быть использован метод доступа Fast Ethernet (скорость – 100Мбит/сек)

Устойчивость к неисправностям отдельных узлов

Основные недостатки типологии:

Обрыв кабеля приводит к неработоспособности всей сети

Существенное уменьшение пропускной способности сети при значительных объемах трафика (- информация, передаваемая по сети)

Кольцевая типология


Использует в качестве канала связи замкнутое кольцо, состоящее из сегментов. Сегменты соединяются специальными устройствамирепитерами (повторителями). Репитер предназначен для соединения сегментов сети.

Основным методом доступа здесь является Token Ring – метод доступа с передачей маркера.

Имеется центральный узел коммуникации, объединяющий все компьютеры сети. Активный центр полностью управляет компьютерами сети. Метод доступа обычно также основан на использовании маркера (например, Arcnet со скоростью передачи информации 2 Мбита/сек). Кроме этого могут быть реализованы методы доступа Ethernet и Fast Ethernet.

Основные достоинства типологии:

Удобство с точки зрения управления взаимодействием компьютеров

Простота изменения и наращивания сети

Основные недостатки сети:

При отказе активного центра выходит из строя вся сеть

III.Структура глобальной сети

Между сетями возможен обмен информацией, для обеспечения такой связи используются средства межсетевого взаимодействия, называемые мостами , маршрутизаторами и шлюзами . Это специальный компьютер, в котором установлено два и более сетевых адаптеров, каждый из которых обеспечивает связь с одной сетью. Мост используется для связи сетей с однотипными внутрисетевыми каналами связи. Маршрутизатор связывает сети одного и того же вида, но различными внутрисетевыми каналами связи. Шлюзы используются для обеспечения связи сетей разного вида, для связи сетей с различными компьютерными системами (например, локальная сеть – большая ЭВМ, локальная сеть – глобальная сеть, конкретный персональный компьютер – глобальная сеть).

Глобальная сеть включает в себя подсети связи, к которым подключены локальные сети, рабочие станции и терминалы пользователей, а также компьютеры-серверы. Подсеть связи состоит из каналов передачи информации и коммуникационных узлов. Коммуникационные узлы предназначены для быстрой передачи информации по сети, выбора оптимального маршрута передачи информации и т.п., т.е. обеспечивают эффективность функционирования сети в целом. Такой узел – это либо специальное аппаратное устройство, либо специализированный компьютер с соответственным программным обеспечением.

Серверы и пользователи подключаются к глобальным сетям чаще всего через поставщиков услуг доступа к сети – провайдеров .

IV.Основные особенности глобальной сети Internet

Каждый пользователь и сервер обязательно имеют уникальный адрес. Сообщение, передаваемое по сети, снабжается адресами получателя и отправителя и в процессе передачи автоматически разбивается сетевым адаптером на части фиксированной длины, называемые пакетами . При этом каждый пакет (также автоматически) снабжается адресами отправителя и получателя. На принимающем компьютере пакеты собираются в единое сообщение.

Каждый сервер или пользовательский компьютер в сети имеют адреса 3 уровней :

- локальный адрес – адрес сетевого адаптера. Такие адреса назначаются производителями оборудования и являются уникальными, т.к. их назначение централизовано. Этот адрес используется только в пределах локальной сети.

- IP-адрес – представляет собой четырехбайтовую последовательность (4 однобайтовых целых без знака чисел) и состоит из 2 частей:

Первые 2 байта характеризуют сеть

Вторые 2 байта – конкретный узел

Такой адрес назначается администратором сети независимо от локального адреса. Если сеть должна работать как составная часть Internet, то номер сети (первые 2 байта) назначаются по рекомендации специальной организации ICANN. В противном случае, номер сети выбирается администратором произвольно. Номер узла (вторые 2 байта) назначаются администратором сети (например, 192.100.2.15). Узел может входить в несколько сетей. В этом случае он должен иметь несколько IP-адресов => IP-адрес характеризует не отдельный компьютер, а одно сетевое соединение. Сообщение, передаваемое по сети, снабжается IP-адресами получателя и отправителя.

- доменный адрес (доменное имя) – пользователю неудобно использовать IP-адреса в текущей работе => в Internet существует т.н. доменная система имен (DNS). В этой системе даются удобные для пользователя текстовые имена (идентификаторы), называемые доменными, за ними скрываются соответствующие IP-адреса. Пользователь работает с доменными именами, а соответствующее программное обеспечение с помощью специальных DNS-серверов автоматически преобразует их в адреса, которыми и снабжает передаваемые пакеты. Полное доменное имя (DNS-адрес) представляет собой последовательность имен, разделенных точкой. Первое слева – имя конкретного компьютера, затем – доменное имя организации, региона и т.д., последнее справа – имя т.н. корневого домена . Имена корневых доменов указывают на государство (например, ru – Россия, us – США, kz – Казахстан и т.д.) или на принадлежность к организации определенного типа (com - коммерческий, edu - образовательный, gov - правительственный, mil - военный, net - сетевой, org - организация). Позднее были определены и другие подобные корневые домены (arts – искусство, культура, firm – бизнес, info – информация, nom – индивидуальный).

Имена компьютеров, имеющих доступ в Internet через узел (например, сервер локальной сети), отделяются от последующей части в полном имени не точкой, а знаком @ («эт»). Например, [email protected].

V.Виды услуг в Internet

Предоставление услуг в Internet построено на основе модели «клиент-сервер». Для подключение компьютера к Internet достаточно иметь телефонную линию, провайдера, имеющего шлюз в Internet и модем (мо дулятор-дем одулятор) – специальный адаптер для подключения к глобальной сети через телефонную связь. Компьютер провайдера, используемый пользователями для работы в Internet, называется хостом . К наиболее известным услугам, предоставляемым серверами сети Internet , относятся:

- электронная почта (e-mail) – представляет собой процесс передачи сообщений между компьютерами

- передача файлов (FTP-система) – предназначена для пересылки файлов со специальных FTP-серверов любому пользователю, для получения файла следует указать полное имя сервера и полную спецификацию файла

- просмотр ресурсов (GOPHER-система) – обеспечивает поиск файлов на GOPHER-серверах по содержанию (тема, ключевое слово, фраза т.п.)

- телеконференции – предназначены для проведения дискуссий и обмена новостями, позволяют читать и посылать сообщения в открытые по разным темам информационные группы. Самой крупной является система телеконференций UseNet (пользователь может «подписаться» на любую из имеющихся тем, просматривать новости, посылать сообщения). Другой крупной системой телеконференций является IRC (Internet Relay Chat) (позволяет общаться участникам групп в реальном режиме времени (интерактивный режим), в этом случае пользователь видит на экране постоянно поступающую информацию и одновременно с этим может помещать свои сообщения, которые тут же поступают на экраны всех остальных участников группы)

- всемирная паутина www (world wide web) – представляет собой попытку объединить в одном информационном инструменте возможности указанных выше средств, добавив к ним передачу графических изображений, звуков, видео. В основе лежит принцип гипертекста (- система информационных объектов с перекрестными ссылками, в документах содержатся ссылки на другие документы, связанные по смыслу). Ранее применялся только для текстовых документов, в настоящее время гипертекстовый документ называется гипермедиа-документом . Объекты, на которые созданы ссылки, могут находиться на удаленных компьютерах. Гипермедиа-документы создаются с помощью специального языка HTML (язык разметки гипертекста) и хранятся на специальных серверах (www-сервер, web-сервер). Часто такие документы называют Web-страницами или Web-сайтами. Соответствующие программы-клиенты называются браузерами (от англ. browser) – поисковая система. Большинство современных браузеров обеспечивают доступ не только к страницам web-серверов, но и к другим видам услуг. При этом, обращаясь к различным ресурсам, используется т.н. URL-адреса (унифицированный указатель ресурсов). Он имеет следующий формат: код ресурса://спецификация запроса. Код ресурса определяет вид услуги, с которой необходимо работать: http – работа с web-серверами, для просмотра web-сайтов, ftp – ftp-система, gopher – gopher-система, news – связь с use-net, mailto – электронная почта и т.д.