Спомнете си, че от гледна точка на субективния подход към дефиницията на информацията, информацията е съдържанието на съобщенията, които човек получава от различни източници. Едно и също съобщение може да носи много информация за един човек и да не носи никаква за друг човек. При този подход е трудно да се определи недвусмислено количеството информация.

Азбучният подход дава възможност да се измери обемът на информацията на съобщение, представено на определен език (естествен или формален), независимо от неговото съдържание.

За количественото изразяване на всяка стойност е необходима преди всичко мерна единица. Измерването се извършва чрез сравняване на измерената стойност с мерната единица. Колкото пъти мерната единица се "побира" в измерената стойност, такъв е резултатът от измерването.

При азбучния подход се счита, че всеки символ на дадено съобщение има определена информационна тежест – носи фиксирана сумаинформация. Всички знаци от една и съща азбука имат еднакво тегло в зависимост от кардиналността на азбуката. Информационното тегло на символ от двоичната азбука се приема като минимална единица за измерване на информация и се нарича 1 бит. Моля, имайте предвид, че името на информационната единица "бит" (bit) идва от английската фраза "binary digit" - "двоична цифра".

1.4.2. Информационно тегло на произволен азбучен знак

По-рано разбрахме, че азбуката на всеки естествен или формален език може да бъде заменена с двоична азбука. В този случай мощността на оригиналната азбука N е свързана с капацитета двоичен код i, необходими за кодиране на всички знаци от изходната азбука, чрез релацията: N = 2 i .

Задача 1. Азбуката на племето Пулти съдържа 8 знака. Каква е информационната тежест на знак в тази азбука?

Решение. Нека направим кратък запис на условието на проблема.

Известна е връзка, която свързва стойностите на i и N: N = 2 i.

При начални данни: 8 = 2 i . Следователно: i = 3.

Пълен запис на решението в бележник може да изглежда така:

Отговор: 3 бита

1.4.3. Информационен обем на съобщението

Информационният обем на едно съобщение (количеството информация в едно съобщение), представено от символите на естествен или формален език, е сумата от информационните тегла на съставните му символи.

Задача 2. Съобщение, написано с 32-символна азбука, съдържа 140 знака. Колко информация носи?

Решение.

Отговор": 700 бита.

Задача 3. Информационно съобщение от 720 бита се състои от 180 знака. Каква е силата на азбуката, с която е написано това послание?

Решение.

Отговор: 16 знака.

1.4.4. Информационни единици

В наши дни подготовката на текстове се извършва предимно с помощта на компютри. Можем да говорим за „компютърна азбука“, която включва следните знаци: малки и големи руски и латински букви, цифри, препинателни знаци, знаци аритметични операции, скоби и т.н. Тази азбука съдържа 256 знака. Тъй като 256 = 2 8, информационното тегло на всеки знак в тази азбука е 8 бита. Стойност, равна на осем бита, се нарича байт. 1 байт - информационно тегло на буквен знак с капацитет 256.

Задача 4. Информационно съобщение с обем 4 KB се състои от 4096 знака. Каква е информационната тежест на героя на това съобщение? Колко знака има азбуката, на която е написано това съобщение? Решение.

Отговор: 256 знака.

Най-важните

При азбучния подход се счита, че всеки символ на съобщението има определена информационна тежест - той носи фиксирано количество информация.

1 бит е минималната единица информация.

Информационното тегло на знака i на азбуката и силата N на азбуката са свързани по отношение: N = 2 i . Информационният обем I на съобщението е равен на произведението от броя K на знаците в съобщението и информационното тегло i на знака от азбуката: I = K i.

1 байт = 8 бита.

Байтове, килобайти, мегабайти, гигабайти, терабайти - единици за информация. Всяка следваща единица е 1024 (2 10) пъти по-голяма от предходната.

Въпроси и задачи


Развитието на високите технологии доведе до появата на голям брой термини и понятия, с които се сблъскват всички потребители в процеса на работа с компютри. Напредналите потребители имат представа за повечето от тях, но за начинаещите е много трудно да разберат всички термини. Един от онези термини, за които не всеки дори знае напреднали потребители, е кардиналността на азбуката. Какво се разбира под това понятие и как се изчислява?

Методи за измерване на информация в електронен вид

Силата на азбуката може да бъде полезна за много потребители в процеса на работа. Въпреки това, преди да дефинираме този термин и да разберем методите за неговото изчисляване, е необходимо да поговорим малко за това как се измерва електронната информация, тъй като това е материалната база, на която се основава по-нататъшната теория.

Всеки знае, че всяка стойност има своя собствена система от измервания. Например температурата се измерва в градуси, разстоянието се изразява в метри, времевите интервали се изграждат в секунди и т.н. Въпреки това, малко потребители са наясно със стойностите, в които се измерва текстовата информация в електронен вид. За тези цели в компютърните науки е създадено определение за силата на азбуката.

Определение на термина

Въз основа на факта, че стойността на абсолютно всяко количество, известно на човечеството днес, е определен параметър, състоящ се от набор от мерни единици, дефинирането на концепцията за силата на азбуката е най-лесно да се направи, както следва: силата на азбуката е броят знаци, който е част от всеки език.
Това обаче е само общо определение, което отразява само повърхностния смисъл на силата на азбуката, тъй като самото определение е от по-дълбок характер. За да се разбере цялата му същност, е необходимо да се разбере какви са символите от гледна точка на високите технологии. Всички символи, използвани в компютъра, включват букви, цифри, препинателни знаци и набор от специални знаци. Това обаче не е всичко, тъй като за да се определи силата на азбуката, е необходимо да се вземе предвид и празнината, която е предназначена да отделя думите една от друга.

Да вземем за пример подредбата на руската клавиатура, която се използва за въвеждане на руски текст и се състои от 34 букви, 10 цифри и 11 допълнителни знака, чийто общ брой е 54, което от своя страна се класифицира като мощността на руската азбука клавиатурна подредба.

Информационно тегло на символа

Да вървим напред постепенно. Силата на азбуката не се крие в самия брой букви и цифри, използвани в печатния текст. За да се определи този параметър, е необходим по-задълбочен подход.
Нека помислим за секунда какъв е минималният брой знаци, които са включени в една буква, цифра или специален знак? Верният отговор е две. Всеки знак в компютъра има собствено информационно тегло, благодарение на което машината може да разпознае каква информация е въвел потребителят. Работата е там, че машината не е в състояние да разпознае информация във формата, в която е представена от хората. Вместо това той използва специален машинен език, състоящ се от нули и единици, с помощта на който се извършва преобразуването текстова информацияв двоичен код, който компютърната система може да разбере.
По отношение на информационното тегло, то се изразява в битове и е стандартната единица за измерване на информация в електронен вид.

Малко за двоичния код

Сега имаме повече или по-малко разбираемо определение за силата на азбуката. Въпреки това, за да разберем пълната дълбочина на теорията за представяне на електронна информация от машини, е необходимо да имаме разбиране за двоичния код. Нека разгледаме този въпрос на примера на мощността на азбуката, състояща се от произволни четири знака, всеки от които има тегло от два бита.

Следвайки горното, четири знака ще имат всичките четири бита, осем - три и така нататък. Въз основа на този принцип тежестта на текстовата информация, изразена в електронен вид, се изчислява от компютърни системи.

Изчисления на силата на азбуката и нейното практическо използване

Разбрахме се с терминологията и основните теоретични термини, така че сега нека да разгледаме връзката между силата на азбуката и нейното тегло. За да очертаем по-ясно връзката между тях, нека разгледаме една формула: N=2b, в която първата променлива съответства на броя на знаците, а втората - на броя на знаците, използвани от компютрите в машинния език.
От този математически израз следва, че 21=2, 22=4, 23=8, 24=16 и т.н. Въз основа на това може да се направи много разумно и разумно заключение: броят на знаците, използвани в машинния език, е теглото на знака.

Как се измерва количеството информация?

Обсъдените по-горе примери са много прости примери, от които можете да дадете обща представа за силата на азбуката. В действителност обаче всичко изглежда много по-сложно, тъй като всеки потребител в процеса на въвеждане използва не само малки букви, но и главни букви, както и различни шрифтове, езиково оформление, препинателни знаци, Специални символи, цветове и др. Въз основа на това може да се предположи, че общ бройот всички символи се равнява на 256. Тъй като 256 е равно на 28 в двоичния код, тогава в този случай теглото на всеки знак е 8 бита или един байт.

Така, разполагайки с всички необходими параметри, можем да изчислим количеството електронна информация. Например, отпечатахме 30 страници с печатна информация, всяка от които съдържа 50 реда от 60 различни знака. Използвайки известната ни формула, извършваме необходимите изчисления:

- информационното тегло на един ред ще бъде равно на: 50 x 60 = 3000 байта;
- и целият текст ще тежи: 3000 x 50 = 150 000 байта.

Струва си да се отбележи, че крайният резултат може да се изрази не само в байтове, но и да се преобразува стандартната мерна единица в килобайти, мегабайти и други. За да направите това, е необходимо да разделите стойността от по-нисък порядък на 1024, тъй като точно толкова единици от по-ниската стойност образуват най-високата мерна единица.

Заключение

След като прочетете тази статия, вие имате обща представа за това каква е силата на азбуката, както и методите за нейното изчисляване. Обаче беше разгледан изключително математически подход, който не отчита някои други параметри, основният от които е семантичното натоварване. Този аспект е един от най-важните за разбиране, тъй като независимо от обема на символите, ако те не носят никаква информационна стойност, тогава стойността им е нула. Въпреки това все още е възможно да се изчисли теглото на безсмислен набор от знаци.

Най-общо казано, силата на азбуката, като един от термините на компютърните науки, не е трудна за разбиране. Но много потребители пренебрегват този термин, защото го смятат за безполезен, но на практика всичко е съвсем различно. Днес потребителите работят предимно с електронна информация, който след време може напълно да замени печатния, така че трябва да имате представа как тази информация се изразява в машинна форма и как се изчислява.

Измерване на информация.

Азбучен подход за измерване на информация.

Едно и също съобщение може да носи много информация за един човек и да не носи никаква за друг човек. При този подход е трудно да се определи недвусмислено количеството информация.

Азбучният подход дава възможност да се измери обемът на информацията на съобщение, представено на определен език (естествен или формален), независимо от неговото съдържание.

За количественото изразяване на всяка стойност е необходима преди всичко мерна единица. Измерването се извършва чрез сравняване на измерената стойност с мерната единица. Колкото пъти мерната единица се "побира" в измерената стойност, такъв е резултатът от измерването.

При азбучния подход се счита, че всеки знак от определено съобщение има определен информационно тегло- носи фикс количество информация. Всички знаци от една и съща азбука имат еднакво тегло в зависимост от кардиналността на азбуката. Информационното тегло на символ от двоична азбука се приема като минимална единица информация и се нарича 1 бит

Моля, имайте предвид, че името на единицата информация "бит" (bit) идва от английската фраза binary digit - "двоична цифра".

1 бит се приема като минимална единица за измерване на информация. Смята се, че това е информационното тегло на символа на двоичната азбука.

1.6.2. Информационно тегло на произволен азбучен знак

По-рано разбрахме, че азбуката на всеки естествен или формален език може да бъде заменена с двоична азбука. В този случай мощността на оригиналната азбука N е свързана с битовата дълбочина на двоичния код i, необходима за кодиране на всички знаци на оригиналната азбука, чрез връзката: N = 2 i.

Информационното тегло на знака на азбуката i и мощността на азбуката N са свързани по отношение: N = 2 i.

Задача 1.Азбуката на племето Пулти съдържа 8 знака. Каква е информационната тежест на знак в тази азбука?

Решение.Нека направим кратък запис на условието на проблема.

Известна е връзка, която свързва стойностите на i и N: N = 2 i.

Като се вземат предвид първоначалните данни: 8 = 2 i. Следователно: i = 3.

Пълен запис на решението в бележник може да изглежда така:

Отговор: 3 бита.

1.6.3. Информационен обем на съобщението

Информационен обемсъобщение (количеството информация в съобщение), представено от символите на естествен или формален език, се състои от информационните тегла на съставните му символи.

Информационният обем на съобщението I е равен на произведението от броя на знаците в съобщението K и информационното тегло на буквата i: I = K * i.

Задача 2. Съобщение, написано с 32-символна азбука, съдържа 140 знака. Колко информация носи?

Задача 3.Информационно съобщение от 720 бита се състои от 180 знака. Каква е силата на азбуката, с която е написано това послание?

1.6.4. Информационни единици

В наши дни подготовката на текстове се извършва предимно с помощта на компютри. Можем да говорим за „компютърна азбука“, която включва следните знаци: малки и големи руски и латински букви, цифри, препинателни знаци, аритметични символи, скоби и др. Тази азбука съдържа 256 знака. Тъй като 256 = 28, информационното тегло на всеки знак в тази азбука е 8 бита. Стойност, равна на осем бита, се нарича байт. 1 байт - информационно тегло на буквен знак с капацитет 256.

1 байт = 8 бита

Битът и байтът са "малки" мерни единици. На практика за измерване на информационни обеми се използват по-големи единици:

1 килобайт = 1 KB = 1024 байта = 210 байта

1 мегабайт = 1 MB = 1024 KB = 210 KB = 220 байта

1 гигабайт = 1 GB = 1024 MB = 210 MB = 220 KB = 230 байта

1 терабайт = 1 TB = 1024 GB = 210 GB = 220 MB = 230 KB = 240 байта

Задача 4.Информационно съобщение с обем 4 KB се състои от 4096 знака. Каква е информационната тежест на знак в използваната азбука? Колко знака има азбуката, на която е написано това съобщение?

Задача 5. Във велокроса участват 128 състезатели. специално устройстворегистрира преминаването от всеки от участниците на междинния финал, като записва номера му като верига от нули и единици с минимална дължина, еднаква за всеки състезател. Какъв ще бъде информационният обем на съобщението, записано от устройството, след като 80 колоездачи преминат междинната финална линия?

Решение. Числата на 128-те участници са кодирани с помощта на двоичната азбука. Необходимата битова дълбочина на двоичния код (дължина на веригата) е 7, тъй като 128 = 27. С други думи, съобщението, записано от устройството, че един колоездач е преминал междинния финал, носи 7 бита информация. Когато 80 спортисти преминат междинния финал, устройството ще запише 80 7 = 560 бита, или 70 байта информация.

Решаване на задачи за измерване на информация

За да разрешим проблеми, имаме нужда от формула, която свързва информационното тегло на всеки знак, изразено в битове (b), и силата на азбуката (N):

N = 2b

Задача 1:

Азбуката съдържа 32 букви. Колко информация носи една буква?

1. 32 = 2 5 , така че теглото на един знак b = 5 бита.

Отговор: една буква носи 5 бита информация.

Задача 2:

Съобщение, написано с букви от 16-знаковата азбука, съдържа 10 знака. Колко информация в битове носи?

1. 16 = 2 4 , така че теглото на един символ b = 4 бита.

2. Има общо 10 символа, което означава, че количеството информация е 10 * 4 = 40 бита.

Отговор: съобщението носи 40 бита информация (8 байта).

Задача 3:

Информационно съобщение от 300 бита съдържа 100 знака. Каква е силата на азбуката?

1. Нека да определим теглото на един знак: 300 / 100 = 3 бита.

2. Силата на азбуката се определя по формулата: 2 3 = 8.

Отговор: кардиналността на азбуката е N = 8.

Опитайте сами следните проблеми.

Задача 4:

Размерът на съобщение, съдържащо 20 знака, беше 100 бита. Какъв е размерът на азбуката, с която е написано съобщението?

Задача 5:

Колко знака съдържа едно съобщение, написано с 8-символна азбука, ако обемът му е 120 бита?

Задача 6:

Книгата има 100 страници. Всяка страница има 60 реда по 80 знака на ред. Изчислете информационния обем на книгата.

Модерен Компютърни технологии, компютърните науки, силата на азбуката, системите за смятане и много други понятия имат най-пряка връзка помежду си. Много малко потребители днес са достатъчно добре запознати с тези въпроси. Нека се опитаме да изясним каква е силата на азбуката, как да я изчислим и приложим на практика. В бъдеще това без съмнение може да бъде полезно на практика.

Как се измерва информацията

Преди да пристъпим към изучаването на въпроса каква е силата на азбуката и изобщо какво представлява тя, трябва да започнем, така да се каже, от основите.

Със сигурност всеки знае, че днес има специални системи за измерване на всякакви количества въз основа на референтни стойности. Например за разстояния и подобни величини това са метри, за маса и тегло - килограми, за времеви интервали - секунди и т.н.

Каква е силата на азбуката: първоначалната концепция

Така че, ако следваме общоприетото правило, че крайната стойност на дадено количество е параметър, който определя колко пъти референтната единица е поставена в измерената стойност, можем да заключим, че силата на азбуката е общият брой използвани символи за определен език.

За да стане по-ясно, нека засега оставим настрана въпроса как да открием силата на азбуката и да обърнем внимание на самите символи, разбира се, от гледна точка информационни технологии. Грубо казано, пълен списъкизползваните знаци съдържа букви, цифри, всички видове скоби, специални знаци, препинателни знаци и др. Ако обаче подходим към въпроса каква точно е силата на азбуката чрез компютър, това също трябва да включва интервал (една празнина между думите или други знаци).

Да вземем за пример руския език или по-скоро клавиатурната подредба. Въз основа на гореизложеното пълният списък съдържа 33 букви, 10 цифри и 11 специални знака. Така общата мощност на азбуката е 54.

Информационно тегло на символа

въпреки това обща концепциясилата на азбуката не определя същността на изчисляването на информационните обеми от текст, съдържащ букви, цифри и символи. Това изисква специален подход.

По принцип, помислете за това, добре, ето какво може да бъде минималният набор от гледна точка на компютърна системаколко знака може да съдържа? Отговор: две. И ето защо. Факт е, че всеки символ, било то буква или цифра, има своя собствена информационна тежест, по която машината разпознава това, което е пред него. Но компютърът разбира само представянето под формата на единици и нули, на което всъщност се основава цялата компютърна наука.

Така всеки знак може да бъде представен като последователности, съдържащи числата 1 и 0, т.е. минималната последователност, обозначаваща буква, цифра или символ, се състои от два компонента.

Самото информационно тегло, взето като стандартна информационна единица за измерване, се нарича бит (1 бит). Съответно 8 бита съставляват 1 байт.

Представяне на символи в двоичен код

И така, каква е силата на азбуката, мисля, че вече е малко ясно. Сега нека да разгледаме друг аспект, по-специално практическото представяне на силата с помощта на двоичен код. Като пример, за простота, нека вземем азбука, съдържаща само 4 знака.

В двуцифрен двоичен код последователността и нейното информационно представяне могат да бъдат описани по следния начин:

Сериен номер

двоичен код

Оттук - най-простият извод: при мощност на азбуката N=4 теглото на един знак е 2 бита.

Ако използвате трицифрен двоичен код за азбуката, например с 8 знака, броят на комбинациите ще бъде:

Сериен номер

двоичен код

С други думи, при капацитет на азбуката N=8 теглото на един знак за трицифрен двоичен код ще бъде равно на 3 бита.

Как да открием силата на азбуката и да я използваме в компютърен израз

Сега нека се опитаме да разгледаме зависимостта, която изразява броя на знаците в кода и мощността на азбуката. Формулата, където N е азбучната степен на азбуката, а b е броят знаци в двоичния код, ще изглежда така:

Тоест 2 1 =2, 2 2 =4, 2 3 =8, 2 4 =16 и т.н. Грубо казано, желаният брой знаци на самия двоичен код е теглото на знака. По отношение на информацията изглежда така:

Измерване на обема на информацията

Това обаче бяха само най-простите примери, така да се каже, за първоначално разбиране каква е силата на азбуката. Да преминем директно към практиката.

На този етап от развитието компютърна технологияза писане, като се вземат предвид главни, главни и малки букви, кирилица и латиница, препинателни знаци, скоби, аритметични знаци и др. Използват се 256 знака. Въз основа на факта, че 256 е 2 8, лесно е да се досетите, че теглото на всеки знак в такава азбука е 8, тоест 8 бита или 1 байт.

Въз основа на всички известни параметри можем лесно да получим стойността на информационния обем на всеки текст, който ни е необходим. Например, имаме компютърен текст, съдържащ 30 страници. Една страница съдържа 50 реда от 60 всякакви знака или символи, включително интервали.

Така една страница ще съдържа 50 x 60 = 3000 байта информация, а целият текст ще съдържа 3000 x 50 = 150 000 байта. Както можете да видите, дори малките текстове са неудобни за измерване в байтове. Ами цели библиотеки?

В този случай е по-добре да преобразувате обема в по-мощни стойности - килобайти, мегабайти, гигабайти и др. Въз основа на факта, че например 1 килобайт е равен на 1024 байта (2 10), а мегабайтът е 2 10 килобайта (1024 килобайта), лесно е да се изчисли, че количеството текст в информационно-математическия израз за нашият пример ще бъде 150000/1024=146, 484375 килобайта или приблизително 0,14305 мегабайта.

Вместо послеслов

Като цяло това е накратко и всичко, което се отнася до разглеждането на въпроса каква е силата на азбуката. Остава да добавим, че това описаниеизползван е чисто математически подход. От само себе си се разбира, че семантичното натоварване на текста в този случай не се взема предвид.

Но ако подходим към въпросите на разглеждане от позиция, която дава на човек нещо за разбиране, набор от безсмислени комбинации или последователности от знаци в това отношение ще има нулево информационно натоварване, въпреки че от гледна точка на концепцията за информация обем, резултатът все още може да бъде изчислен.

Като цяло знанието за силата на азбуката и свързаните с нея концепции не е толкова трудно за разбиране и може просто да се приложи в смисъл на практически действия. В същото време всеки потребител почти всеки ден се сблъсква с това. Достатъчно е да цитираме популярните редактор на думиили всяка друга от същото ниво, която използва такава система. Но не го бъркайте с обичайния Notepad. Тук силата на азбуката е по-ниска, тъй като, да речем, главните букви не се използват при писане.