Připomeňme, že z hlediska subjektivního přístupu k definici informace je informace obsahem zpráv, které člověk dostává z různých zdrojů. Stejná zpráva může pro jednu osobu nést mnoho informací a pro jinou ji nenést vůbec. S tímto přístupem je obtížné jednoznačně určit množství informací.

Abecední přístup umožňuje měřit informační objem sdělení prezentovaného v určitém jazyce (přirozeném nebo formálním), bez ohledu na jeho obsah.

Pro kvantitativní vyjádření jakékoli hodnoty je v první řadě nezbytná měrná jednotka. Měření se provádí porovnáním naměřené hodnoty s jednotkou měření. Kolikrát se jednotka měření "vejde" do naměřené hodnoty, takový je výsledek měření.

Při abecedním přístupu se má za to, že každý symbol určitého sdělení má určitou informační váhu – nese pevná částka informace. Všechny znaky stejné abecedy mají stejnou váhu v závislosti na mohutnosti abecedy. Informační váha symbolu binární abecedy se bere jako minimální jednotka měření informace a nazývá se 1 bit. Upozorňujeme, že název jednotky informace „bit“ (bit) pochází z anglického sousloví „binary digit“ – „binární číslice“.

1.4.2. Informační váha libovolného znaku abecedy

Již dříve jsme zjistili, že abecedu jakéhokoli přirozeného nebo formálního jazyka lze nahradit binární abecedou. V tomto případě mocnina původní abecedy N souvisí s kapacitou binární kód i, nutné pro kódování všech znaků zdrojové abecedy, vztahem: N = 2 i .

Úkol 1. Abeceda kmene Pulti obsahuje 8 znaků. Jakou informační váhu má znak v této abecedě?

Rozhodnutí. Udělejme stručný záznam o stavu problému.

Je znám vztah, který spojuje hodnoty i a N: N = 2 i .

Vzhledem k počátečním údajům: 8 = 2 i . Proto: i = 3.

Kompletní záznam řešení v poznámkovém bloku může vypadat takto:

Odpověď: 3 bity

1.4.3. Informační objem zprávy

Informační objem zprávy (množství informací ve zprávě) reprezentovaný symboly přirozeného nebo formálního jazyka je součtem informačních vah jeho základních symbolů.

Úkol 2. Zpráva napsaná 32místnou abecedou obsahuje 140 znaků. Kolik informací nese?

Rozhodnutí.

Odpověď": 700 bitů.

Úkol 3. Informační zpráva o 720 bitech se skládá ze 180 znaků. Jakou sílu má abeceda, kterou je tato zpráva napsána?

Rozhodnutí.

Odpověď: 16 znaků.

1.4.4. Informační jednotky

V dnešní době se příprava textů provádí především pomocí počítačů. Můžeme mluvit o „počítačové abecedě“, která obsahuje následující znaky: malá a velká ruská a latinská písmena, čísla, interpunkční znaménka, znaky aritmetické operace, závorky atd. Tato abeceda obsahuje 256 znaků. Protože 256 = 2 8 , informační váha každého znaku v této abecedě je 8 bitů. Hodnota rovnající se osmi bitům se nazývá bajt. 1 byte - informační váha znaku abecedy s kapacitou 256.

Úkol 4. Informační zpráva o objemu 4 KB se skládá ze 4096 znaků. Jakou informační váhu má charakter této zprávy? Kolik znaků je v abecedě, ve které je tato zpráva napsána? Rozhodnutí.

Odpověď: 256 znaků.

Nejdůležitější

Při abecedním přístupu se má za to, že každý symbol zprávy má určitou informační váhu – nese pevné množství informací.

1 bit je minimální jednotka informace.

Informační váha i znaku abecedy a mocnina N abecedy souvisí vztahem: N = 2 i . Informační objem I zprávy je roven součinu počtu K znaků ve zprávě a informační váhy i znaku abecedy: I ​​= K i.

1 bajt = 8 bitů.

Bajty, kilobajty, megabajty, gigabajty, terabajty – jednotky informací. Každá další jednotka je 1024 (2 10) krát větší než ta předchozí.

Otázky a úkoly


Rozvoj špičkových technologií vedl ke vzniku velkého množství termínů a konceptů, se kterými se všichni uživatelé setkávají v procesu práce s počítači. Pokročilí uživatelé o většině z nich mají představu, nicméně pro začátečníky je velmi obtížné porozumět všem pojmům. Jeden z pojmů, který ne každý zná pokročilé uživatele, je mohutnost abecedy. Co znamená tento pojem a jak se počítá?

Metody měření informací v elektronické podobě

Síla abecedy může být užitečná pro mnoho uživatelů v procesu práce. Než však tento pojem definujeme a porozumíme metodám jeho výpočtu, je třeba si trochu pohovořit o tom, jak se měří elektronická informace, protože to je materiálový základ, na kterém je založena další teorie.

Každý ví, že každá hodnota má svůj vlastní systém měření. Například teplota se měří ve stupních, vzdálenost je vyjádřena v metrech, časové intervaly jsou stavěny v sekundách a tak dále. Jen málo uživatelů si však uvědomuje, v jakých hodnotách se měří textové informace v elektronické podobě. Pro tyto účely byla v informatice vytvořena definice síly abecedy.

Definice pojmu

Na základě skutečnosti, že hodnota absolutně jakékoli veličiny, kterou dnes lidstvo zná, je určitým parametrem skládajícím se ze sady měrných jednotek, lze nejsnáze definovat pojem mocniny abecedy takto: síla abecedy je počet znaků, které jsou součástí libovolného jazyka.
Toto je však pouze obecná definice, která odráží pouze povrchní význam síly abecedy, protože samotná definice je hlubší povahy. Abychom pochopili celou jeho podstatu, je nutné pochopit, jaké jsou symboly z pohledu špičkových technologií. Všechny znaky používané v počítači zahrnují písmena, čísla, interpunkční znaménka a sadu speciálních znaků. To však není vše, protože pro určení síly abecedy je také nutné vzít v úvahu mezeru, která je určena k oddělení slov od sebe.

Vezměme si jako příklad ruské rozložení klávesnice, které se používá k psaní ruského textu a skládá se z 34 písmen, 10 čísel a 11 dalších znaků, z nichž celkový počet je 54, což je zase klasifikováno jako síla abecedy ruského jazyka. rozložení klávesnice.

Informační váha symbolu

Pojďme postupně. Síla abecedy nespočívá v pouhém počtu písmen a číslic použitých v tištěném textu. K určení tohoto parametru je zapotřebí hlubší přístup.
Pojďme se na chvíli zamyslet nad tím, jaké je minimální množství znaků, které obsahuje jedno písmeno, číslo nebo speciální znak? Správná odpověď je dvě. Každý znak v počítači má svou informační váhu, díky které je stroj schopen rozpoznat, jaké informace uživatel zadal. Věc se má tak, že stroj není schopen rozpoznat informace v podobě, v jaké je předkládají lidé. Místo toho využívá speciální strojový jazyk skládající se z nul a jedniček, s jehož pomocí dochází ke konverzi textové informace do binárního kódu, kterému počítačový systém rozumí.
S ohledem na váhu informace je vyjádřena v bitech a je standardní jednotkou pro měření informací v elektronické podobě.

Trochu o binárním kódu

Nyní máme víceméně srozumitelnou definici síly abecedy. Pro pochopení celé hloubky teorie reprezentace elektronické informace stroji je však nutné porozumět binárnímu kódu. Zvažme tuto otázku na příkladu síly abecedy, skládající se z libovolných čtyř znaků, z nichž každý má váhu dvou bitů.

Podle výše uvedeného budou mít čtyři znaky všechny čtyři bity, osm - tři a tak dále. Na základě tohoto principu je počítačovými systémy vypočítána váha textových informací vyjádřených v elektronické podobě.

Výpočty mocniny abecedy a její praktické využití

Zabývali jsme se terminologií a základními teoretickými pojmy, a tak se nyní podívejme na vztah mezi mohutností abecedy a její váhou. Abychom jasněji nakreslili vztah mezi nimi, uvažujme jeden vzorec: N=2b, ve kterém první proměnná odpovídá počtu znaků a druhá - počtu znaků používaných počítači ve strojovém jazyce.
Z tohoto matematického výrazu vyplývá, že 21=2, 22=4, 23=8, 24=16 a tak dále. Na základě toho lze vyvodit velmi rozumný a rozumný závěr: počet znaků použitých ve strojovém jazyce je hmotnost znaku.

Jak se měří množství informací?

Výše uvedené příklady jsou velmi jednoduché příklady, z nichž si můžete udělat obecnou představu o síle abecedy. Ve skutečnosti však vše vypadá mnohem komplikovaněji, protože každý uživatel v procesu psaní používá nejen malá písmena, ale také velká písmena, stejně jako různá písma, jazykové rozvržení, interpunkční znaménka, Speciální symboly, barvy a další. Na základě toho lze předpokládat, že celkový počet všech znaků se rovná 256. Protože 256 se v binárním kódu rovná 28, pak je v tomto případě váha každého znaku 8 bitů nebo jeden bajt.

Tím, že máme všechny potřebné parametry, můžeme vypočítat množství elektronických informací. Vytiskli jsme například 30 stran tištěných informací, z nichž každá obsahovala 50 řádků po 60 různých znacích. Pomocí nám známého vzorce provedeme potřebné výpočty:

- informační váha jednoho řádku bude rovna: 50 x 60 = 3000 bajtů;
- a celý text bude vážit: 3000 x 50 = 150 000 bajtů.

Stojí za zmínku, že konečný výsledek lze vyjádřit nejen v bajtech, ale také převést standardní jednotku měření na kilobajty, megabajty a další. K tomu je nutné vydělit hodnotu nižšího řádu 1024, protože právě tolik jednotek nižší hodnoty tvoří nejvyšší jednotku měření.

Závěr

Po přečtení tohoto článku máte obecnou představu o tom, jaká je síla abecedy, a také o metodách jejího výpočtu. Byl však uvažován výhradně matematický přístup, který nebere v úvahu některé další parametry, z nichž hlavní je sémantická zátěž. Tento aspekt je jedním z nejdůležitějších k pochopení, protože bez ohledu na objem znaků, pokud nenesou žádnou informační hodnotu, pak je jeho hodnota nulová. Stále je však možné spočítat váhu nesmyslné znakové sady.

Obecně řečeno, sílu abecedy, jako jednoho z termínů informatiky, není těžké pochopit. Mnoho uživatelů ale tento termín zanedbává, protože jej považují za zbytečný, nicméně v praxi je vše úplně jinak. Dnes uživatelé pracují především s elektronické informace, který časem může zcela nahradit ten tištěný, takže je potřeba mít představu o tom, jak se tyto informace vyjadřují ve strojové podobě a jak se počítají.

Měření informací.

Abecední přístup k měření informací.

Stejná zpráva může pro jednu osobu nést mnoho informací a pro jinou ji nenést vůbec. S tímto přístupem je obtížné jednoznačně určit množství informací.

Abecední přístup umožňuje měřit informační objem sdělení prezentovaného v určitém jazyce (přirozeném nebo formálním), bez ohledu na jeho obsah.

Pro kvantitativní vyjádření jakékoli hodnoty je v první řadě nezbytná měrná jednotka. Měření se provádí porovnáním naměřené hodnoty s jednotkou měření. Kolikrát se jednotka měření "vejde" do naměřené hodnoty, takový je výsledek měření.

V abecedním přístupu se má za to, že každý znak určitého sdělení má určité informační váha- nese pevnou množství informací. Všechny znaky stejné abecedy mají stejnou váhu v závislosti na mohutnosti abecedy. Informační váha znaku binární abecedy se bere jako minimální jednotka informace a je volána 1 bit

Upozorňujeme, že název jednotky informace „bit“ (bit) pochází z anglického slovního spojení binární číslice – „binární číslice“.

1 bit se bere jako minimální jednotka měření informace. Předpokládá se, že jde o informační váhu symbolu binární abecedy.

1.6.2. Informační váha libovolného znaku abecedy

Již dříve jsme zjistili, že abecedu jakéhokoli přirozeného nebo formálního jazyka lze nahradit binární abecedou. V tomto případě je síla původní abecedy N vztažena k bitové hloubce binárního kódu i, potřebného pro zakódování všech znaků původní abecedy, vztahem: N = 2 i.

Informační váha znaku abecedy i a mocnina abecedy N souvisí vztahem: N = 2 i.

Úkol 1. Abeceda kmene Pulti obsahuje 8 znaků. Jakou informační váhu má znak v této abecedě?

Rozhodnutí. Udělejme stručný záznam o stavu problému.

Je znám vztah, který spojuje hodnoty i a N: N = 2 i.

Vezmeme-li v úvahu počáteční údaje: 8 = 2 i. Proto: i = 3.

Kompletní záznam řešení v poznámkovém bloku může vypadat takto:

Odpověď: 3 bity.

1.6.3. Informační objem zprávy

Objem informací zpráva (množství informací ve zprávě) reprezentovaná symboly přirozeného nebo formálního jazyka se skládá z informačních vah jeho základních symbolů.

Informační objem zprávy I se rovná součinu počtu znaků ve zprávě K a informační váhy znaku abecedy i: I = K * i.

Úkol 2. Zpráva napsaná 32místnou abecedou obsahuje 140 znaků. Kolik informací nese?

Úkol 3. Informační zpráva o 720 bitech se skládá ze 180 znaků. Jakou sílu má abeceda, kterou je tato zpráva napsána?

1.6.4. Informační jednotky

V dnešní době se příprava textů provádí především pomocí počítačů. Můžeme hovořit o „počítačové abecedě“, která obsahuje následující znaky: malá a velká ruská a latinská písmena, čísla, interpunkční znaménka, aritmetické symboly, závorky atd. Tato abeceda obsahuje 256 znaků. Protože 256 = 28, informační váha každého znaku v této abecedě je 8 bitů. Hodnota rovnající se osmi bitům se nazývá bajt. 1 byte - informační váha znaku abecedy s kapacitou 256.

1 bajt = 8 bitů

Bit a byte jsou "malé" jednotky měření. V praxi se k měření objemů informací používají větší jednotky:

1 kilobajt = 1 kB = 1024 bajtů = 210 bajtů

1 megabajt = 1 MB = 1024 kB = 210 kB = 220 bajtů

1 gigabajt = 1 GB = 1024 MB = 210 MB = 220 KB = 230 bajtů

1 terabajt = 1 TB = 1024 GB = 210 GB = 220 MB = 230 KB = 240 bajtů

Úkol 4. Informační zpráva o objemu 4 KB se skládá ze 4096 znaků. Jakou informační váhu má znak v použité abecedě? Kolik znaků je v abecedě, ve které je tato zpráva napsána?

Úkol 5. Cyklokrosu se účastní 128 sportovců. speciální zařízení zaznamená průjezd každého z účastníků středního cíle, zapíše jeho číslo jako řetězec nul a jedniček o minimální délce, stejné pro každého sportovce. Jaký bude informační objem zprávy zaznamenané zařízením poté, co 80 cyklistů projede mezicílem?

Rozhodnutí. Čísla 128 účastníků jsou zakódována pomocí binární abecedy. Požadovaná bitová hloubka binárního kódu (délka řetězce) je 7, protože 128 = 27. Jinými slovy, zpráva zaznamenaná zařízením, že jeden cyklista projel mezicílem, nese 7 bitů informace. Když 80 sportovců projde středním cílem, zařízení zaznamená 80 7 = 560 bitů nebo 70 bajtů informací.

Řešení problémů pro měření informací

K vyřešení problémů potřebujeme vzorec, který dává do souvislosti informační váhu každého znaku vyjádřenou v bitech (b) a mocninu abecedy (N):

N = 2b

Úkol 1:

Abeceda obsahuje 32 písmen. Kolik informací obsahuje jedno písmeno?

1. 32 = 2 5 , tedy váha jednoho znaku b = 5 bitů.

Odpověď: jedno písmeno nese 5 bitů informace.

Úkol 2:

Zpráva napsaná písmeny z 16znakové abecedy obsahuje 10 znaků. Kolik informací v bitech nese?

1. 16 = 2 4 , takže váha jednoho symbolu b = 4 bity.

2. Celkem je 10 znaků, což znamená, že množství informací je 10 * 4 = 40 bitů.

Odpověď: zpráva nese 40 bitů informace (8 bajtů).

Úkol 3:

Informační zpráva o 300 bitech obsahuje 100 znaků. Jaká je síla abecedy?

1. Určíme váhu jednoho znaku: 300 / 100 = 3 bity.

2. Mocninu abecedy určuje vzorec: 2 3 = 8.

Odpověď: mohutnost abecedy je N = 8.

Vyzkoušejte následující problémy sami.

Úkol 4:

Velikost zprávy obsahující 20 znaků byla 100 bitů. Jaká je velikost abecedy, kterou je zpráva napsána?

Úkol 5:

Kolik znaků obsahuje zpráva napsaná pomocí 8znakové abecedy, pokud její objem byl 120 bitů?

Úkol 6:

Kniha má 100 stran. Každá stránka má 60 řádků po 80 znacích na řádek. Vypočítejte informační objem knihy.

Moderní Počítačové technologie, informatika, síla abecedy, kalkulové systémy a mnoho dalších pojmů mají mezi sebou nejpřímější souvislosti. Jen velmi málo uživatelů se dnes v těchto věcech dostatečně orientuje. Zkusme si ujasnit, v čem spočívá síla abecedy, jak ji vypočítat a aplikovat v praxi. V budoucnu to nepochybně může být užitečné v praxi.

Jak se měří informace

Než přistoupíme ke studiu otázky, jaká je síla abecedy a obecně, co to je, měli bychom začít, abych tak řekl, od základů.

Každý jistě ví, že dnes existují speciální systémy pro měření libovolných veličin na základě referenčních hodnot. Například pro vzdálenosti a podobné veličiny jsou to metry, pro hmotnost a hmotnost - kilogramy, pro časové intervaly - sekundy atd.

Jaká je síla abecedy: počáteční koncept

Pokud se tedy budeme řídit obecně uznávaným pravidlem, že konečná hodnota veličiny je parametr, který určuje, kolikrát je referenční jednotka umístěna v měřené hodnotě, můžeme dojít k závěru, že mocnina abecedy je celkový počet použitých symbolů. pro konkrétní jazyk.

Aby bylo jasno, nechme zatím otázku, jak najít sílu abecedy, stranou a věnujme se samotným symbolům samozřejmě z pohledu informační technologie. Zhruba řečeno, úplný seznam použité znaky obsahují písmena, čísla, všechny druhy hranatých závorek, speciální znaky, interpunkční znaménka atd. Pokud však přistoupíme na otázku, jakou sílu má abeceda přesně pomocí počítače, mělo by to zahrnovat i mezeru (jedinou mezeru mezi slovy nebo jinými znaky).

Vezměme si jako příklad ruský jazyk, nebo spíše rozložení klávesnice. Na základě výše uvedeného obsahuje úplný seznam 33 písmen, 10 číslic a 11 speciálních znaků. Celková mocnina abecedy je tedy 54.

Informační váha symbolu

nicméně obecný koncept síla abecedy neurčuje podstatu výpočtu informačních objemů textu obsahujících písmena, čísla a symboly. To vyžaduje zvláštní přístup.

V zásadě o tom přemýšlejte, dobře, tady je to, co může být minimální sada z pohledu počítačový systém kolik znaků může obsahovat? Odpověď: dva. A právě proto. Faktem je, že každý znak, ať už je to písmeno nebo číslo, má svou informační váhu, podle které stroj rozpozná, co je před ním. Počítač ale rozumí pouze reprezentaci v podobě jedniček a nul, na kterých je vlastně celá informatika založena.

Jakýkoli znak tedy může být reprezentován jako sekvence obsahující čísla 1 a 0, to znamená, že minimální sekvence označující písmeno, číslo nebo symbol se skládá ze dvou složek.

Samotná informační váha, brána jako standardní informační jednotka měření, se nazývá bit (1 bit). Podle toho 8 bitů tvoří 1 bajt.

Reprezentace znaků v binárním kódu

V čem je tedy síla abecedy, je myslím už trochu jasné. Nyní se podívejme na další aspekt, konkrétně na praktickou reprezentaci moci pomocí binárního kódu. Jako příklad si pro jednoduchost vezměme abecedu obsahující pouze 4 znaky.

Ve dvoumístném binárním kódu lze sekvenci a jejich informační reprezentaci popsat následovně:

Sériové číslo

binární kód

Proto - nejjednodušší závěr: při síle abecedy N=4 je váha jednoho znaku 2 bity.

Pokud použijete pro abecedu třímístný binární kód, například s 8 znaky, počet kombinací by byl:

Sériové číslo

binární kód

Jinými slovy, při kapacitě abecedy N=8 bude váha jednoho znaku pro třímístný binární kód rovna 3 bitům.

Jak zjistit sílu abecedy a použít ji v počítačovém vyjádření

Nyní se zkusme podívat na závislost, která vyjadřuje počet znaků v kódu a sílu abecedy. Vzorec, kde N je alfabetická mocnina abecedy a b je počet znaků v binárním kódu, bude vypadat takto:

To znamená, 2 1 = 2, 2 2 = 4, 2 3 = 8, 2 4 = 16 atd. Zhruba řečeno, požadovaný počet znaků samotného binárního kódu je hmotnost znaku. Z hlediska informací to vypadá takto:

Měření objemu informací

To však byly jen ty nejjednodušší příklady, abych tak řekl, pro prvotní pochopení toho, v čem spočívá síla abecedy. Pojďme přímo k praxi.

V této fázi vývoje počítačová technologie pro psaní s přihlédnutím k velkým, velkým a malým písmenům, azbuce a latince, interpunkčním znaménkům, závorkám, aritmetickým symbolům atd. Je použito 256 znaků. Na základě skutečnosti, že 256 je 2 8 , lze snadno uhodnout, že váha každého znaku v takové abecedě je 8, tedy 8 bitů nebo 1 bajt.

Na základě všech známých parametrů snadno získáme hodnotu informačního objemu libovolného textu, který potřebujeme. Máme například počítačový text obsahující 30 stran. Jedna stránka obsahuje 50 řádků po 60 libovolných znacích nebo symbolech včetně mezer.

Jedna stránka tedy bude obsahovat 50 x 60 = 3 000 bajtů informací a celý text bude obsahovat 3 000 x 50 = 150 000 bajtů. Jak vidíte, i malé texty jsou nepohodlné měřit v bajtech. A co celé knihovny?

V tomto případě je lepší převést svazek na výkonnější hodnoty - kilobajty, megabajty, gigabajty atd. Na základě skutečnosti, že například 1 kilobajt je roven 1024 bytům (2 10) a megabajt je 2 10 kilobajtů (1024 kilobajtů), lze snadno spočítat, že množství textu v informačně-matematickém výrazu pro náš příklad bude 150000/1024=146, 484375 kilobajtů nebo přibližně 0,14305 megabajtů.

Místo doslovu

Celkově vzato, to je stručně a vše, co se týká úvahy o otázce, jaká je síla abecedy. Zbývá dodat, že tento popis byl použit čistě matematický přístup. Je samozřejmé, že se v tomto případě nebere ohled na sémantické zatížení textu.

Pokud ale k otázkám úvah přistoupíme z pozice, která dává člověku co chápat, bude mít soubor nesmyslných kombinací či sekvencí znaků v tomto ohledu nulovou informační zátěž, i když z hlediska pojmu informace objem, výsledek lze ještě vypočítat.

Obecně platí, že znalosti o síle abecedy a souvisejících pojmů nejsou tak těžké na pochopení a lze je jednoduše aplikovat ve smyslu praktických akcí. Zároveň s tím každý uživatel téměř každý den čelí. Stačí uvést populární textový editor nebo jakýkoli jiný na stejné úrovni, který takový systém používá. Nepleťte si ho ale s obvyklým Poznámkovým blokem. Zde je síla abecedy nižší, protože se při psaní nepoužívají velká písmena.