Всички знаци и букви могат да бъдат кодирани с помощта на осем двоични бита. Най-често срещаните таблици за представяне на букви в двоичен код са ASCII и ANSI, те могат да се използват за писане на текстове в микропроцесори. В ASCII и ANSI таблиците първите 128 знака са еднакви. Тази част от таблицата съдържа кодове за цифри, препинателни знаци, главни и малки латински букви и контролни знаци. Националните разширения на таблици със знаци и псевдографски символи се съдържат в последните 128 кода на тези таблици, така че руските текстове в операционните системи DOS и WINDOWS не съвпадат.
При първото запознаване с компютри и микропроцесори може да възникне въпросът - "как да конвертирате текст в двоичен код?" Тази трансформация обаче е най-простото действие! За да направите това, трябва да използвате всеки текстов редактор. Включването на най-простата програма за бележник, която е част от операционната система Windows, също е подходяща. Подобни редактори присъстват във всички програмни среди за езици като C, Pascal или Java. Трябва да се отбележи, че най-често срещаният текстов редактор Word не е подходящ за просто преобразуване на текст в двоичен код. Този тестов редактор въвежда огромно количество допълнителна информация, като цвета на буквите, курсив, подчертаване, езика, на който е написана определена фраза, и шрифта.
Трябва да се отбележи, че всъщност комбинацията от нули и единици, с помощта на които се кодира текстовата информация, не е двоичен код, т.к. битовете в този код не се подчиняват на законите. В интернет обаче най-често се среща фразата за търсене „представяне на букви в двоичен код“. Таблица 1 показва съответствието на двоичните кодове с буквите от латинската азбука. За краткост последователността от нули и единици в тази таблица е представена в десетични и шестнадесетични кодове.
маса 1Таблица за представяне на латински букви в двоичен код (ASCII)
Десетичен код | Шестнадесетичен код | Характер на дисплея | Значение |
---|---|---|---|
0 | 00 | NUL | |
1 | 01 | ☺ | (показва контролна дума) |
2 | 02 | ☻ | (Първата предадена дума) |
3 | 03 | ETX (последна дума за предаване) | |
4 | 04 | ♦ | EOT (край на предаването) |
5 | 05 | ♣ | ENQ (инициализация) |
6 | 06 | ♠ | ACK (потвърждение) |
7 | 07 | БЕЛ | |
8 | 08 | ◘ | BS |
9 | 09 | ○ | HT (хоризонтален раздел |
10 | 0А | ◙ | LF (подаване на ред) |
11 | 0Б | ♂ | VT (вертикален раздел) |
12 | 0С | ♀ | FF (следваща страница) |
13 | 0D | ♪ | CR (връщане на каретка) |
14 | 0E | ♫ | SO (двойна ширина) |
15 | 0F | ☼ | SI (кондензирано уплътнение) |
16 | 10 | DLE | |
17 | 11 | ◄ | DC1 |
18 | 12 | ↕ | DC2 (Отмяна на съкратен печат) |
19 | 13 | ‼ | DC3 (готов) |
20 | 14 | ¶ | DC4 (отмяна на двойна ширина) |
21 | 15 | § | NAC (без потвърждение) |
22 | 16 | ▬ | SYN |
23 | 17 | ↨ | ETB |
24 | 18 | МОГА | |
25 | 19 | ↓ | ЕМ |
26 | 1А | → | ПОДП |
27 | 1Б | ← | ESC (контрол на последователността на стартиране) |
28 | 1C | ∟ | FS |
29 | 1D | ↔ | GS |
30 | 1E | ▲ | RS |
31 | 1F | ▼ | НАС |
32 | 20 | пространство | |
33 | 21 | ! | Удивителен знак |
34 | 22 | « | ъглова скоба |
35 | 23 | # | Знак за число |
36 | 24 | $ | Знак за валута (долар) |
37 | 25 | % | Знак за процент |
38 | 26 | & | амперсанд |
39 | 27 | " | апостроф |
40 | 28 | ( | отваряща скоба |
41 | 29 | ) | Затворете скоби |
42 | 2А | * | звезда |
43 | 2B | + | знак плюс |
44 | 2C | , | Запетая |
45 | 2D | - | Знак минус |
46 | 2E | . | Точка |
47 | 2F | / | Дробна лента |
48 | 30 | 0 | Числова нула |
49 | 31 | 1 | номер едно |
50 | 32 | 2 | Номер две |
51 | 33 | 3 | номер три |
52 | 34 | 4 | Номер четири |
53 | 35 | 5 | Номер пет |
54 | 36 | 6 | Номер шест |
55 | 37 | 7 | Номер седем |
56 | 38 | 8 | Номер осем |
57 | 39 | 9 | Номер девет |
58 | 3А | : | Дебело черво |
59 | 3B | ; | точка и запетая |
60 | 3C | < | знак по-малко |
61 | 3D | = | знак за равенство |
62 | 3E | > | Подпишете повече |
63 | 3F | ? | въпросителен знак |
64 | 40 | @ | Търговски етаж |
65 | 41 | А | Главна латинска буква А |
66 | 42 | б | главна латинска буква B |
67 | 43 | ° С | латинска главна буква C |
68 | 44 | д | Главна латинска буква D |
69 | 45 | д | латинска главна буква E |
70 | 46 | Е | главна латинска буква F |
71 | 47 | Ж | главна латинска буква G |
72 | 48 | з | главна латинска буква H |
73 | 49 | аз | Главна латинска буква I |
74 | 4А | Дж | латинска главна буква J |
75 | 4B | К | Главна латинска буква K |
76 | 4C | Л | Главна латинска буква L |
77 | 4D | М | Главна латинска буква |
78 | 4E | н | Главна латинска буква N |
79 | 4F | О | Главна латинска буква O |
80 | 50 | П | главна латинска буква P |
81 | 51 | Q | Главна латинска буква |
82 | 52 | Р | латинска главна буква R |
83 | 53 | С | Главна латинска буква S |
84 | 54 | T | главна латинска буква Т |
85 | 55 | U | латинска главна буква U |
86 | 56 | V | Главна латинска буква V |
87 | 57 | У | Главна латинска буква W |
88 | 58 | х | Главна латинска буква X |
89 | 59 | Y | Главна латинска буква Y |
90 | 5А | З | Главна латинска буква Z |
91 | 5B | [ | Отваряща квадратна скоба |
92 | 5C | \ | Наклонена черта |
93 | 5 Д | ] | Затваряща квадратна скоба |
94 | 5E | ^ | "капак" |
95 | 5 | _ | Долна черта |
96 | 60 | ` | апостроф |
97 | 61 | а | малка латинска буква a |
98 | 62 | b | малка латинска буква b |
99 | 63 | ° С | малка латинска буква c |
100 | 64 | д | малка латинска буква d |
101 | 65 | д | малка латинска буква e |
102 | 66 | f | малка латинска буква f |
103 | 67 | ж | малка латинска буква g |
104 | 68 | ч | малка латинска буква h |
105 | 69 | аз | малка латинска буква i |
106 | 6А | й | малка латинска буква j |
107 | 6B | к | малка латинска буква k |
108 | 6C | л | малка латинска буква l |
109 | 6D | м | малка латинска буква m |
110 | 6E | н | малка латинска буква n |
111 | 6F | о | малка латинска буква o |
112 | 70 | стр | малка латинска буква p |
113 | 71 | р | малка латинска буква q |
114 | 72 | r | малка латинска буква r |
115 | 73 | с | малка латинска буква s |
116 | 74 | T | малка латинска буква t |
117 | 75 | u | малка латинска буква u |
118 | 76 | v | малка латинска буква v |
119 | 77 | w | малка латинска буква w |
120 | 78 | х | малка латинска буква x |
121 | 79 | г | малка латинска буква y |
122 | 7А | z | малка латинска буква z |
123 | 7B | { | Отворена къдрава скоба |
124 | 7С | | | вертикална лента |
125 | 7D | } | Затворете къдрава скоба |
126 | 7E | ~ | Тилда |
127 | 7F | ⌂ |
В класическата версия на таблицата със символи ASCII няма руски букви и се състои от 7 бита. По-късно обаче тази таблица беше разширена до 8 бита, а в горните 128 реда се появиха руски букви в двоичен код и псевдографски символи. В общия случай втората част съдържа националните азбуки на различни страни и руските букви са само един от възможните набори (855), може да има френска (863), немска (1141) или гръцка (737) таблица. Таблица 2 показва пример за представяне на руски букви в двоичен код.
Таблица 2.Таблица за представяне на руски букви в двоичен код (ASCII)
Десетичен код | Шестнадесетичен код | Характер на дисплея | Значение |
---|---|---|---|
128 | 80 | НО | Главна руска буква А |
129 | 81 | б | Главна руска буква Б |
130 | 82 | AT | Главна руска буква V |
131 | 83 | Ж | Главна руска буква Г |
132 | 84 | д | Главна руска буква Д |
133 | 85 | д | Главна руска буква Е |
134 | 86 | И | Главна руска буква Ж |
135 | 87 | З | Главна руска буква Z |
136 | 88 | И | Главна руска буква I |
137 | 89 | Y | Главна руска буква Y |
138 | 8А | Да се | Главна руска буква К |
139 | 8B | Л | Главна руска буква Л |
140 | 8C | М | Главна руска буква М |
141 | 8D | з | Главна руска буква Н |
142 | 8E | О | Главна руска буква О |
143 | 8F | П | Главна руска буква П |
144 | 90 | Р | Главна руска буква Р |
145 | 91 | ОТ | Главна руска буква С |
146 | 92 | T | Главна руска буква Т |
147 | 93 | При | Главна руска буква U |
148 | 94 | Е | Главна руска буква Ф |
149 | 95 | х | Главна руска буква X |
150 | 96 | ° С | Главна руска буква С |
151 | 97 | з | Главна руска буква Ch |
152 | 98 | У | Главна руска буква Ш |
153 | 99 | SCH | Главна руска буква Ш |
154 | 9А | Комерсант | Главна руска буква Ъ |
155 | 9B | С | Главна руска буква Y |
156 | 9C | b | Главна руска буква б |
157 | 9D | д | Главна руска буква Е |
158 | 9E | Ю | Главна руска буква Ю |
159 | 9F | аз | Главна руска буква Я |
160 | A0 | а | Малка руска буква а |
161 | A1 | b | Малка руска буква б |
162 | A2 | в | Малка руска буква v |
163 | A3 | Ж | Малка руска буква г |
164 | A4 | д | Малка руска буква d |
165 | A5 | д | Малка руска буква е |
166 | A6 | и | Малка руска буква ж |
167 | A7 | ч | Малка руска буква з |
168 | A8 | и | Малка руска буква и |
169 | A9 | th | Малка руска буква у |
170 | АА | да се | Малка руска буква к |
171 | AB | л | Малка руска буква л |
172 | AC | м | Малка руска буква м |
173 | AD | н | Малка руска буква n |
174 | AE | относно | Малка руска буква о |
175 | AF | П | Малка руска буква п |
176 | B0 | ░ | |
177 | B1 | ▒ | |
178 | B2 | ▓ | |
179 | B3 | │ | Псевдо символ |
180 | B4 | ┤ | Псевдо символ |
181 | B5 | ╡ | Псевдо символ |
182 | B6 | ╢ | Псевдо символ |
183 | B7 | ╖ | Псевдо символ |
184 | B8 | ╕ | Псевдо символ |
185 | B9 | ╣ | Псевдо символ |
186 | BA | ║ | Псевдо символ |
187 | BB | ╗ | Псевдо символ |
188 | пр.н.е | ╝ | Псевдо символ |
189 | BD | ╜ | Псевдо символ |
190 | БЪДА | ╛ | Псевдо символ |
191 | bf | ┐ | Псевдо символ |
192 | C0 | └ | Псевдо символ |
193 | C1 | ┴ | Псевдо символ |
194 | C2 | ┬ | Псевдо символ |
195 | C3 | ├ | Псевдо символ |
196 | C4 | ─ | Псевдо символ |
197 | C5 | ┼ | Псевдо символ |
198 | C6 | ╞ | Псевдо символ |
199 | C7 | ╟ | Псевдо символ |
200 | C8 | ╚ | Псевдо символ |
201 | C9 | ╔ | Псевдо символ |
202 | CA | ╩ | Псевдо символ |
203 | CB | ╦ | Псевдо символ |
204 | CC | ╠ | Псевдо символ |
205 | CD | ═ | Псевдо символ |
206 | CE | ╬ | Псевдо символ |
207 | CF | ╧ | Псевдо символ |
208 | D0 | ╨ | Псевдо символ |
209 | D1 | ╤ | Псевдо символ |
210 | D2 | ╥ | Псевдо символ |
211 | D3 | ╙ | Псевдо символ |
212 | D4 | ╘ | Псевдо символ |
213 | D5 | ╒ | Псевдо символ |
214 | D6 | ╓ | Псевдо символ |
215 | D7 | ╫ | Псевдо символ |
216 | D8 | ╪ | Псевдо символ |
217 | D9 | ┘ | Псевдо символ |
218 | DA | ┌ | Псевдо символ |
219 | Д.Б. | █ | |
220 | DC | ▄ | |
221 | DD | ▌ | |
222 | DE | ▐ | |
223 | Д.Ф. | ▀ | |
224 | E0 | Р | Малка руска буква п |
225 | E1 | с | Малка руска буква c |
226 | E2 | T | Малка руска буква т |
227 | E3 | при | Малка руска буква u |
228 | E4 | f | Малка руска буква ф |
229 | E5 | х | Малка руска буква х |
230 | E6 | ° С | Малка руска буква c |
231 | E7 | ч | Малка руска буква h |
232 | E8 | w | Малка руска буква ш |
233 | E9 | sch | Малка руска буква u |
234 | EA | b | Малка руска буква ъ |
235 | EB | с | Малка руска буква у |
236 | ЕС | b | Малка руска буква ь |
237 | ЕД | ъъъ | Малка руска буква е |
238 | ЕЕ | Ю | Малка руска буква u |
239 | EF | аз | Малка руска буква i |
240 | F0 | Йо | Главна руска буква Йо |
241 | F1 | Йо | Малка руска буква ё |
242 | F2 | Є | |
243 | F3 | є | |
244 | F4 | Ї | |
245 | F5 | Ї | |
246 | F6 | Ў | |
247 | F7 | ў | |
248 | F8 | ° | знак за степен |
249 | F9 | ∙ | Знак за умножение (точка) |
250 | FA | · | |
251 | √ | Радикал (вземане на корен) | |
252 | FC | № | Знак за число |
253 | FD | ¤ | Валутен знак (рубла) |
254 | F.E. | ■ | |
255 | FF |
При писане на текстове, в допълнение към двоичните кодове, които директно показват букви, се използват кодове, които показват прехода към нов ред и връщането на курсора (връщане на каретката) към нулевата позиция на реда. Тези знаци обикновено се използват заедно. Техните двоични кодове съответстват на десетични числа - 10 (0A) и 13 (0D). Като пример, по-долу е част от текста на тази страница (изхвърляне на паметта). Този раздел съдържа първия параграф. Следният формат се използва за показване на информация в дъмп на паметта:
- първата колона съдържа двоичния адрес на първия байт от низа
- следващите шестнадесет колони съдържат байтовете, съдържащи се в текстовия файл. За по-удобно определяне на номера на байта след осмата колона се изчертава вертикална линия. Байтовете, за краткост, са представени в шестнадесетичен код.
- в последната колона същите тези байтове са представени като показани азбучни знаци
В горния пример можете да видите, че първият ред текст е 80 байта. Първият байт 82 съответства на буквата "B". Вторият байт E1 съответства на буквата "c". Третият байт A5 съответства на буквата "e". Следващият байт 20 представлява празното пространство между думите (интервал) " ". Байтове 81 и 82 съдържат символи за връщане на каретка и за подаване на ред 0D 0A. Намираме тези знаци на двоичния адрес 00000050: Следващият ред от изходния текст не е кратен на 16 (дължината му е 76 букви), така че, за да намерите края му, първо трябва да намерите реда 000000E0: и да преброите девет колони от него. Там отново се записват байтове за връщане на каретка и за подаване на ред 0D 0A. Останалата част от текста се анализира по абсолютно същия начин.
Дата на последна актуализация на файла 04.12.2018г
Литература:
Заедно със статията "Писане на текстове в двоичен код" те гласят:
Представяне на двоични числа в паметта на компютър или микроконтролер
http://website/proc/IntCod.php
Понякога е удобно да съхранявате числа в паметта на процесора в десетична форма.
http://website/proc/DecCod.php
Стандартни формати с плаваща запетая за компютри и микроконтролери
http://website/proc/float/
Понастоящем както позиционните, така и непозиционните числови системи се използват широко както в технологиите, така и в ежедневието.
.php
Тъй като е най-простият и отговаря на изискванията:
- Колкото по-малко стойности съществуват в системата, толкова по-лесно е да се направят отделни елементи, които работят с тези стойности. По-специално, две цифри от двоичната бройна система могат лесно да бъдат представени чрез много физически явления: има ток - няма ток, индукцията на магнитното поле е по-голяма от праговата стойност или не и т.н.
- Колкото по-нисък е броят на състоянията за даден елемент, толкова по-висока е устойчивостта на шум и толкова по-бързо може да работи. Например, за да се кодират три състояния чрез величината на индукцията на магнитното поле, ще е необходимо да се въведат две прагови стойности, които няма да допринесат за устойчивостта на шум и надеждността на съхранението на информация.
- Двоичната аритметика е доста проста. Прости са таблиците за събиране и умножение - основните операции с числата.
- Възможно е да се използва апаратът на алгебрата на логиката за извършване на битови операции с числа.
Връзки
- Онлайн калкулатор за преобразуване на числа от една бройна система в друга
Фондация Уикимедия. 2010 г.
Вижте какво е "двоичен код" в други речници:
2 битален код на сивото 00 01 11 10 3 битов код сиво 000 000 001 011 010 110 111 101 100 4 битов код сиво 0000 00 0001 0011 0010 0110 01111 0100 1100 1101 1111 1110 1010 1011 1000 Сив код на персонализиран код, в който има два съседни стойности, в които има две съседни стойности … … Wikipedia
Кодът на сигналната точка (английски Signal Point Code (SPC)) на системата за сигнализиране 7 (SS7, SS 7) е уникален (в домашната мрежа) адрес на възел, използван на третото MTP ниво (маршрутизиране) в телекомуникационните SS 7 мрежи за идентифицират ... Wikipedia
В математиката число без квадрат е число, което не се дели на квадрат, различен от 1. Например 10 е без квадрат, но 18 не е, тъй като 18 се дели на 9 = 32. Началото на поредицата от безквадратни числа е : 1, 2, 3, 5, 6, 7, ... ... Уикипедия
Искате ли да подобрите тази статия?: Уикифицирайте статията. Преработете дизайна в съответствие с правилата за писане на статии. Коригирайте статията според стилистичните правила на Уикипедия ... Уикипедия
Този термин има и други значения, вижте Python (многозначност). Езиков клас на Python: mu ... Wikipedia
В тесния смисъл на думата в момента фразата се разбира като "Атака срещу системата за сигурност" и клони по-скоро към значението на следния термин Cracker атака. Това се дължи на изкривяване на значението на думата "хакер". Хакер ... ... Уикипедия
Реших да направя такъв инструмент като конвертиране на текст в двоичен код и обратно, има такива услуги, но те обикновено работят с латиница, но моята преводачът работи с UTF-8 Unicode кодиране, който кодира кирилските знаци в два байта. Невъзможно е да се преведат китайски йероглифи, но ще поправя това злощастно недоразумение.
За преобразуване на текст в двоично представяневъведете текста в лявото поле и натиснете TEXT->BIN в дясното поле, ще се появи неговото двоично представяне.
За преобразуване на двоичен код в текствъведете кода в десния прозорец и натиснете BIN->TEXT в левия прозорец, ще се появи неговото символно представяне.
Ако конвертиране на двоичен код в текстили обратното не се получи - проверете коректността на вашите данни!
Актуализация!
Трансформацията на текста в обратен изглед вече е достъпна:
в нормален вид. За да направите това, поставете отметка в квадратчето: „Заменете 0 с интервали и 1 с контейнер █“. След това поставете текста в дясното поле: "Текст в двоично представяне" и натиснете бутона под него "BIN->TEXT".
Когато копирате такива текстове, трябва да внимавате, защото. можете лесно да загубите интервали в началото или в края. Например редът по-горе изглежда така:
██ █ █ ███████ █ ██ ██ █ █ ███ ██ █ █ ██ █ ██ █ █ ██ █ ███ █ ██ █ █ ██ █ █ ███ ██ █ █ ███ ██ █ ██
и на червен фон:
██ █ █ ███████ █ ██ ██ █ █ ███ ██ █ █ ██ █ ██ █ █ ██ █ ███ █ ██ █ █ ██ █ █ ███ ██ █ █ ███ ██ █ ██
вижте колко интервала в края могат да бъдат загубени?
Компютрите не разбират думите и числата, както хората. Съвременният софтуер позволява на крайния потребител да игнорира това, но на най-ниските нива вашият компютър работи с двоичен електрически сигнал, който има само две състояния: има или няма ток. За да „разбере“ сложни данни, вашият компютър трябва да ги кодира в двоичен код.
Двоичната система се основава на две цифри, 1 и 0, съответстващи на включени и изключени състояния, които вашият компютър може да разбере. Вероятно сте запознати с десетичната система. Той използва десет цифри, от 0 до 9, и след това преминава към следващия ред, за да формира двуцифрени числа, като цифрата от всеки ред е десет пъти по-голяма от предишната. Двоичната система е подобна, като всяка цифра е два пъти по-голяма от предишната.
Броене в двоична система
В двоична система първата цифра е еквивалентна на 1 в десетична система. Втората цифра е 2, третата е 4, четвъртата е 8 и така нататък – удвоявайки се всеки път. Добавянето на всички тези стойности ще ви даде число в десетичен формат.
1111 (двоично) = 8 + 4 + 2 + 1 = 15 (десетично)
Отчитането на 0 ни дава 16 възможни стойности за четири двоични бита. Преместете 8 бита и ще получите 256 възможни стойности. Това заема много повече място за представяне, тъй като четири цифри в десетичен знак ни дават 10 000 възможни стойности. Разбира се, двоичният код заема повече място, но компютрите разбират двоичните файлове много по-добре от десетичната система. И за някои неща, като логическа обработка, двоичната е по-добра от десетичната.
Трябва да се каже, че има друга основна система, която се използва в програмирането: шестнадесетичен. Въпреки че компютрите не работят в шестнадесетична система, програмистите я използват, за да представят двоични адреси в четим от човека формат, когато пишат код. Това е така, защото две цифри от шестнадесетично число могат да представляват цял байт, тоест те заместват осем цифри в двоична система. Шестнадесетичната система използва числата 0-9, както и буквите от A до F, за да получи допълнителни шест цифри.
Защо компютрите използват двоични файлове
Кратък отговор: хардуер и законите на физиката. Всеки знак във вашия компютър е електрически сигнал, а в ранните дни на компютрите измерването на електрическите сигнали беше много по-трудно. Беше по-разумно да се прави разлика само между състоянието "включено", представено от отрицателен заряд, и състоянието "изключено", представено от положителен заряд.
За тези, които не знаят защо "изключено" е представено от положителен заряд, това е защото електроните имат отрицателен заряд, а повече електрони означава повече ток с отрицателен заряд.
Така се използват ранни компютри с размер на стая двоични файловеда изградят своите системи и въпреки че използваха по-старо, по-обемно оборудване, те работеха на същите основни принципи. Съвременните компютри използват т.нар транзистор за извършване на изчисления с двоичен код.
Ето схема на типичен транзистор:
По принцип той позволява на тока да тече от източника към изтичането, ако има ток в портата. Това формира двоичен ключ. Производителите могат да направят тези транзистори от 5 нанометра или от две вериги на ДНК. Ето как работят съвременните процесори и дори те могат да страдат от проблеми при разграничаване между включени и изключени състояния (въпреки че това се дължи на нереалистичния им молекулен размер, подложен на странности на квантовата механика).
Защо само двоична система
Така че може би си мислите: „Защо само 0 и 1? Защо не добавите друг номер? Въпреки че това отчасти се дължи на традициите за създаване на компютри, в същото време добавянето на още една цифра би означавало необходимостта да се подчертае още едно състояние на текущото, а не само „изключено“ или „включено“.
Проблемът тук е, че ако искате да използвате няколко нива на напрежение, имате нужда от начин лесно да правите изчисления с тях, а модерният хардуер, способен да прави това, не е жизнеспособен като заместител на двоичните изчисления. Например има т.нар троен компютър, разработен през 50-те години на миналия век, но развитието спря дотук. Троична логика по-ефективен от двоичния, но все още няма ефективен заместител на двоичния транзистор или поне няма толкова малък транзистор като двоичния.
Причината да не можем да използваме троичната логика се свежда до това как транзисторите са свързани в компютъра и как се използват за математически изчисления. Транзисторът получава информация на два входа, извършва операция и връща резултата на един изход.
По този начин бинарната математика е по-лесна за компютъра от всичко друго. Двоичната логика лесно се преобразува в двоични системи, като True и False съответстват на състоянията On и Off.
Двоичната таблица на истината, работеща на двоична логика, ще има четири възможни изхода за всяка фундаментална операция. Но тъй като тройните порти използват три входа, тройната таблица на истината ще има 9 или повече. Докато двоичната система има 16 възможни оператора (2^2^2), троичната система би имала 19683 (3^3^3). Мащабирането се превръща в проблем, защото въпреки че trinity е по-ефективно, то е и експоненциално по-сложно.
Кой знае?В бъдеще може много добре да видим троични компютри, тъй като двоичната логика се сблъска с проблеми с миниатюризацията. Засега светът ще продължи да работи в двоичен режим.
Капацитет на двоичен код, Преобразуване на информация от непрекъсната в дискретна форма, Универсалност на двоичното кодиране, Единни и нееднородни кодове, Информатика 7 клас Босов, Информатика 7 клас
1.5.1. Преобразуване на информация от непрекъсната в дискретна форма
За да разреши проблемите си, човек често трябва да преобразува наличната информация от една форма на представяне в друга. Например при четене на глас информацията се преобразува от дискретна (текстова) форма в непрекъсната (звук). По време на диктовка в урок по руски език, напротив, информацията се трансформира от непрекъсната форма (глас на учителя) в дискретна (бележки на учениците).
Информацията, представена в дискретна форма, е много по-лесна за прехвърляне, съхраняване или автоматична обработка. Ето защо в компютърните технологии се обръща голямо внимание на методите за преобразуване на информация от непрекъсната форма в дискретна.
Дискретизацията на информацията е процес на преобразуване на информация от непрекъсната форма на представяне в дискретна.
Разгледайте същността на процеса на дискретизация на информацията на пример.
Метеорологичните станции разполагат със саморегистриращи се уреди за непрекъснато отчитане на атмосферното налягане. Резултатът от тяхната работа са барограми - криви, показващи как налягането се е променило за дълги периоди от време. Една от тези криви, начертана от инструмента по време на седем часа наблюдения, е показана на фиг. 1.9.
Въз основа на получената информация е възможно да се състави таблица, съдържаща показанията на инструмента в началото на измерванията и в края на всеки час наблюдения (фиг. 1.10).
Получената таблица не предоставя пълна картина на това как се е променило налягането по време на периода на наблюдение: например не е посочена най-високата стойност на налягането, възникнала през четвъртия час на наблюдение. Но ако въведете в таблицата стойностите на налягането, наблюдавани на всеки половин час или 15 минути, тогава новата таблица ще даде по-пълна картина за това как се е променило налягането.
По този начин информацията, представена в непрекъсната форма (барограма, крива), с известна загуба на точност, преобразувахме в дискретна форма (таблица).
В бъдеще ще се запознаете с методите за дискретно представяне на звукова и графична информация.
Вериги от три двоични знака се получават чрез допълване на двуцифрени двоични кодове отдясно със знак 0 или 1. В резултат на това кодовите комбинации от три двоични знака са 8 - два пъти повече, отколкото от два двоични знака:
Съответно, четири-битов двоичен файл ви позволява да получите 16 кодови комбинации, пет-битов - 32, шест-битов - 64 и т.н. Дължината на двоичната верига - броят на символите в двоичния код - е наречен битова дълбочина на двоичния код.
Забележи, че:
4 = 2 * 2,
8 = 2 * 2 * 2,
16 = 2 * 2 * 2 * 2,
32 = 2 * 2 * 2 * 2 * 2 и т.н.
Тук броят на кодовите комбинации е продукт на определен брой идентични фактори, равни на битовата дълбочина на двоичния код.
Ако броят на кодовите комбинации е обозначен с буквата N, а битовата дълбочина на двоичния код е обозначена с буквата i, тогава разкритият модел в обща форма ще бъде написан, както следва:
N = 2 * 2 * ... * 2.
i фактори
В математиката такива продукти се записват като:
N = 2i.
Запис 2 прочетох така: "2 на i-та степен."
Задача. Лидерът на племето Multi инструктира своя министър да разработи двоичен файл и да преведе в него цялата важна информация. Каква битова дълбочина би била необходима, ако азбуката, използвана от племето Multi, има 16 знака? Запишете всички кодови комбинации.
Решение. Тъй като азбуката на племето Multi се състои от 16 знака, тогава те се нуждаят от 16 кодови комбинации.В този случай дължината (разрядният капацитет) на двоичния код се определя от съотношението: 16 = 2 i . Следователно i = 4.
За да напишем всички кодови комбинации от четири 0 и 1, използваме диаграмата на фиг. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110,0111,1000,1001,1010,1011,1100,1101,1110,1111.
1.5.3. Гъвкавост на двоичното кодиране
В началото на този раздел научихте, че когато се представя в непрекъсната форма, може да се изрази с помощта на символите на някакъв естествен или формален език. На свой ред произволни знаци от азбуката могат да бъдат преобразувани в двоични. По този начин, с помощта на двоичен код, всеки може да бъде представен на естествени и формални езици, както и изображения и звуци (фиг. 1.14). Това означава универсалността на двоичното кодиране.
Двоичните кодове намират широко приложение в компютърната техника, като изискват само две състояния на електронната схема – „включено” (съответстващо на цифрата 1) и „изключено” (съответстващо на цифрата 0).
Простотата на техническата реализация е основното предимство на двоичното кодиране. Недостатъкът на двоичното кодиране е голямата дължина на получения код.
1.5.4. Единни и нееднородни кодове
Разграничаване на унифицирани и нееднородни кодове. Еднаквите кодове в кодовите комбинации съдържат еднакъв брой знаци, нечетните - различни.
По-горе разгледахме единни двоични кодове.
Пример за нееднороден код е морзовата азбука, в която за всяка буква и цифра е определена поредица от къси и дълги сигнали. И така, буквата E съответства на кратък сигнал („точка“), а буквата Ш съответства на четири дълги сигнала (четири „тирета“). Неравномерното ви позволява да увеличите скоростта на предаване на съобщения поради факта, че най-често срещаните символи в предаваната информация имат най-кратките кодови комбинации.
Информацията, дадена от този символ, е равна на ентропията на системата и е максимална в случая, когато и двете състояния са еднакво вероятни; в този случай елементарният символ предава информация 1 (двойни единици). Следователно основата на оптималното кодиране ще бъде изискването елементарните знаци в кодирания текст да се срещат средно еднакво често.
Нека опишем тук метод за конструиране на код, който удовлетворява заявеното условие; този метод е известен като кода на Шанън-Фано. Идеята му е, че кодираните знаци (букви или комбинации от букви) се разделят на две приблизително еднакво вероятни групи: за първата група от знаци 0 се поставя на първо място в комбинацията (първият знак от двоичното число, представляващо характер); за втора група - 1. По-нататък всяка група отново се разделя на две приблизително еднакво вероятни подгрупи; за символи от първата подгрупа нулата се поставя на второ място; за втора подгрупа - един и т.н.
Нека демонстрираме принципа на конструиране на кода на Шанън - Фано върху материала на руската азбука (Таблица 18.8.1). Нека преброим първите шест букви (от "-" до "t"); сумирайки техните вероятности (честоти), получаваме 0,498; всички останали букви (от "n" до "sf") ще имат приблизително същата вероятност от 0,502. Първите шест букви (от "-" до "t") ще имат на първо място двоичен знак 0. Останалите букви (от "n" до "f") ще имат единица на първо място. След това отново разделяме първата група на две приблизително еднакво вероятни подгрупи: от "-" до "o" и от "e" до "t"; за всички букви от първата подгрупа на второ място поставяме нула, а за втора подгрупа 1. Ще продължим процеса, докато във всяка подгрупа остане точно една буква, която ще бъде кодирана от определено двоично число.Конструкцията на кода механизъм е показан в таблица 18.8 .2, а самият код е даден в таблица 18.8.3.
Таблица 18.8.2.
Двоични знаци |
|||||||||
Таблица 18.8.3
Таблица 18.8.3 може да кодира и декодира всяко съобщение.
Като пример, нека напишем фразата в двоичен код: "теория на информацията"
01110100001101000110110110000
0110100011111111100110100
1100001011111110101100110
Имайте предвид, че тук няма нужда да отделяте буквите една от друга със специален знак, тъй като дори и без това декодиране се извършва недвусмислено. Това може да се провери чрез декодиране на следната фраза с помощта на таблица 18.8.2:
10011100110011001001111010000
1011100111001001101010000110101
010110000110110110
("метод на кодиране").
Все пак трябва да се отбележи, че всяка грешка в кодирането (случайно объркване на знаци 0 и 1) с такъв код е фатална, тъй като декодирането на целия текст след грешката става невъзможно. Следователно този принцип на кодиране може да се препоръча само в случай, че грешките при кодирането и предаването на съобщението са практически изключени.
Възниква естествен въпрос: наистина ли е оптимален кодът, който сме компилирали при липса на грешки? За да отговорим на този въпрос, нека намерим средната информация за един елементарен символ (0 или 1) и я сравним с максимално възможната информация, която е равна на една двоична единица. За да направим това, първо намираме средната информация, съдържаща се в една буква от предавания текст, т.е. ентропията на буква:
,
където е вероятността буквата да приеме определено състояние (“-”, o, e, a, ..., f).
От табл. 18.8.1 имаме
(по две единици на буква от текста).
Съгласно таблица 18.8.2 определяме средния брой елементарни знаци на буква
Разделяйки ентропията на, получаваме информация за елементарен символ
(две единици).
По този начин информацията за символ е много близо до горната си граница от 1, а кодът, който сме избрали, е много близо до оптималния. Оставайки в границите на задачата за кодиране с букви, не можем да получим нищо по-добро.
Обърнете внимание, че в случай на кодиране само на двоични числа от букви, ще имаме изображение на всяка буква с пет двоични знака и информацията за всеки знак ще бъде
(две единици),
т.е. значително по-малко, отколкото при оптимално буквено кодиране.
Все пак трябва да се отбележи, че правописното кодиране изобщо не е икономично. Факт е, че винаги има зависимост между съседните букви на всеки смислен текст. Например гласна на руски не може да бъде последвана от "ъ" или "ь"; след съскане "I" или "yu" не могат да издържат; след няколко съгласни подред се увеличава вероятността за гласна и т.н.
Знаем, че когато зависимите системи се комбинират, общата ентропия е по-малка от сбора на ентропиите на отделните системи; следователно информацията, предадена от част от свързан текст, винаги е по-малка от информацията за знак, умножена по броя на знаците. Като се има предвид това обстоятелство, може да се конструира по-икономичен код, ако не се кодира всяка буква отделно, а цели „блокове“ от букви. Например, в руския текст има смисъл да се кодират изцяло някои често срещани комбинации от букви, като "ts", "ает", "nie" и т.н. Кодираните блокове са подредени в низходящ ред на честотите, като буквите в табл. 18.8.1, а двоичното кодиране се извършва по същия принцип.
В някои случаи се оказва разумно да се кодират дори не блокове от букви, а цели смислени части от текст. Например, за да разтоварите телеграфната служба по празниците, препоръчително е да кодирате цели стандартни текстове с условни числа, като например:
„Честита Нова година, желая ви много здраве и успехи в работата.
Без да се спираме конкретно на методите за блоково кодиране, ние се ограничаваме до формулирането на свързаната теорема на Шанън.
Нека има източник на информация и приемник, свързани с комуникационен канал (фиг. 18.8.1).
Ефективността на източника на информация е известна, т.е. средният брой двоични единици информация, идващи от източника за единица време (числено е равен на средната ентропия на съобщението, произведено от източниците за единица време). Нека освен това е известен капацитетът на канала, т.е. максималното количество информация (например двоични знаци 0 или 1), което каналът може да предаде за една и съща единица време. Възниква въпросът: каква трябва да бъде честотната лента на канала, за да може той да се "справи" със задачата си, т.е. информацията от източника до приемника да пристига без забавяне?
Отговорът на този въпрос се дава от първата теорема на Шанън. Ние го формулираме тук без доказателство.
1-ва теорема на Шанън
Ако честотната лента на комуникационния канал е по-голяма от ентропията на източника на информация за единица време
тогава винаги е възможно да се кодира достатъчно дълго съобщение, така че да бъде предадено от комуникационния канал без забавяне. Ако, напротив,
тогава предаването на информация без забавяне е невъзможно.