Всички знаци и букви могат да бъдат кодирани с помощта на осем двоични бита. Най-често срещаните таблици за представяне на букви в двоичен код са ASCII и ANSI, те могат да се използват за писане на текстове в микропроцесори. В ASCII и ANSI таблиците първите 128 знака са еднакви. Тази част от таблицата съдържа кодове за цифри, препинателни знаци, главни и малки латински букви и контролни знаци. Националните разширения на таблици със знаци и псевдографски символи се съдържат в последните 128 кода на тези таблици, така че руските текстове в операционните системи DOS и WINDOWS не съвпадат.

При първото запознаване с компютри и микропроцесори може да възникне въпросът - "как да конвертирате текст в двоичен код?" Тази трансформация обаче е най-простото действие! За да направите това, трябва да използвате всеки текстов редактор. Включването на най-простата програма за бележник, която е част от операционната система Windows, също е подходяща. Подобни редактори присъстват във всички програмни среди за езици като C, Pascal или Java. Трябва да се отбележи, че най-често срещаният текстов редактор Word не е подходящ за просто преобразуване на текст в двоичен код. Този тестов редактор въвежда огромно количество допълнителна информация, като цвета на буквите, курсив, подчертаване, езика, на който е написана определена фраза, и шрифта.

Трябва да се отбележи, че всъщност комбинацията от нули и единици, с помощта на които се кодира текстовата информация, не е двоичен код, т.к. битовете в този код не се подчиняват на законите. В интернет обаче най-често се среща фразата за търсене „представяне на букви в двоичен код“. Таблица 1 показва съответствието на двоичните кодове с буквите от латинската азбука. За краткост последователността от нули и единици в тази таблица е представена в десетични и шестнадесетични кодове.

маса 1Таблица за представяне на латински букви в двоичен код (ASCII)

Десетичен код Шестнадесетичен код Характер на дисплея Значение
0 00 NUL
1 01 (показва контролна дума)
2 02 (Първата предадена дума)
3 03 ETX (последна дума за предаване)
4 04 EOT (край на предаването)
5 05 ENQ (инициализация)
6 06 ACK (потвърждение)
7 07 БЕЛ
8 08 BS
9 09 HT (хоризонтален раздел
10 LF (подаване на ред)
11 VT (вертикален раздел)
12 FF (следваща страница)
13 0D CR (връщане на каретка)
14 0E SO (двойна ширина)
15 0F SI (кондензирано уплътнение)
16 10 DLE
17 11 DC1
18 12 DC2 (Отмяна на съкратен печат)
19 13 DC3 (готов)
20 14 DC4 (отмяна на двойна ширина)
21 15 § NAC (без потвърждение)
22 16 SYN
23 17 ETB
24 18 МОГА
25 19 ЕМ
26 ПОДП
27 ESC (контрол на последователността на стартиране)
28 1C FS
29 1D GS
30 1E RS
31 1F НАС
32 20 пространство
33 21 ! Удивителен знак
34 22 « ъглова скоба
35 23 # Знак за число
36 24 $ Знак за валута (долар)
37 25 % Знак за процент
38 26 & амперсанд
39 27 " апостроф
40 28 ( отваряща скоба
41 29 ) Затворете скоби
42 * звезда
43 2B + знак плюс
44 2C , Запетая
45 2D - Знак минус
46 2E . Точка
47 2F / Дробна лента
48 30 0 Числова нула
49 31 1 номер едно
50 32 2 Номер две
51 33 3 номер три
52 34 4 Номер четири
53 35 5 Номер пет
54 36 6 Номер шест
55 37 7 Номер седем
56 38 8 Номер осем
57 39 9 Номер девет
58 : Дебело черво
59 3B ; точка и запетая
60 3C < знак по-малко
61 3D = знак за равенство
62 3E > Подпишете повече
63 3F ? въпросителен знак
64 40 @ Търговски етаж
65 41 А Главна латинска буква А
66 42 б главна латинска буква B
67 43 ° С латинска главна буква C
68 44 д Главна латинска буква D
69 45 д латинска главна буква E
70 46 Е главна латинска буква F
71 47 Ж главна латинска буква G
72 48 з главна латинска буква H
73 49 аз Главна латинска буква I
74 Дж латинска главна буква J
75 4B К Главна латинска буква K
76 4C Л Главна латинска буква L
77 4D М Главна латинска буква
78 4E н Главна латинска буква N
79 4F О Главна латинска буква O
80 50 П главна латинска буква P
81 51 Q Главна латинска буква
82 52 Р латинска главна буква R
83 53 С Главна латинска буква S
84 54 T главна латинска буква Т
85 55 U латинска главна буква U
86 56 V Главна латинска буква V
87 57 У Главна латинска буква W
88 58 х Главна латинска буква X
89 59 Y Главна латинска буква Y
90 З Главна латинска буква Z
91 5B [ Отваряща квадратна скоба
92 5C \ Наклонена черта
93 5 Д ] Затваряща квадратна скоба
94 5E ^ "капак"
95 5 _ Долна черта
96 60 ` апостроф
97 61 а малка латинска буква a
98 62 b малка латинска буква b
99 63 ° С малка латинска буква c
100 64 д малка латинска буква d
101 65 д малка латинска буква e
102 66 f малка латинска буква f
103 67 ж малка латинска буква g
104 68 ч малка латинска буква h
105 69 аз малка латинска буква i
106 й малка латинска буква j
107 6B к малка латинска буква k
108 6C л малка латинска буква l
109 6D м малка латинска буква m
110 6E н малка латинска буква n
111 6F о малка латинска буква o
112 70 стр малка латинска буква p
113 71 р малка латинска буква q
114 72 r малка латинска буква r
115 73 с малка латинска буква s
116 74 T малка латинска буква t
117 75 u малка латинска буква u
118 76 v малка латинска буква v
119 77 w малка латинска буква w
120 78 х малка латинска буква x
121 79 г малка латинска буква y
122 z малка латинска буква z
123 7B { Отворена къдрава скоба
124 | вертикална лента
125 7D } Затворете къдрава скоба
126 7E ~ Тилда
127 7F

В класическата версия на таблицата със символи ASCII няма руски букви и се състои от 7 бита. По-късно обаче тази таблица беше разширена до 8 бита, а в горните 128 реда се появиха руски букви в двоичен код и псевдографски символи. В общия случай втората част съдържа националните азбуки на различни страни и руските букви са само един от възможните набори (855), може да има френска (863), немска (1141) или гръцка (737) таблица. Таблица 2 показва пример за представяне на руски букви в двоичен код.

Таблица 2.Таблица за представяне на руски букви в двоичен код (ASCII)

Десетичен код Шестнадесетичен код Характер на дисплея Значение
128 80 НО Главна руска буква А
129 81 б Главна руска буква Б
130 82 AT Главна руска буква V
131 83 Ж Главна руска буква Г
132 84 д Главна руска буква Д
133 85 д Главна руска буква Е
134 86 И Главна руска буква Ж
135 87 З Главна руска буква Z
136 88 И Главна руска буква I
137 89 Y Главна руска буква Y
138 Да се Главна руска буква К
139 8B Л Главна руска буква Л
140 8C М Главна руска буква М
141 8D з Главна руска буква Н
142 8E О Главна руска буква О
143 8F П Главна руска буква П
144 90 Р Главна руска буква Р
145 91 ОТ Главна руска буква С
146 92 T Главна руска буква Т
147 93 При Главна руска буква U
148 94 Е Главна руска буква Ф
149 95 х Главна руска буква X
150 96 ° С Главна руска буква С
151 97 з Главна руска буква Ch
152 98 У Главна руска буква Ш
153 99 SCH Главна руска буква Ш
154 Комерсант Главна руска буква Ъ
155 9B С Главна руска буква Y
156 9C b Главна руска буква б
157 9D д Главна руска буква Е
158 9E Ю Главна руска буква Ю
159 9F аз Главна руска буква Я
160 A0 а Малка руска буква а
161 A1 b Малка руска буква б
162 A2 в Малка руска буква v
163 A3 Ж Малка руска буква г
164 A4 д Малка руска буква d
165 A5 д Малка руска буква е
166 A6 и Малка руска буква ж
167 A7 ч Малка руска буква з
168 A8 и Малка руска буква и
169 A9 th Малка руска буква у
170 АА да се Малка руска буква к
171 AB л Малка руска буква л
172 AC м Малка руска буква м
173 AD н Малка руска буква n
174 AE относно Малка руска буква о
175 AF П Малка руска буква п
176 B0
177 B1
178 B2
179 B3 Псевдо символ
180 B4 Псевдо символ
181 B5 Псевдо символ
182 B6 Псевдо символ
183 B7 Псевдо символ
184 B8 Псевдо символ
185 B9 Псевдо символ
186 BA Псевдо символ
187 BB Псевдо символ
188 пр.н.е Псевдо символ
189 BD Псевдо символ
190 БЪДА Псевдо символ
191 bf Псевдо символ
192 C0 Псевдо символ
193 C1 Псевдо символ
194 C2 Псевдо символ
195 C3 Псевдо символ
196 C4 Псевдо символ
197 C5 Псевдо символ
198 C6 Псевдо символ
199 C7 Псевдо символ
200 C8 Псевдо символ
201 C9 Псевдо символ
202 CA Псевдо символ
203 CB Псевдо символ
204 CC Псевдо символ
205 CD Псевдо символ
206 CE Псевдо символ
207 CF Псевдо символ
208 D0 Псевдо символ
209 D1 Псевдо символ
210 D2 Псевдо символ
211 D3 Псевдо символ
212 D4 Псевдо символ
213 D5 Псевдо символ
214 D6 Псевдо символ
215 D7 Псевдо символ
216 D8 Псевдо символ
217 D9 Псевдо символ
218 DA Псевдо символ
219 Д.Б.
220 DC
221 DD
222 DE
223 Д.Ф.
224 E0 Р Малка руска буква п
225 E1 с Малка руска буква c
226 E2 T Малка руска буква т
227 E3 при Малка руска буква u
228 E4 f Малка руска буква ф
229 E5 х Малка руска буква х
230 E6 ° С Малка руска буква c
231 E7 ч Малка руска буква h
232 E8 w Малка руска буква ш
233 E9 sch Малка руска буква u
234 EA b Малка руска буква ъ
235 EB с Малка руска буква у
236 ЕС b Малка руска буква ь
237 ЕД ъъъ Малка руска буква е
238 ЕЕ Ю Малка руска буква u
239 EF аз Малка руска буква i
240 F0 Йо Главна руска буква Йо
241 F1 Йо Малка руска буква ё
242 F2 Є
243 F3 є
244 F4 Ї
245 F5 Ї
246 F6 Ў
247 F7 ў
248 F8 ° знак за степен
249 F9 Знак за умножение (точка)
250 FA ·
251 Facebook Радикал (вземане на корен)
252 FC Знак за число
253 FD ¤ Валутен знак (рубла)
254 F.E.
255 FF

При писане на текстове, в допълнение към двоичните кодове, които директно показват букви, се използват кодове, които показват прехода към нов ред и връщането на курсора (връщане на каретката) към нулевата позиция на реда. Тези знаци обикновено се използват заедно. Техните двоични кодове съответстват на десетични числа - 10 (0A) и 13 (0D). Като пример, по-долу е част от текста на тази страница (изхвърляне на паметта). Този раздел съдържа първия параграф. Следният формат се използва за показване на информация в дъмп на паметта:

  • първата колона съдържа двоичния адрес на първия байт от низа
  • следващите шестнадесет колони съдържат байтовете, съдържащи се в текстовия файл. За по-удобно определяне на номера на байта след осмата колона се изчертава вертикална линия. Байтовете, за краткост, са представени в шестнадесетичен код.
  • в последната колона същите тези байтове са представени като показани азбучни знаци
00000000: 82 E1 A5 20 E1 A8 AC A2 ¦ AE AB EB 20 A8 20 A1 E3 Всички знаци и bu AE A4 A8 E0 AE A2 ¦ A0 AD EB 20 AF E0 A8 20 кодиран с 00000030: AF AE AC AE E9 A8 20 A2 ¦ AE E1 EC AC A8 20 A4 A2 00000040: AE A8 E7 AD EB E5 20 E1 ¦ A8 AC A2 AE AB AE A2 2E 00000050: 0D 0A 8D A0 A8 A1 AE AB ¦ A5 A5 20 E0 A0 E1 AF E0 AC A8 20 EF ¦ A2 AB EF EE E2 E1 EF 20 души са 00000080: E2 A0 A1 AB A8 E6 EB 20 ¦ 41 53 43 49 49 20 E1 20 ASCII таблици с 00000090: AD A0 E6 A8 AE AD A0 AB ¦ EC AD EB AC A8 0D 0A E0 национален♪◙p 000000A0: A0 E1 E8 A8 E0 A5 AD A8 ¦ EF AC A8 2C 20 AF E0 A8 разширения, при 000000B0: AC A5 AD EF EE E9 A8 A5 ¦ E1 EF 20 A2 20 44 4F 53 промяна в DOS 000000C0: 20 28 A8 20 AA AE E2 AE ¦ E0 EB A5 20 AC AE A6 AD (и което може да бъде 000000D0: AE 20 A8 E1 AF AE AB EC ¦ A7 AE A2 A0 E2 EC 20 A4 : AB EF 20 A7 A0 AF A8 E1 ¦ A8 0D 0A E2 A5 AA E1 E2 Write♪◙text 000000F0: AE A2 20 A2 20 AC A8 AA ¦ E0 AE AF E0 AE E6 A5 E1 A0 E5 29 2C 20 ¦ A8 20 E2 A0 A1 AB A8 E6 sop), и таблици 00000110: EB 20 41 4E 53 49 2C 20 ¦ AF E0 A8 AC A5 AD EF EE s ANSI, приложете 000 00120: E9 A8 A5 E1 EF 20 A2 20 ¦ 57 49 4E 44 4F 57 53 2E налични в WINDOWS. 00000130: 20 82 20 E2 A0 A1 AB A8 ¦ E6 A0 E5 0D 0A 41 53 43 31 32 38 20 E1 A8 AC ¦ A2 AE AB AE A2 20 E1 AE 128 знака от 00000160: A2 AF A0 A4 A0 EE E2 20 ¦ 82 20 ED E2 AE A9 20 В този 00000170: E7 A0 E1 E2 A8 20 E2 A0 ¦ A1 AB A8 E6 EB 20 E1 AE части от таблицата с 00000180: A4 A5 E0 A6 A0 E2 E1 EF ¦ 0D 0A E1 A8 AC A2 AE AB символа ♪◙ 00000190 : EB се запазва 20 E6 A8 E4 E0 2C 20 ¦ A7 AD A0 AA AE A2 20 AF цифри, знаци n 000001A0: E0 A5 AF A8 AD A0 AD A8 ¦ EF 2C 20 AB A0 E2 A8 AD повторение, латиница 000001B0: E1 AA A8 A5 20 A1 E3 AA ¦ A2 EB 20 A2 A5 E0 E5 AD Горен 000001C0: A5 A3 AE 20 A8 20 AD A8 ¦ A6 AD A5 A3 AE 20 E0 A5 Долен D 000001D0: A3 A8 E1 E2 E0 AE A2 20 ¦ A8 0D 0A E3 AF E0 A0 A2 хистер и♪◙контрол 000001E0: AB EF EE E9 A8 A5 20 E1 ¦ A8 AC A2 AE AB EB 2E 20 знака. 000001F0: 8D A0 E6 A8 AE AD A0 AB ¦ EC AD EB A5 20 E0 A0 E1 Национални състезания 00000200: E8 A8 E0 A5 AD A8 EF 20 ¦ E1 A8 AC A2 AE AB EC AD разширения на символи AB A8 ¦ E6 20 A8 20 E1 A8 AC A2 таблици и символи 00000220: AE AB EB 0D 0A AF E1 A5 ¦ A2 A4 AE A3 E0 A0 E4 A8 oly♪◙псевдографика 00000230: AA A8 20 E1 AE A4 A5 E0 ¦ A6 A0 E2 E1 EF 20 A2 20 ki съдържа в 00000240: AF AE E1 AB A5 A4 AD A8 ¦ E5 20 31 32 38 20 AA AE последни 128 ko 00000250: A4 A0 E5 20 ED E2 A8 E5 ¦ 20 E2 A0 A1 AB A8 E6 2C дадени тези таблици, 00000260: 20 AF AE ED E2 AE AC E3 ¦ 20 E0 E3 E1 E1 AA A8 A5 следователно руски 00000270: 0D 0A E2 A5 AA E1 E2 EB ¦ 20 A2 20 AE AF A5 E0 A0 ♪◙ текстове в opera 00000280 : E6 A8 AE AD AD EB E5 20 ¦ E1 A8 E1 E2 A5 AC A0 E5 AF A0 A4 ¦ A0 EE E2 2E 0D 0A не съвпадат. ♪◙

В горния пример можете да видите, че първият ред текст е 80 байта. Първият байт 82 съответства на буквата "B". Вторият байт E1 съответства на буквата "c". Третият байт A5 съответства на буквата "e". Следващият байт 20 представлява празното пространство между думите (интервал) " ". Байтове 81 и 82 съдържат символи за връщане на каретка и за подаване на ред 0D 0A. Намираме тези знаци на двоичния адрес 00000050: Следващият ред от изходния текст не е кратен на 16 (дължината му е 76 букви), така че, за да намерите края му, първо трябва да намерите реда 000000E0: и да преброите девет колони от него. Там отново се записват байтове за връщане на каретка и за подаване на ред 0D 0A. Останалата част от текста се анализира по абсолютно същия начин.

Дата на последна актуализация на файла 04.12.2018г

Литература:

Заедно със статията "Писане на текстове в двоичен код" те гласят:

Представяне на двоични числа в паметта на компютър или микроконтролер
http://website/proc/IntCod.php

Понякога е удобно да съхранявате числа в паметта на процесора в десетична форма.
http://website/proc/DecCod.php

Стандартни формати с плаваща запетая за компютри и микроконтролери
http://website/proc/float/

Понастоящем както позиционните, така и непозиционните числови системи се използват широко както в технологиите, така и в ежедневието.
.php

Тъй като е най-простият и отговаря на изискванията:

  • Колкото по-малко стойности съществуват в системата, толкова по-лесно е да се направят отделни елементи, които работят с тези стойности. По-специално, две цифри от двоичната бройна система могат лесно да бъдат представени чрез много физически явления: има ток - няма ток, индукцията на магнитното поле е по-голяма от праговата стойност или не и т.н.
  • Колкото по-нисък е броят на състоянията за даден елемент, толкова по-висока е устойчивостта на шум и толкова по-бързо може да работи. Например, за да се кодират три състояния чрез величината на индукцията на магнитното поле, ще е необходимо да се въведат две прагови стойности, които няма да допринесат за устойчивостта на шум и надеждността на съхранението на информация.
  • Двоичната аритметика е доста проста. Прости са таблиците за събиране и умножение - основните операции с числата.
  • Възможно е да се използва апаратът на алгебрата на логиката за извършване на битови операции с числа.

Връзки

  • Онлайн калкулатор за преобразуване на числа от една бройна система в друга

Фондация Уикимедия. 2010 г.

Вижте какво е "двоичен код" в други речници:

    2 битален код на сивото 00 01 11 10 3 битов код сиво 000 000 001 011 010 110 111 101 100 4 битов код сиво 0000 00 0001 0011 0010 0110 01111 0100 1100 1101 1111 1110 1010 1011 1000 Сив код на персонализиран код, в който има два съседни стойности, в които има две съседни стойности … … Wikipedia

    Кодът на сигналната точка (английски Signal Point Code (SPC)) на системата за сигнализиране 7 (SS7, SS 7) е уникален (в домашната мрежа) адрес на възел, използван на третото MTP ниво (маршрутизиране) в телекомуникационните SS 7 мрежи за идентифицират ... Wikipedia

    В математиката число без квадрат е число, което не се дели на квадрат, различен от 1. Например 10 е без квадрат, но 18 не е, тъй като 18 се дели на 9 = 32. Началото на поредицата от безквадратни числа е : 1, 2, 3, 5, 6, 7, ... ... Уикипедия

    Искате ли да подобрите тази статия?: Уикифицирайте статията. Преработете дизайна в съответствие с правилата за писане на статии. Коригирайте статията според стилистичните правила на Уикипедия ... Уикипедия

    Този термин има и други значения, вижте Python (многозначност). Езиков клас на Python: mu ... Wikipedia

    В тесния смисъл на думата в момента фразата се разбира като "Атака срещу системата за сигурност" и клони по-скоро към значението на следния термин Cracker атака. Това се дължи на изкривяване на значението на думата "хакер". Хакер ... ... Уикипедия

Реших да направя такъв инструмент като конвертиране на текст в двоичен код и обратно, има такива услуги, но те обикновено работят с латиница, но моята преводачът работи с UTF-8 Unicode кодиране, който кодира кирилските знаци в два байта. Невъзможно е да се преведат китайски йероглифи, но ще поправя това злощастно недоразумение.

За преобразуване на текст в двоично представяневъведете текста в лявото поле и натиснете TEXT->BIN в дясното поле, ще се появи неговото двоично представяне.

За преобразуване на двоичен код в текствъведете кода в десния прозорец и натиснете BIN->TEXT в левия прозорец, ще се появи неговото символно представяне.

Ако конвертиране на двоичен код в текстили обратното не се получи - проверете коректността на вашите данни!

Актуализация!

Трансформацията на текста в обратен изглед вече е достъпна:

в нормален вид. За да направите това, поставете отметка в квадратчето: „Заменете 0 с интервали и 1 с контейнер █“. След това поставете текста в дясното поле: "Текст в двоично представяне" и натиснете бутона под него "BIN->TEXT".

Когато копирате такива текстове, трябва да внимавате, защото. можете лесно да загубите интервали в началото или в края. Например редът по-горе изглежда така:

██ █ █ ███████ █ ██ ██ █ █ ███ ██ █ █ ██ █ ██ █ █ ██ █ ███ █ ██ █ █ ██ █ █ ███ ██ █ █ ███ ██ █ ██

и на червен фон:

██ █ █ ███████ █ ██ ██ █ █ ███ ██ █ █ ██ █ ██ █ █ ██ █ ███ █ ██ █ █ ██ █ █ ███ ██ █ █ ███ ██ █ ██

вижте колко интервала в края могат да бъдат загубени?

Компютрите не разбират думите и числата, както хората. Съвременният софтуер позволява на крайния потребител да игнорира това, но на най-ниските нива вашият компютър работи с двоичен електрически сигнал, който има само две състояния: има или няма ток. За да „разбере“ сложни данни, вашият компютър трябва да ги кодира в двоичен код.

Двоичната система се основава на две цифри, 1 и 0, съответстващи на включени и изключени състояния, които вашият компютър може да разбере. Вероятно сте запознати с десетичната система. Той използва десет цифри, от 0 до 9, и след това преминава към следващия ред, за да формира двуцифрени числа, като цифрата от всеки ред е десет пъти по-голяма от предишната. Двоичната система е подобна, като всяка цифра е два пъти по-голяма от предишната.

Броене в двоична система

В двоична система първата цифра е еквивалентна на 1 в десетична система. Втората цифра е 2, третата е 4, четвъртата е 8 и така нататък – удвоявайки се всеки път. Добавянето на всички тези стойности ще ви даде число в десетичен формат.

1111 (двоично) = 8 + 4 + 2 + 1 = 15 (десетично)

Отчитането на 0 ни дава 16 възможни стойности за четири двоични бита. Преместете 8 бита и ще получите 256 възможни стойности. Това заема много повече място за представяне, тъй като четири цифри в десетичен знак ни дават 10 000 възможни стойности. Разбира се, двоичният код заема повече място, но компютрите разбират двоичните файлове много по-добре от десетичната система. И за някои неща, като логическа обработка, двоичната е по-добра от десетичната.

Трябва да се каже, че има друга основна система, която се използва в програмирането: шестнадесетичен. Въпреки че компютрите не работят в шестнадесетична система, програмистите я използват, за да представят двоични адреси в четим от човека формат, когато пишат код. Това е така, защото две цифри от шестнадесетично число могат да представляват цял ​​байт, тоест те заместват осем цифри в двоична система. Шестнадесетичната система използва числата 0-9, както и буквите от A до F, за да получи допълнителни шест цифри.

Защо компютрите използват двоични файлове

Кратък отговор: хардуер и законите на физиката. Всеки знак във вашия компютър е електрически сигнал, а в ранните дни на компютрите измерването на електрическите сигнали беше много по-трудно. Беше по-разумно да се прави разлика само между състоянието "включено", представено от отрицателен заряд, и състоянието "изключено", представено от положителен заряд.

За тези, които не знаят защо "изключено" е представено от положителен заряд, това е защото електроните имат отрицателен заряд, а повече електрони означава повече ток с отрицателен заряд.

Така се използват ранни компютри с размер на стая двоични файловеда изградят своите системи и въпреки че използваха по-старо, по-обемно оборудване, те работеха на същите основни принципи. Съвременните компютри използват т.нар транзистор за извършване на изчисления с двоичен код.

Ето схема на типичен транзистор:

По принцип той позволява на тока да тече от източника към изтичането, ако има ток в портата. Това формира двоичен ключ. Производителите могат да направят тези транзистори от 5 нанометра или от две вериги на ДНК. Ето как работят съвременните процесори и дори те могат да страдат от проблеми при разграничаване между включени и изключени състояния (въпреки че това се дължи на нереалистичния им молекулен размер, подложен на странности на квантовата механика).

Защо само двоична система

Така че може би си мислите: „Защо само 0 и 1? Защо не добавите друг номер? Въпреки че това отчасти се дължи на традициите за създаване на компютри, в същото време добавянето на още една цифра би означавало необходимостта да се подчертае още едно състояние на текущото, а не само „изключено“ или „включено“.

Проблемът тук е, че ако искате да използвате няколко нива на напрежение, имате нужда от начин лесно да правите изчисления с тях, а модерният хардуер, способен да прави това, не е жизнеспособен като заместител на двоичните изчисления. Например има т.нар троен компютър, разработен през 50-те години на миналия век, но развитието спря дотук. Троична логика по-ефективен от двоичния, но все още няма ефективен заместител на двоичния транзистор или поне няма толкова малък транзистор като двоичния.

Причината да не можем да използваме троичната логика се свежда до това как транзисторите са свързани в компютъра и как се използват за математически изчисления. Транзисторът получава информация на два входа, извършва операция и връща резултата на един изход.

По този начин бинарната математика е по-лесна за компютъра от всичко друго. Двоичната логика лесно се преобразува в двоични системи, като True и False съответстват на състоянията On и Off.

Двоичната таблица на истината, работеща на двоична логика, ще има четири възможни изхода за всяка фундаментална операция. Но тъй като тройните порти използват три входа, тройната таблица на истината ще има 9 или повече. Докато двоичната система има 16 възможни оператора (2^2^2), троичната система би имала 19683 (3^3^3). Мащабирането се превръща в проблем, защото въпреки че trinity е по-ефективно, то е и експоненциално по-сложно.

Кой знае?В бъдеще може много добре да видим троични компютри, тъй като двоичната логика се сблъска с проблеми с миниатюризацията. Засега светът ще продължи да работи в двоичен режим.

Капацитет на двоичен код, Преобразуване на информация от непрекъсната в дискретна форма, Универсалност на двоичното кодиране, Единни и нееднородни кодове, Информатика 7 клас Босов, Информатика 7 клас

1.5.1. Преобразуване на информация от непрекъсната в дискретна форма
За да разреши проблемите си, човек често трябва да преобразува наличната информация от една форма на представяне в друга. Например при четене на глас информацията се преобразува от дискретна (текстова) форма в непрекъсната (звук). По време на диктовка в урок по руски език, напротив, информацията се трансформира от непрекъсната форма (глас на учителя) в дискретна (бележки на учениците).
Информацията, представена в дискретна форма, е много по-лесна за прехвърляне, съхраняване или автоматична обработка. Ето защо в компютърните технологии се обръща голямо внимание на методите за преобразуване на информация от непрекъсната форма в дискретна.
Дискретизацията на информацията е процес на преобразуване на информация от непрекъсната форма на представяне в дискретна.
Разгледайте същността на процеса на дискретизация на информацията на пример.
Метеорологичните станции разполагат със саморегистриращи се уреди за непрекъснато отчитане на атмосферното налягане. Резултатът от тяхната работа са барограми - криви, показващи как налягането се е променило за дълги периоди от време. Една от тези криви, начертана от инструмента по време на седем часа наблюдения, е показана на фиг. 1.9.

Въз основа на получената информация е възможно да се състави таблица, съдържаща показанията на инструмента в началото на измерванията и в края на всеки час наблюдения (фиг. 1.10).

Получената таблица не предоставя пълна картина на това как се е променило налягането по време на периода на наблюдение: например не е посочена най-високата стойност на налягането, възникнала през четвъртия час на наблюдение. Но ако въведете в таблицата стойностите на налягането, наблюдавани на всеки половин час или 15 минути, тогава новата таблица ще даде по-пълна картина за това как се е променило налягането.
По този начин информацията, представена в непрекъсната форма (барограма, крива), с известна загуба на точност, преобразувахме в дискретна форма (таблица).
В бъдеще ще се запознаете с методите за дискретно представяне на звукова и графична информация.

Вериги от три двоични знака се получават чрез допълване на двуцифрени двоични кодове отдясно със знак 0 или 1. В резултат на това кодовите комбинации от три двоични знака са 8 - два пъти повече, отколкото от два двоични знака:
Съответно, четири-битов двоичен файл ви позволява да получите 16 кодови комбинации, пет-битов - 32, шест-битов - 64 и т.н. Дължината на двоичната верига - броят на символите в двоичния код - е наречен битова дълбочина на двоичния код.
Забележи, че:
4 = 2 * 2,
8 = 2 * 2 * 2,
16 = 2 * 2 * 2 * 2,
32 = 2 * 2 * 2 * 2 * 2 и т.н.
Тук броят на кодовите комбинации е продукт на определен брой идентични фактори, равни на битовата дълбочина на двоичния код.
Ако броят на кодовите комбинации е обозначен с буквата N, а битовата дълбочина на двоичния код е обозначена с буквата i, тогава разкритият модел в обща форма ще бъде написан, както следва:
N = 2 * 2 * ... * 2.
i фактори
В математиката такива продукти се записват като:
N = 2i.
Запис 2 прочетох така: "2 на i-та степен."

Задача. Лидерът на племето Multi инструктира своя министър да разработи двоичен файл и да преведе в него цялата важна информация. Каква битова дълбочина би била необходима, ако азбуката, използвана от племето Multi, има 16 знака? Запишете всички кодови комбинации.
Решение. Тъй като азбуката на племето Multi се състои от 16 знака, тогава те се нуждаят от 16 кодови комбинации.В този случай дължината (разрядният капацитет) на двоичния код се определя от съотношението: 16 = 2 i . Следователно i = 4.
За да напишем всички кодови комбинации от четири 0 и 1, използваме диаграмата на фиг. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110,0111,1000,1001,1010,1011,1100,1101,1110,1111.

1.5.3. Гъвкавост на двоичното кодиране
В началото на този раздел научихте, че когато се представя в непрекъсната форма, може да се изрази с помощта на символите на някакъв естествен или формален език. На свой ред произволни знаци от азбуката могат да бъдат преобразувани в двоични. По този начин, с помощта на двоичен код, всеки може да бъде представен на естествени и формални езици, както и изображения и звуци (фиг. 1.14). Това означава универсалността на двоичното кодиране.
Двоичните кодове намират широко приложение в компютърната техника, като изискват само две състояния на електронната схема – „включено” (съответстващо на цифрата 1) и „изключено” (съответстващо на цифрата 0).
Простотата на техническата реализация е основното предимство на двоичното кодиране. Недостатъкът на двоичното кодиране е голямата дължина на получения код.

1.5.4. Единни и нееднородни кодове
Разграничаване на унифицирани и нееднородни кодове. Еднаквите кодове в кодовите комбинации съдържат еднакъв брой знаци, нечетните - различни.
По-горе разгледахме единни двоични кодове.
Пример за нееднороден код е морзовата азбука, в която за всяка буква и цифра е определена поредица от къси и дълги сигнали. И така, буквата E съответства на кратък сигнал („точка“), а буквата Ш съответства на четири дълги сигнала (четири „тирета“). Неравномерното ви позволява да увеличите скоростта на предаване на съобщения поради факта, че най-често срещаните символи в предаваната информация имат най-кратките кодови комбинации.

Информацията, дадена от този символ, е равна на ентропията на системата и е максимална в случая, когато и двете състояния са еднакво вероятни; в този случай елементарният символ предава информация 1 (двойни единици). Следователно основата на оптималното кодиране ще бъде изискването елементарните знаци в кодирания текст да се срещат средно еднакво често.

Нека опишем тук метод за конструиране на код, който удовлетворява заявеното условие; този метод е известен като кода на Шанън-Фано. Идеята му е, че кодираните знаци (букви или комбинации от букви) се разделят на две приблизително еднакво вероятни групи: за първата група от знаци 0 се поставя на първо място в комбинацията (първият знак от двоичното число, представляващо характер); за втора група - 1. По-нататък всяка група отново се разделя на две приблизително еднакво вероятни подгрупи; за символи от първата подгрупа нулата се поставя на второ място; за втора подгрупа - един и т.н.

Нека демонстрираме принципа на конструиране на кода на Шанън - Фано върху материала на руската азбука (Таблица 18.8.1). Нека преброим първите шест букви (от "-" до "t"); сумирайки техните вероятности (честоти), получаваме 0,498; всички останали букви (от "n" до "sf") ще имат приблизително същата вероятност от 0,502. Първите шест букви (от "-" до "t") ще имат на първо място двоичен знак 0. Останалите букви (от "n" до "f") ще имат единица на първо място. След това отново разделяме първата група на две приблизително еднакво вероятни подгрупи: от "-" до "o" и от "e" до "t"; за всички букви от първата подгрупа на второ място поставяме нула, а за втора подгрупа 1. Ще продължим процеса, докато във всяка подгрупа остане точно една буква, която ще бъде кодирана от определено двоично число.Конструкцията на кода механизъм е показан в таблица 18.8 .2, а самият код е даден в таблица 18.8.3.

Таблица 18.8.2.

Двоични знаци

Таблица 18.8.3

Таблица 18.8.3 може да кодира и декодира всяко съобщение.

Като пример, нека напишем фразата в двоичен код: "теория на информацията"

01110100001101000110110110000

0110100011111111100110100

1100001011111110101100110

Имайте предвид, че тук няма нужда да отделяте буквите една от друга със специален знак, тъй като дори и без това декодиране се извършва недвусмислено. Това може да се провери чрез декодиране на следната фраза с помощта на таблица 18.8.2:

10011100110011001001111010000

1011100111001001101010000110101

010110000110110110

("метод на кодиране").

Все пак трябва да се отбележи, че всяка грешка в кодирането (случайно объркване на знаци 0 и 1) с такъв код е фатална, тъй като декодирането на целия текст след грешката става невъзможно. Следователно този принцип на кодиране може да се препоръча само в случай, че грешките при кодирането и предаването на съобщението са практически изключени.

Възниква естествен въпрос: наистина ли е оптимален кодът, който сме компилирали при липса на грешки? За да отговорим на този въпрос, нека намерим средната информация за един елементарен символ (0 или 1) и я сравним с максимално възможната информация, която е равна на една двоична единица. За да направим това, първо намираме средната информация, съдържаща се в една буква от предавания текст, т.е. ентропията на буква:

,

където е вероятността буквата да приеме определено състояние (“-”, o, e, a, ..., f).

От табл. 18.8.1 имаме

(по две единици на буква от текста).

Съгласно таблица 18.8.2 определяме средния брой елементарни знаци на буква

Разделяйки ентропията на, получаваме информация за елементарен символ

(две единици).

По този начин информацията за символ е много близо до горната си граница от 1, а кодът, който сме избрали, е много близо до оптималния. Оставайки в границите на задачата за кодиране с букви, не можем да получим нищо по-добро.

Обърнете внимание, че в случай на кодиране само на двоични числа от букви, ще имаме изображение на всяка буква с пет двоични знака и информацията за всеки знак ще бъде

(две единици),

т.е. значително по-малко, отколкото при оптимално буквено кодиране.

Все пак трябва да се отбележи, че правописното кодиране изобщо не е икономично. Факт е, че винаги има зависимост между съседните букви на всеки смислен текст. Например гласна на руски не може да бъде последвана от "ъ" или "ь"; след съскане "I" или "yu" не могат да издържат; след няколко съгласни подред се увеличава вероятността за гласна и т.н.

Знаем, че когато зависимите системи се комбинират, общата ентропия е по-малка от сбора на ентропиите на отделните системи; следователно информацията, предадена от част от свързан текст, винаги е по-малка от информацията за знак, умножена по броя на знаците. Като се има предвид това обстоятелство, може да се конструира по-икономичен код, ако не се кодира всяка буква отделно, а цели „блокове“ от букви. Например, в руския текст има смисъл да се кодират изцяло някои често срещани комбинации от букви, като "ts", "ает", "nie" и т.н. Кодираните блокове са подредени в низходящ ред на честотите, като буквите в табл. 18.8.1, а двоичното кодиране се извършва по същия принцип.

В някои случаи се оказва разумно да се кодират дори не блокове от букви, а цели смислени части от текст. Например, за да разтоварите телеграфната служба по празниците, препоръчително е да кодирате цели стандартни текстове с условни числа, като например:

„Честита Нова година, желая ви много здраве и успехи в работата.

Без да се спираме конкретно на методите за блоково кодиране, ние се ограничаваме до формулирането на свързаната теорема на Шанън.

Нека има източник на информация и приемник, свързани с комуникационен канал (фиг. 18.8.1).

Ефективността на източника на информация е известна, т.е. средният брой двоични единици информация, идващи от източника за единица време (числено е равен на средната ентропия на съобщението, произведено от източниците за единица време). Нека освен това е известен капацитетът на канала, т.е. максималното количество информация (например двоични знаци 0 или 1), което каналът може да предаде за една и съща единица време. Възниква въпросът: каква трябва да бъде честотната лента на канала, за да може той да се "справи" със задачата си, т.е. информацията от източника до приемника да пристига без забавяне?

Отговорът на този въпрос се дава от първата теорема на Шанън. Ние го формулираме тук без доказателство.

1-ва теорема на Шанън

Ако честотната лента на комуникационния канал е по-голяма от ентропията на източника на информация за единица време

тогава винаги е възможно да се кодира достатъчно дълго съобщение, така че да бъде предадено от комуникационния канал без забавяне. Ако, напротив,

тогава предаването на информация без забавяне е невъзможно.