У дома Браузъри Двуцифрен код. Двоичен към текст. Подписан обратен ключ

Двуцифрен код. Двоичен към текст. Подписан обратен ключ

Всички знаци и букви могат да бъдат кодирани с помощта на осем двоични бита. Най-често срещаните таблици за представяне на букви в двоичен код са ASCII и ANSI, те могат да се използват за писане на текстове в микропроцесори. В ASCII и ANSI таблиците първите 128 знака са еднакви. Тази част от таблицата съдържа кодове за цифри, препинателни знаци, главни и малки латински букви и контролни знаци. Националните разширения на таблици със знаци и псевдографски символи се съдържат в последните 128 кода на тези таблици, така че руските текстове в операционните системи DOS и WINDOWS не съвпадат.

При първото запознаване с компютри и микропроцесори може да възникне въпросът - "как да конвертирате текст в двоичен код?" Тази трансформация обаче е най-простото действие! За да направите това, трябва да използвате всеки текстов редактор. Включването на най-простата програма за бележник, която е част от операционната система Windows, също е подходяща. Подобни редактори присъстват във всички програмни среди за езици като C, Pascal или Java. Трябва да се отбележи, че най-често срещаният текстов редактор Word не е подходящ за просто преобразуване на текст в двоичен код. Този тестов редактор въвежда огромно количество допълнителна информация, като цвета на буквите, курсив, подчертаване, езика, на който е написана определена фраза, и шрифта.

Трябва да се отбележи, че всъщност комбинацията от нули и единици, с помощта на които се кодира текстовата информация, не е двоичен код, т.к. битовете в този код не се подчиняват на законите. В интернет обаче най-често се среща фразата за търсене „представяне на букви в двоичен код“. Таблица 1 показва съответствието на двоичните кодове с буквите от латинската азбука. За краткост последователността от нули и единици в тази таблица е представена в десетични и шестнадесетични кодове.

маса 1Таблица за представяне на латински букви в двоичен код (ASCII)

Десетичен код	Шестнадесетичен код	Характер на дисплея	Значение
0	00		NUL
1	01	☺	(показва контролна дума)
2	02	☻	(Първата предадена дума)
3	03		ETX (последна дума за предаване)
4	04	♦	EOT (край на предаването)
5	05	♣	ENQ (инициализация)
6	06	♠	ACK (потвърждение)
7	07		БЕЛ
8	08	◘	BS
9	09	○	HT (хоризонтален раздел
10	0А	◙	LF (подаване на ред)
11	0Б	♂	VT (вертикален раздел)
12	0С	♀	FF (следваща страница)
13	0D	♪	CR (връщане на каретка)
14	0E	♫	SO (двойна ширина)
15	0F	☼	SI (кондензирано уплътнение)
16	10		DLE
17	11	◄	DC1
18	12	↕	DC2 (Отмяна на съкратен печат)
19	13	‼	DC3 (готов)
20	14	¶	DC4 (отмяна на двойна ширина)
21	15	§	NAC (без потвърждение)
22	16	▬	SYN
23	17	↨	ETB
24	18		МОГА
25	19	↓	ЕМ
26	1А	→	ПОДП
27	1Б	←	ESC (контрол на последователността на стартиране)
28	1C	∟	FS
29	1D	↔	GS
30	1E	▲	RS
31	1F	▼	НАС
32	20		пространство
33	21	!	Удивителен знак
34	22	«	ъглова скоба
35	23	#	Знак за число
36	24	$	Знак за валута (долар)
37	25	%	Знак за процент
38	26	&	амперсанд
39	27	"	апостроф
40	28	(	отваряща скоба
41	29	)	Затворете скоби
42	2А	*	звезда
43	2B	+	знак плюс
44	2C	,	Запетая
45	2D	-	Знак минус
46	2E	.	Точка
47	2F	/	Дробна лента
48	30	0	Числова нула
49	31	1	номер едно
50	32	2	Номер две
51	33	3	номер три
52	34	4	Номер четири
53	35	5	Номер пет
54	36	6	Номер шест
55	37	7	Номер седем
56	38	8	Номер осем
57	39	9	Номер девет
58	3А	:	Дебело черво
59	3B	;	точка и запетая
60	3C	<	знак по-малко
61	3D	=	знак за равенство
62	3E	>	Подпишете повече
63	3F	?	въпросителен знак
64	40	@	Търговски етаж
65	41	А	Главна латинска буква А
66	42	б	главна латинска буква B
67	43	° С	латинска главна буква C
68	44	д	Главна латинска буква D
69	45	д	латинска главна буква E
70	46	Е	главна латинска буква F
71	47	Ж	главна латинска буква G
72	48	з	главна латинска буква H
73	49	аз	Главна латинска буква I
74	4А	Дж	латинска главна буква J
75	4B	К	Главна латинска буква K
76	4C	Л	Главна латинска буква L
77	4D	М	Главна латинска буква
78	4E	н	Главна латинска буква N
79	4F	О	Главна латинска буква O
80	50	П	главна латинска буква P
81	51	Q	Главна латинска буква
82	52	Р	латинска главна буква R
83	53	С	Главна латинска буква S
84	54	T	главна латинска буква Т
85	55	U	латинска главна буква U
86	56	V	Главна латинска буква V
87	57	У	Главна латинска буква W
88	58	х	Главна латинска буква X
89	59	Y	Главна латинска буква Y
90	5А	З	Главна латинска буква Z
91	5B	[	Отваряща квадратна скоба
92	5C	\	Наклонена черта
93	5 Д	]	Затваряща квадратна скоба
94	5E	^	"капак"
95	5	_	Долна черта
96	60	`	апостроф
97	61	а	малка латинска буква a
98	62	b	малка латинска буква b
99	63	° С	малка латинска буква c
100	64	д	малка латинска буква d
101	65	д	малка латинска буква e
102	66	f	малка латинска буква f
103	67	ж	малка латинска буква g
104	68	ч	малка латинска буква h
105	69	аз	малка латинска буква i
106	6А	й	малка латинска буква j
107	6B	к	малка латинска буква k
108	6C	л	малка латинска буква l
109	6D	м	малка латинска буква m
110	6E	н	малка латинска буква n
111	6F	о	малка латинска буква o
112	70	стр	малка латинска буква p
113	71	р	малка латинска буква q
114	72	r	малка латинска буква r
115	73	с	малка латинска буква s
116	74	T	малка латинска буква t
117	75	u	малка латинска буква u
118	76	v	малка латинска буква v
119	77	w	малка латинска буква w
120	78	х	малка латинска буква x
121	79	г	малка латинска буква y
122	7А	z	малка латинска буква z
123	7B	{	Отворена къдрава скоба
124	7С	\|	вертикална лента
125	7D	}	Затворете къдрава скоба
126	7E	~	Тилда
127	7F	⌂

В класическата версия на таблицата със символи ASCII няма руски букви и се състои от 7 бита. По-късно обаче тази таблица беше разширена до 8 бита, а в горните 128 реда се появиха руски букви в двоичен код и псевдографски символи. В общия случай втората част съдържа националните азбуки на различни страни и руските букви са само един от възможните набори (855), може да има френска (863), немска (1141) или гръцка (737) таблица. Таблица 2 показва пример за представяне на руски букви в двоичен код.

Таблица 2.Таблица за представяне на руски букви в двоичен код (ASCII)

Десетичен код	Шестнадесетичен код	Характер на дисплея	Значение
128	80	НО	Главна руска буква А
129	81	б	Главна руска буква Б
130	82	AT	Главна руска буква V
131	83	Ж	Главна руска буква Г
132	84	д	Главна руска буква Д
133	85	д	Главна руска буква Е
134	86	И	Главна руска буква Ж
135	87	З	Главна руска буква Z
136	88	И	Главна руска буква I
137	89	Y	Главна руска буква Y
138	8А	Да се	Главна руска буква К
139	8B	Л	Главна руска буква Л
140	8C	М	Главна руска буква М
141	8D	з	Главна руска буква Н
142	8E	О	Главна руска буква О
143	8F	П	Главна руска буква П
144	90	Р	Главна руска буква Р
145	91	ОТ	Главна руска буква С
146	92	T	Главна руска буква Т
147	93	При	Главна руска буква U
148	94	Е	Главна руска буква Ф
149	95	х	Главна руска буква X
150	96	° С	Главна руска буква С
151	97	з	Главна руска буква Ch
152	98	У	Главна руска буква Ш
153	99	SCH	Главна руска буква Ш
154	9А	Комерсант	Главна руска буква Ъ
155	9B	С	Главна руска буква Y
156	9C	b	Главна руска буква б
157	9D	д	Главна руска буква Е
158	9E	Ю	Главна руска буква Ю
159	9F	аз	Главна руска буква Я
160	A0	а	Малка руска буква а
161	A1	b	Малка руска буква б
162	A2	в	Малка руска буква v
163	A3	Ж	Малка руска буква г
164	A4	д	Малка руска буква d
165	A5	д	Малка руска буква е
166	A6	и	Малка руска буква ж
167	A7	ч	Малка руска буква з
168	A8	и	Малка руска буква и
169	A9	th	Малка руска буква у
170	АА	да се	Малка руска буква к
171	AB	л	Малка руска буква л
172	AC	м	Малка руска буква м
173	AD	н	Малка руска буква n
174	AE	относно	Малка руска буква о
175	AF	П	Малка руска буква п
176	B0	░
177	B1	▒
178	B2	▓
179	B3	│	Псевдо символ
180	B4	┤	Псевдо символ
181	B5	╡	Псевдо символ
182	B6	╢	Псевдо символ
183	B7	╖	Псевдо символ
184	B8	╕	Псевдо символ
185	B9	╣	Псевдо символ
186	BA	║	Псевдо символ
187	BB	╗	Псевдо символ
188	пр.н.е	╝	Псевдо символ
189	BD	╜	Псевдо символ
190	БЪДА	╛	Псевдо символ
191	bf	┐	Псевдо символ
192	C0	└	Псевдо символ
193	C1	┴	Псевдо символ
194	C2	┬	Псевдо символ
195	C3	├	Псевдо символ
196	C4	─	Псевдо символ
197	C5	┼	Псевдо символ
198	C6	╞	Псевдо символ
199	C7	╟	Псевдо символ
200	C8	╚	Псевдо символ
201	C9	╔	Псевдо символ
202	CA	╩	Псевдо символ
203	CB	╦	Псевдо символ
204	CC	╠	Псевдо символ
205	CD	═	Псевдо символ
206	CE	╬	Псевдо символ
207	CF	╧	Псевдо символ
208	D0	╨	Псевдо символ
209	D1	╤	Псевдо символ
210	D2	╥	Псевдо символ
211	D3	╙	Псевдо символ
212	D4	╘	Псевдо символ
213	D5	╒	Псевдо символ
214	D6	╓	Псевдо символ
215	D7	╫	Псевдо символ
216	D8	╪	Псевдо символ
217	D9	┘	Псевдо символ
218	DA	┌	Псевдо символ
219	Д.Б.	█
220	DC	▄
221	DD	▌
222	DE	▐
223	Д.Ф.	▀
224	E0	Р	Малка руска буква п
225	E1	с	Малка руска буква c
226	E2	T	Малка руска буква т
227	E3	при	Малка руска буква u
228	E4	f	Малка руска буква ф
229	E5	х	Малка руска буква х
230	E6	° С	Малка руска буква c
231	E7	ч	Малка руска буква h
232	E8	w	Малка руска буква ш
233	E9	sch	Малка руска буква u
234	EA	b	Малка руска буква ъ
235	EB	с	Малка руска буква у
236	ЕС	b	Малка руска буква ь
237	ЕД	ъъъ	Малка руска буква е
238	ЕЕ	Ю	Малка руска буква u
239	EF	аз	Малка руска буква i
240	F0	Йо	Главна руска буква Йо
241	F1	Йо	Малка руска буква ё
242	F2	Є
243	F3	є
244	F4	Ї
245	F5	Ї
246	F6	Ў
247	F7	ў
248	F8	°	знак за степен
249	F9	∙	Знак за умножение (точка)
250	FA	·
251	Facebook	√	Радикал (вземане на корен)
252	FC	№	Знак за число
253	FD	¤	Валутен знак (рубла)
254	F.E.	■
255	FF

При писане на текстове, в допълнение към двоичните кодове, които директно показват букви, се използват кодове, които показват прехода към нов ред и връщането на курсора (връщане на каретката) към нулевата позиция на реда. Тези знаци обикновено се използват заедно. Техните двоични кодове съответстват на десетични числа - 10 (0A) и 13 (0D). Като пример, по-долу е част от текста на тази страница (изхвърляне на паметта). Този раздел съдържа първия параграф. Следният формат се използва за показване на информация в дъмп на паметта:

първата колона съдържа двоичния адрес на първия байт от низа
следващите шестнадесет колони съдържат байтовете, съдържащи се в текстовия файл. За по-удобно определяне на номера на байта след осмата колона се изчертава вертикална линия. Байтовете, за краткост, са представени в шестнадесетичен код.
в последната колона същите тези байтове са представени като показани азбучни знаци

00000000: 82 E1 A5 20 E1 A8 AC A2 ¦ AE AB EB 20 A8 20 A1 E3 Всички знаци и bu AE A4 A8 E0 AE A2 ¦ A0 AD EB 20 AF E0 A8 20 кодиран с 00000030: AF AE AC AE E9 A8 20 A2 ¦ AE E1 EC AC A8 20 A4 A2 00000040: AE A8 E7 AD EB E5 20 E1 ¦ A8 AC A2 AE AB AE A2 2E 00000050: 0D 0A 8D A0 A8 A1 AE AB ¦ A5 A5 20 E0 A0 E1 AF E0 AC A8 20 EF ¦ A2 AB EF EE E2 E1 EF 20 души са 00000080: E2 A0 A1 AB A8 E6 EB 20 ¦ 41 53 43 49 49 20 E1 20 ASCII таблици с 00000090: AD A0 E6 A8 AE AD A0 AB ¦ EC AD EB AC A8 0D 0A E0 национален♪◙p 000000A0: A0 E1 E8 A8 E0 A5 AD A8 ¦ EF AC A8 2C 20 AF E0 A8 разширения, при 000000B0: AC A5 AD EF EE E9 A8 A5 ¦ E1 EF 20 A2 20 44 4F 53 промяна в DOS 000000C0: 20 28 A8 20 AA AE E2 AE ¦ E0 EB A5 20 AC AE A6 AD (и което може да бъде 000000D0: AE 20 A8 E1 AF AE AB EC ¦ A7 AE A2 A0 E2 EC 20 A4 : AB EF 20 A7 A0 AF A8 E1 ¦ A8 0D 0A E2 A5 AA E1 E2 Write♪◙text 000000F0: AE A2 20 A2 20 AC A8 AA ¦ E0 AE AF E0 AE E6 A5 E1 A0 E5 29 2C 20 ¦ A8 20 E2 A0 A1 AB A8 E6 sop), и таблици 00000110: EB 20 41 4E 53 49 2C 20 ¦ AF E0 A8 AC A5 AD EF EE s ANSI, приложете 000 00120: E9 A8 A5 E1 EF 20 A2 20 ¦ 57 49 4E 44 4F 57 53 2E налични в WINDOWS. 00000130: 20 82 20 E2 A0 A1 AB A8 ¦ E6 A0 E5 0D 0A 41 53 43 31 32 38 20 E1 A8 AC ¦ A2 AE AB AE A2 20 E1 AE 128 знака от 00000160: A2 AF A0 A4 A0 EE E2 20 ¦ 82 20 ED E2 AE A9 20 В този 00000170: E7 A0 E1 E2 A8 20 E2 A0 ¦ A1 AB A8 E6 EB 20 E1 AE части от таблицата с 00000180: A4 A5 E0 A6 A0 E2 E1 EF ¦ 0D 0A E1 A8 AC A2 AE AB символа ♪◙ 00000190 : EB се запазва 20 E6 A8 E4 E0 2C 20 ¦ A7 AD A0 AA AE A2 20 AF цифри, знаци n 000001A0: E0 A5 AF A8 AD A0 AD A8 ¦ EF 2C 20 AB A0 E2 A8 AD повторение, латиница 000001B0: E1 AA A8 A5 20 A1 E3 AA ¦ A2 EB 20 A2 A5 E0 E5 AD Горен 000001C0: A5 A3 AE 20 A8 20 AD A8 ¦ A6 AD A5 A3 AE 20 E0 A5 Долен D 000001D0: A3 A8 E1 E2 E0 AE A2 20 ¦ A8 0D 0A E3 AF E0 A0 A2 хистер и♪◙контрол 000001E0: AB EF EE E9 A8 A5 20 E1 ¦ A8 AC A2 AE AB EB 2E 20 знака. 000001F0: 8D A0 E6 A8 AE AD A0 AB ¦ EC AD EB A5 20 E0 A0 E1 Национални състезания 00000200: E8 A8 E0 A5 AD A8 EF 20 ¦ E1 A8 AC A2 AE AB EC AD разширения на символи AB A8 ¦ E6 20 A8 20 E1 A8 AC A2 таблици и символи 00000220: AE AB EB 0D 0A AF E1 A5 ¦ A2 A4 AE A3 E0 A0 E4 A8 oly♪◙псевдографика 00000230: AA A8 20 E1 AE A4 A5 E0 ¦ A6 A0 E2 E1 EF 20 A2 20 ki съдържа в 00000240: AF AE E1 AB A5 A4 AD A8 ¦ E5 20 31 32 38 20 AA AE последни 128 ko 00000250: A4 A0 E5 20 ED E2 A8 E5 ¦ 20 E2 A0 A1 AB A8 E6 2C дадени тези таблици, 00000260: 20 AF AE ED E2 AE AC E3 ¦ 20 E0 E3 E1 E1 AA A8 A5 следователно руски 00000270: 0D 0A E2 A5 AA E1 E2 EB ¦ 20 A2 20 AE AF A5 E0 A0 ♪◙ текстове в opera 00000280 : E6 A8 AE AD AD EB E5 20 ¦ E1 A8 E1 E2 A5 AC A0 E5 AF A0 A4 ¦ A0 EE E2 2E 0D 0A не съвпадат. ♪◙

В горния пример можете да видите, че първият ред текст е 80 байта. Първият байт 82 съответства на буквата "B". Вторият байт E1 съответства на буквата "c". Третият байт A5 съответства на буквата "e". Следващият байт 20 представлява празното пространство между думите (интервал) " ". Байтове 81 и 82 съдържат символи за връщане на каретка и за подаване на ред 0D 0A. Намираме тези знаци на двоичния адрес 00000050: Следващият ред от изходния текст не е кратен на 16 (дължината му е 76 букви), така че, за да намерите края му, първо трябва да намерите реда 000000E0: и да преброите девет колони от него. Там отново се записват байтове за връщане на каретка и за подаване на ред 0D 0A. Останалата част от текста се анализира по абсолютно същия начин.

Дата на последна актуализация на файла 04.12.2018г

Литература:

Заедно със статията "Писане на текстове в двоичен код" те гласят:

Представяне на двоични числа в паметта на компютър или микроконтролер
http://website/proc/IntCod.php

Понякога е удобно да съхранявате числа в паметта на процесора в десетична форма.
http://website/proc/DecCod.php

Стандартни формати с плаваща запетая за компютри и микроконтролери
http://website/proc/float/

Понастоящем както позиционните, така и непозиционните числови системи се използват широко както в технологиите, така и в ежедневието.
.php

Тъй като е най-простият и отговаря на изискванията:

Колкото по-малко стойности съществуват в системата, толкова по-лесно е да се направят отделни елементи, които работят с тези стойности. По-специално, две цифри от двоичната бройна система могат лесно да бъдат представени чрез много физически явления: има ток - няма ток, индукцията на магнитното поле е по-голяма от праговата стойност или не и т.н.
Колкото по-нисък е броят на състоянията за даден елемент, толкова по-висока е устойчивостта на шум и толкова по-бързо може да работи. Например, за да се кодират три състояния чрез величината на индукцията на магнитното поле, ще е необходимо да се въведат две прагови стойности, които няма да допринесат за устойчивостта на шум и надеждността на съхранението на информация.
Двоичната аритметика е доста проста. Прости са таблиците за събиране и умножение - основните операции с числата.
Възможно е да се използва апаратът на алгебрата на логиката за извършване на битови операции с числа.

Връзки

Онлайн калкулатор за преобразуване на числа от една бройна система в друга

Фондация Уикимедия. 2010 г.

Вижте какво е "двоичен код" в други речници:

2 битален код на сивото 00 01 11 10 3 битов код сиво 000 000 001 011 010 110 111 101 100 4 битов код сиво 0000 00 0001 0011 0010 0110 01111 0100 1100 1101 1111 1110 1010 1011 1000 Сив код на персонализиран код, в който има два съседни стойности, в които има две съседни стойности … … Wikipedia

Кодът на сигналната точка (английски Signal Point Code (SPC)) на системата за сигнализиране 7 (SS7, SS 7) е уникален (в домашната мрежа) адрес на възел, използван на третото MTP ниво (маршрутизиране) в телекомуникационните SS 7 мрежи за идентифицират ... Wikipedia

В математиката число без квадрат е число, което не се дели на квадрат, различен от 1. Например 10 е без квадрат, но 18 не е, тъй като 18 се дели на 9 = 32. Началото на поредицата от безквадратни числа е : 1, 2, 3, 5, 6, 7, ... ... Уикипедия

Искате ли да подобрите тази статия?: Уикифицирайте статията. Преработете дизайна в съответствие с правилата за писане на статии. Коригирайте статията според стилистичните правила на Уикипедия ... Уикипедия

Този термин има и други значения, вижте Python (многозначност). Езиков клас на Python: mu ... Wikipedia

В тесния смисъл на думата в момента фразата се разбира като "Атака срещу системата за сигурност" и клони по-скоро към значението на следния термин Cracker атака. Това се дължи на изкривяване на значението на думата "хакер". Хакер ... ... Уикипедия

Реших да направя такъв инструмент като конвертиране на текст в двоичен код и обратно, има такива услуги, но те обикновено работят с латиница, но моята преводачът работи с UTF-8 Unicode кодиране, който кодира кирилските знаци в два байта. Невъзможно е да се преведат китайски йероглифи, но ще поправя това злощастно недоразумение.

За преобразуване на текст в двоично представяневъведете текста в лявото поле и натиснете TEXT->BIN в дясното поле, ще се появи неговото двоично представяне.

За преобразуване на двоичен код в текствъведете кода в десния прозорец и натиснете BIN->TEXT в левия прозорец, ще се появи неговото символно представяне.

Ако конвертиране на двоичен код в текстили обратното не се получи - проверете коректността на вашите данни!

Актуализация!

Трансформацията на текста в обратен изглед вече е достъпна:

в нормален вид. За да направите това, поставете отметка в квадратчето: „Заменете 0 с интервали и 1 с контейнер █“. След това поставете текста в дясното поле: "Текст в двоично представяне" и натиснете бутона под него "BIN->TEXT".

Когато копирате такива текстове, трябва да внимавате, защото. можете лесно да загубите интервали в началото или в края. Например редът по-горе изглежда така:

██ █ █ ███████ █ ██ ██ █ █ ███ ██ █ █ ██ █ ██ █ █ ██ █ ███ █ ██ █ █ ██ █ █ ███ ██ █ █ ███ ██ █ ██

и на червен фон:

██ █ █ ███████ █ ██ ██ █ █ ███ ██ █ █ ██ █ ██ █ █ ██ █ ███ █ ██ █ █ ██ █ █ ███ ██ █ █ ███ ██ █ ██

вижте колко интервала в края могат да бъдат загубени?

Компютрите не разбират думите и числата, както хората. Съвременният софтуер позволява на крайния потребител да игнорира това, но на най-ниските нива вашият компютър работи с двоичен електрически сигнал, който има само две състояния: има или няма ток. За да „разбере“ сложни данни, вашият компютър трябва да ги кодира в двоичен код.

Двоичната система се основава на две цифри, 1 и 0, съответстващи на включени и изключени състояния, които вашият компютър може да разбере. Вероятно сте запознати с десетичната система. Той използва десет цифри, от 0 до 9, и след това преминава към следващия ред, за да формира двуцифрени числа, като цифрата от всеки ред е десет пъти по-голяма от предишната. Двоичната система е подобна, като всяка цифра е два пъти по-голяма от предишната.

Броене в двоична система

В двоична система първата цифра е еквивалентна на 1 в десетична система. Втората цифра е 2, третата е 4, четвъртата е 8 и така нататък – удвоявайки се всеки път. Добавянето на всички тези стойности ще ви даде число в десетичен формат.

1111 (двоично) = 8 + 4 + 2 + 1 = 15 (десетично)

Отчитането на 0 ни дава 16 възможни стойности за четири двоични бита. Преместете 8 бита и ще получите 256 възможни стойности. Това заема много повече място за представяне, тъй като четири цифри в десетичен знак ни дават 10 000 възможни стойности. Разбира се, двоичният код заема повече място, но компютрите разбират двоичните файлове много по-добре от десетичната система. И за някои неща, като логическа обработка, двоичната е по-добра от десетичната.

Трябва да се каже, че има друга основна система, която се използва в програмирането: шестнадесетичен. Въпреки че компютрите не работят в шестнадесетична система, програмистите я използват, за да представят двоични адреси в четим от човека формат, когато пишат код. Това е така, защото две цифри от шестнадесетично число могат да представляват цял байт, тоест те заместват осем цифри в двоична система. Шестнадесетичната система използва числата 0-9, както и буквите от A до F, за да получи допълнителни шест цифри.

Защо компютрите използват двоични файлове

Кратък отговор: хардуер и законите на физиката. Всеки знак във вашия компютър е електрически сигнал, а в ранните дни на компютрите измерването на електрическите сигнали беше много по-трудно. Беше по-разумно да се прави разлика само между състоянието "включено", представено от отрицателен заряд, и състоянието "изключено", представено от положителен заряд.

За тези, които не знаят защо "изключено" е представено от положителен заряд, това е защото електроните имат отрицателен заряд, а повече електрони означава повече ток с отрицателен заряд.

Така се използват ранни компютри с размер на стая двоични файловеда изградят своите системи и въпреки че използваха по-старо, по-обемно оборудване, те работеха на същите основни принципи. Съвременните компютри използват т.нар транзистор за извършване на изчисления с двоичен код.

Ето схема на типичен транзистор:

По принцип той позволява на тока да тече от източника към изтичането, ако има ток в портата. Това формира двоичен ключ. Производителите могат да направят тези транзистори от 5 нанометра или от две вериги на ДНК. Ето как работят съвременните процесори и дори те могат да страдат от проблеми при разграничаване между включени и изключени състояния (въпреки че това се дължи на нереалистичния им молекулен размер, подложен на странности на квантовата механика).

Защо само двоична система

Така че може би си мислите: „Защо само 0 и 1? Защо не добавите друг номер? Въпреки че това отчасти се дължи на традициите за създаване на компютри, в същото време добавянето на още една цифра би означавало необходимостта да се подчертае още едно състояние на текущото, а не само „изключено“ или „включено“.

Проблемът тук е, че ако искате да използвате няколко нива на напрежение, имате нужда от начин лесно да правите изчисления с тях, а модерният хардуер, способен да прави това, не е жизнеспособен като заместител на двоичните изчисления. Например има т.нар троен компютър, разработен през 50-те години на миналия век, но развитието спря дотук. Троична логика по-ефективен от двоичния, но все още няма ефективен заместител на двоичния транзистор или поне няма толкова малък транзистор като двоичния.

Причината да не можем да използваме троичната логика се свежда до това как транзисторите са свързани в компютъра и как се използват за математически изчисления. Транзисторът получава информация на два входа, извършва операция и връща резултата на един изход.

По този начин бинарната математика е по-лесна за компютъра от всичко друго. Двоичната логика лесно се преобразува в двоични системи, като True и False съответстват на състоянията On и Off.

Двоичната таблица на истината, работеща на двоична логика, ще има четири възможни изхода за всяка фундаментална операция. Но тъй като тройните порти използват три входа, тройната таблица на истината ще има 9 или повече. Докато двоичната система има 16 възможни оператора (2^2^2), троичната система би имала 19683 (3^3^3). Мащабирането се превръща в проблем, защото въпреки че trinity е по-ефективно, то е и експоненциално по-сложно.

Кой знае?В бъдеще може много добре да видим троични компютри, тъй като двоичната логика се сблъска с проблеми с миниатюризацията. Засега светът ще продължи да работи в двоичен режим.

Капацитет на двоичен код, Преобразуване на информация от непрекъсната в дискретна форма, Универсалност на двоичното кодиране, Единни и нееднородни кодове, Информатика 7 клас Босов, Информатика 7 клас

1.5.1. Преобразуване на информация от непрекъсната в дискретна форма
За да разреши проблемите си, човек често трябва да преобразува наличната информация от една форма на представяне в друга. Например при четене на глас информацията се преобразува от дискретна (текстова) форма в непрекъсната (звук). По време на диктовка в урок по руски език, напротив, информацията се трансформира от непрекъсната форма (глас на учителя) в дискретна (бележки на учениците).
Информацията, представена в дискретна форма, е много по-лесна за прехвърляне, съхраняване или автоматична обработка. Ето защо в компютърните технологии се обръща голямо внимание на методите за преобразуване на информация от непрекъсната форма в дискретна.
Дискретизацията на информацията е процес на преобразуване на информация от непрекъсната форма на представяне в дискретна.
Разгледайте същността на процеса на дискретизация на информацията на пример.
Метеорологичните станции разполагат със саморегистриращи се уреди за непрекъснато отчитане на атмосферното налягане. Резултатът от тяхната работа са барограми - криви, показващи как налягането се е променило за дълги периоди от време. Една от тези криви, начертана от инструмента по време на седем часа наблюдения, е показана на фиг. 1.9.

Въз основа на получената информация е възможно да се състави таблица, съдържаща показанията на инструмента в началото на измерванията и в края на всеки час наблюдения (фиг. 1.10).

Получената таблица не предоставя пълна картина на това как се е променило налягането по време на периода на наблюдение: например не е посочена най-високата стойност на налягането, възникнала през четвъртия час на наблюдение. Но ако въведете в таблицата стойностите на налягането, наблюдавани на всеки половин час или 15 минути, тогава новата таблица ще даде по-пълна картина за това как се е променило налягането.
По този начин информацията, представена в непрекъсната форма (барограма, крива), с известна загуба на точност, преобразувахме в дискретна форма (таблица).
В бъдеще ще се запознаете с методите за дискретно представяне на звукова и графична информация.

Вериги от три двоични знака се получават чрез допълване на двуцифрени двоични кодове отдясно със знак 0 или 1. В резултат на това кодовите комбинации от три двоични знака са 8 - два пъти повече, отколкото от два двоични знака:
Съответно, четири-битов двоичен файл ви позволява да получите 16 кодови комбинации, пет-битов - 32, шест-битов - 64 и т.н. Дължината на двоичната верига - броят на символите в двоичния код - е наречен битова дълбочина на двоичния код.
Забележи, че:
4 = 2 * 2,
8 = 2 * 2 * 2,
16 = 2 * 2 * 2 * 2,
32 = 2 * 2 * 2 * 2 * 2 и т.н.
Тук броят на кодовите комбинации е продукт на определен брой идентични фактори, равни на битовата дълбочина на двоичния код.
Ако броят на кодовите комбинации е обозначен с буквата N, а битовата дълбочина на двоичния код е обозначена с буквата i, тогава разкритият модел в обща форма ще бъде написан, както следва:
N = 2 * 2 * ... * 2.
i фактори
В математиката такива продукти се записват като:
N = 2i.
Запис 2 прочетох така: "2 на i-та степен."

Задача. Лидерът на племето Multi инструктира своя министър да разработи двоичен файл и да преведе в него цялата важна информация. Каква битова дълбочина би била необходима, ако азбуката, използвана от племето Multi, има 16 знака? Запишете всички кодови комбинации.
Решение. Тъй като азбуката на племето Multi се състои от 16 знака, тогава те се нуждаят от 16 кодови комбинации.В този случай дължината (разрядният капацитет) на двоичния код се определя от съотношението: 16 = 2 i . Следователно i = 4.
За да напишем всички кодови комбинации от четири 0 и 1, използваме диаграмата на фиг. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110,0111,1000,1001,1010,1011,1100,1101,1110,1111.

1.5.3. Гъвкавост на двоичното кодиране
В началото на този раздел научихте, че когато се представя в непрекъсната форма, може да се изрази с помощта на символите на някакъв естествен или формален език. На свой ред произволни знаци от азбуката могат да бъдат преобразувани в двоични. По този начин, с помощта на двоичен код, всеки може да бъде представен на естествени и формални езици, както и изображения и звуци (фиг. 1.14). Това означава универсалността на двоичното кодиране.
Двоичните кодове намират широко приложение в компютърната техника, като изискват само две състояния на електронната схема – „включено” (съответстващо на цифрата 1) и „изключено” (съответстващо на цифрата 0).
Простотата на техническата реализация е основното предимство на двоичното кодиране. Недостатъкът на двоичното кодиране е голямата дължина на получения код.

1.5.4. Единни и нееднородни кодове
Разграничаване на унифицирани и нееднородни кодове. Еднаквите кодове в кодовите комбинации съдържат еднакъв брой знаци, нечетните - различни.
По-горе разгледахме единни двоични кодове.
Пример за нееднороден код е морзовата азбука, в която за всяка буква и цифра е определена поредица от къси и дълги сигнали. И така, буквата E съответства на кратък сигнал („точка“), а буквата Ш съответства на четири дълги сигнала (четири „тирета“). Неравномерното ви позволява да увеличите скоростта на предаване на съобщения поради факта, че най-често срещаните символи в предаваната информация имат най-кратките кодови комбинации.

Информацията, дадена от този символ, е равна на ентропията на системата и е максимална в случая, когато и двете състояния са еднакво вероятни; в този случай елементарният символ предава информация 1 (двойни единици). Следователно основата на оптималното кодиране ще бъде изискването елементарните знаци в кодирания текст да се срещат средно еднакво често.

Нека опишем тук метод за конструиране на код, който удовлетворява заявеното условие; този метод е известен като кода на Шанън-Фано. Идеята му е, че кодираните знаци (букви или комбинации от букви) се разделят на две приблизително еднакво вероятни групи: за първата група от знаци 0 се поставя на първо място в комбинацията (първият знак от двоичното число, представляващо характер); за втора група - 1. По-нататък всяка група отново се разделя на две приблизително еднакво вероятни подгрупи; за символи от първата подгрупа нулата се поставя на второ място; за втора подгрупа - един и т.н.

Нека демонстрираме принципа на конструиране на кода на Шанън - Фано върху материала на руската азбука (Таблица 18.8.1). Нека преброим първите шест букви (от "-" до "t"); сумирайки техните вероятности (честоти), получаваме 0,498; всички останали букви (от "n" до "sf") ще имат приблизително същата вероятност от 0,502. Първите шест букви (от "-" до "t") ще имат на първо място двоичен знак 0. Останалите букви (от "n" до "f") ще имат единица на първо място. След това отново разделяме първата група на две приблизително еднакво вероятни подгрупи: от "-" до "o" и от "e" до "t"; за всички букви от първата подгрупа на второ място поставяме нула, а за втора подгрупа 1. Ще продължим процеса, докато във всяка подгрупа остане точно една буква, която ще бъде кодирана от определено двоично число.Конструкцията на кода механизъм е показан в таблица 18.8 .2, а самият код е даден в таблица 18.8.3.

Таблица 18.8.2.

	Двоични знаци

Таблица 18.8.3

Таблица 18.8.3 може да кодира и декодира всяко съобщение.

Като пример, нека напишем фразата в двоичен код: "теория на информацията"

01110100001101000110110110000

0110100011111111100110100

1100001011111110101100110

Имайте предвид, че тук няма нужда да отделяте буквите една от друга със специален знак, тъй като дори и без това декодиране се извършва недвусмислено. Това може да се провери чрез декодиране на следната фраза с помощта на таблица 18.8.2:

10011100110011001001111010000

1011100111001001101010000110101

010110000110110110

("метод на кодиране").

Все пак трябва да се отбележи, че всяка грешка в кодирането (случайно объркване на знаци 0 и 1) с такъв код е фатална, тъй като декодирането на целия текст след грешката става невъзможно. Следователно този принцип на кодиране може да се препоръча само в случай, че грешките при кодирането и предаването на съобщението са практически изключени.

Възниква естествен въпрос: наистина ли е оптимален кодът, който сме компилирали при липса на грешки? За да отговорим на този въпрос, нека намерим средната информация за един елементарен символ (0 или 1) и я сравним с максимално възможната информация, която е равна на една двоична единица. За да направим това, първо намираме средната информация, съдържаща се в една буква от предавания текст, т.е. ентропията на буква:

където е вероятността буквата да приеме определено състояние (“-”, o, e, a, ..., f).

От табл. 18.8.1 имаме

(по две единици на буква от текста).

Съгласно таблица 18.8.2 определяме средния брой елементарни знаци на буква

Разделяйки ентропията на, получаваме информация за елементарен символ

(две единици).

По този начин информацията за символ е много близо до горната си граница от 1, а кодът, който сме избрали, е много близо до оптималния. Оставайки в границите на задачата за кодиране с букви, не можем да получим нищо по-добро.

Обърнете внимание, че в случай на кодиране само на двоични числа от букви, ще имаме изображение на всяка буква с пет двоични знака и информацията за всеки знак ще бъде

(две единици),

т.е. значително по-малко, отколкото при оптимално буквено кодиране.

Все пак трябва да се отбележи, че правописното кодиране изобщо не е икономично. Факт е, че винаги има зависимост между съседните букви на всеки смислен текст. Например гласна на руски не може да бъде последвана от "ъ" или "ь"; след съскане "I" или "yu" не могат да издържат; след няколко съгласни подред се увеличава вероятността за гласна и т.н.

Знаем, че когато зависимите системи се комбинират, общата ентропия е по-малка от сбора на ентропиите на отделните системи; следователно информацията, предадена от част от свързан текст, винаги е по-малка от информацията за знак, умножена по броя на знаците. Като се има предвид това обстоятелство, може да се конструира по-икономичен код, ако не се кодира всяка буква отделно, а цели „блокове“ от букви. Например, в руския текст има смисъл да се кодират изцяло някои често срещани комбинации от букви, като "ts", "ает", "nie" и т.н. Кодираните блокове са подредени в низходящ ред на честотите, като буквите в табл. 18.8.1, а двоичното кодиране се извършва по същия принцип.

В някои случаи се оказва разумно да се кодират дори не блокове от букви, а цели смислени части от текст. Например, за да разтоварите телеграфната служба по празниците, препоръчително е да кодирате цели стандартни текстове с условни числа, като например:

„Честита Нова година, желая ви много здраве и успехи в работата.

Без да се спираме конкретно на методите за блоково кодиране, ние се ограничаваме до формулирането на свързаната теорема на Шанън.

Нека има източник на информация и приемник, свързани с комуникационен канал (фиг. 18.8.1).

Ефективността на източника на информация е известна, т.е. средният брой двоични единици информация, идващи от източника за единица време (числено е равен на средната ентропия на съобщението, произведено от източниците за единица време). Нека освен това е известен капацитетът на канала, т.е. максималното количество информация (например двоични знаци 0 или 1), което каналът може да предаде за една и съща единица време. Възниква въпросът: каква трябва да бъде честотната лента на канала, за да може той да се "справи" със задачата си, т.е. информацията от източника до приемника да пристига без забавяне?

Отговорът на този въпрос се дава от първата теорема на Шанън. Ние го формулираме тук без доказателство.

1-ва теорема на Шанън

Ако честотната лента на комуникационния канал е по-голяма от ентропията на източника на информация за единица време

тогава винаги е възможно да се кодира достатъчно дълго съобщение, така че да бъде предадено от комуникационния канал без забавяне. Ако, напротив,

тогава предаването на информация без забавяне е невъзможно.