Кодирование текстовой информации. Кодировка ascii. Основные кодировки кириллицы
© К. Поляков, 2009-2011
Тема: Кодирование текстовой информации. Кодировка ASCII. Основные кодировки кириллицы.
Что нужно знать:
все символы кодируются одинаковым числом бит1 (алфавитный подход)
чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)
при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта2
после знака препинания внутри (не в конце!) текста ставится пробел
чтобы найти информационный объем текста I, нужно умножить количество символов N на число бит на символ K:
две строчки текста не могут занимать 100 Кбайт в памяти
Пример задания:
Определите информационный объем текста
Бамбарбия! Кергуду!
1) 38 бит 2) 144 бита 3) 152 бита 4) 19 бит
Решение:
в этом тексте 19 символов (обязательно считать пробелы и знаки препинания)
если не дополнительной информации, считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка 8- или 16-битная)
поэтому в сообщении 19*8 = 152 бита информации (ответ 3).
-
Возможные ловушки:
указано правильное число, но другие единицы измерения (объем текста 19 байт, а один из неверных ответов – 19 бит)
расчет на то, что «забудут» пробел, в этом случае получается 18*8 = 144 бита (ответ 2, неверный)
в 16-битной кодировке объем текста – 38 байт, а один из неверных ответов – 38 бит.
Еще пример задания:
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?
1) 30 2) 60 3) 120 4) 480
Решение:
обозначим количество символов через N
при 16-битной кодировке объем сообщения – 16*N бит
когда его перекодировали в 8-битный код, его объем стал равен– 8*N бит
таким образом, сообщение уменьшилось на 16*N – 8*N = 8*N = 480 бит
отсюда находим N = 480/8 = 60 символов (ответ 2).
Еще пример задания:
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
5
A
B
Q
a
b
Десятичный код
49
53
65
66
81
97
98
Шестнадцатеричный код
31
35
41
42
51
61
62
Каков шестнадцатеричный код символа «q» ?
1) 7116 2) 8316 3) A116 4) B316
Решение:
в кодовой таблице ASCII (American Standard Code for Information Interchange, американский стандартный код для обмена информацией) все заглавные латинские буквы A-Z расставлены по алфавиту, начиная с символа с кодом 65=4116
все строчные латинские буквы a-z расставлены по алфавиту, начиная с символа с кодом 97=6116
отсюда следует, что разница кодов букв «q» и «a» равна разнице кодов букв «Q» и «A», то есть, 5116 – 4116=1016
тогда шестнадцатеричный код символа «q» равен коду буквы «a» плюс 1016
отсюда находим 6116 + 1016=7116 (ответ 1).
Задачи для тренировки3:
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине – только один.
1) 92 бита 2) 220 бит 3) 456 бит 4) 512 бит
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Алексея Толстого:
Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.
1) 512 бит 2) 608 бит 3) 8 Кбайт 4) 123 байта
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Рене Декарта:
Я мыслю, следовательно, существую.
1) 28 бит 2) 272 бита 3) 32 Кбайта 4) 34 бита
В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.
1) 384 бита 2) 192 бита 3) 256 бит 4) 48 бит
Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode:
Привычка свыше нам дана: Замена счастию она.
1) 44 бита 2) 704 бита 3) 44 байта 4) 704 байта
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!
1) 400 бит 2) 50 бит 3) 400 байт 4) 5 байт
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения:
Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.
1) 106 бит 2) 848 бит 3) 106 Кбайт 4) 848 Кбайт
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 8-битном коде, в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 2048 байт. Каков был информационный объем сообщения до перекодировки?
1) 1024 байт 2) 2048 бит 3) 2 Кбайта 4) 2 Мбайта
Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей фразы в кодировке Unicode:
В шести литрах 6000 миллилитров.
1) 1024 байта 2) 1024 бита 3) 512 байт 4) 512 бит
Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующего предложения:
Блажен, кто верует, тепло ему на свете!
1) 78 бит 2) 80 байт 3) 312 бит 4) 624 бита
Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения:
Белеет Парус Одинокий В Тумане Моря Голубом!
1) 352 бита 2) 44 бита 3) 352 байта 4) 88 байт
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку
КОИ-8. При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?
1) 50 2) 100 3) 200 4) 800
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
5
J
K
P
j
k
Десятичный код
49
53
74
75
80
106
107
Шестнадцатеричный код
31
35
4A
4B
50
6A
6B
Каков шестнадцатеричный код символа «p» ?
1) 7016 2) 8516 3) 6F16 4) СЕ16
В таблице ниже представлена часть кодовой таблицы:
-
Символ
С
Т
У
Я
с
т
у
Десятичный код
145
146
147
159
225
226
227
Шестнадцатеричный код
91
92
93
9F
E1
E2
E3
Каков шестнадцатеричный код символа «я» ?
1) 2A116 2) DF16 3) EF16 4) 18016
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку
КОИ-8. При этом информационное сообщение уменьшилось на 160 бит. Какова длина сообщения в символах?
1) 10 2) 20 3) 40 4) 160
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной 8 символов, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационный объем сообщения уменьшился на
1) 8 байт 2) 8 бит 3) 64 байта 4) 128 бит
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку
КОИ-8. При этом информационное сообщение уменьшилось на 240 бит. Какова длина сообщения в символах?
1) 15 2) 30 3) 60 4) 240
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 20 символов, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на
1) 320 бит 2) 20 бит 3) 160 байт 4) 20 байт
Информационный объем сообщения равен 40960 бит. Чему равен объем этого сообщения в Кбайтах?
1) 5 2) 8 3) 32 4) 12
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
5
A
B
a
b
r
Десятичный код
49
53
65
66
97
98
114
Шестнадцатеричный код
31
35
41
42
61
62
72
Каков шестнадцатеричный код символа «R» ?
1) A016 2) 7216 3) A216 4) 5216
В кодировке КОИ-8 каждый символ кодируется одним байтом. Определите информационный объем следующего сообщения в этой кодировке:
У сильного всегда бессильный виноват.
1) 33 байта 2) 37 бит 3) 256 бит 4) 296 бит
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
3
A
Y
Z
y
z
Десятичный код
49
51
65
89
90
121
122
Восьмеричный код
61
63
101
131
132
171
172
Каков восьмеричный код символа «a» ?
1) 978 2) 658 3) 1018 4) 1418
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
3
X
Y
Z
c
z
Десятичный код
49
51
88
89
90
99
122
Восьмеричный код
61
63
130
131
132
143
172
Каков восьмеричный код символа «C» ?
1) 678 2) 1038 3) 978 4) 1438
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
3
A
T
Z
a
z
Десятичный код
49
51
65
84
90
97
122
Восьмеричный код
61
63
101
124
132
141
172
Каков восьмеричный код символа «t» ?
1) 848 2) 1168 3) 1248 4) 1648
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
3
A
Z
a
m
z
Десятичный код
49
51
65
90
97
109
122
Восьмеричный код
61
63
101
132
141
155
172
Каков восьмеричный код символа «M» ?
1) 758 2) 1078 3) 1158 4) 1558
В таблице ниже представлена часть кодовой таблицы ASCII:
-
Символ
1
3
A
Y
a
b
z
Десятичный код
49
51
65
89
97
98
122
Восьмеричный код
61
63
101
131
141
142
172
Каков восьмеричный код символа «Z» ?
1) 1228 2) 1728 3) 1328 4) 908
1 В самом деле, есть кодировки с переменным количеством бит на символ, например, кодировка UTF-8, но они не изучаются в школе.
2 Чаще всего килобайт обозначают «Кб», а мегабайт – «Мб», но в демо-тестах ЕГЭ разработчики привели именно такие обозначения.
3 Источники заданий:
Демонстрационные варианты ЕГЭ 2004-2011 гг.
Гусева И.Ю. ЕГЭ. Информатика: раздаточный материал тренировочных тестов. — СПб: Тригон, 2009.
М.Э. Абрамян, С.С. Михалкович, Я.М. Русанова, М.И. Чердынцева. Информатика. ЕГЭ шаг за шагом. – М.: НИИ школьных технологий, 2010.
Якушкин П.А., Лещинер В.Р., Кириенко Д.П. ЕГЭ 2011. Информатика. Типовые тестовые задания. — М.: Экзамен, 2011.
Чуркина Т.Е. ЕГЭ 2011. Информатика. Тематические тренировочные задания. — М.: Эксмо, 2010.
http://kpolyakov.narod.ru
страница 1
скачать
Другие похожие работы: