ASCII — это таблица кодировки символов, в которой каждой букве, числу или знаку соответствует определенное число. В стандартной таблице ASCII 128 символов, пронумерованных от 0 до 127. В них входят латинские буквы, цифры, знаки препинания и управляющие символы.
Таблица ASCII
ASCII (American Standard Code for Information Interchange) — это набор кодов для символов. В таблице показаны знаки (Char) и их значения в десятичной (Dec) и шестнадцатеричной (Hex) системах. Ряд кодов (00–32, 7F) — управляющие и используются как команды (Cmd).
Проверить соответствие кода и символа можно в обычном «Блокноте» Windows: зажмите Alt и на цифровой клавиатуре введите десятичный код. Например, сочетание Alt+1 выведет символ ☺.
Так выглядит таблица ASCII с символами от 0 до 127:
| Dec | Hex | Char | Cmd |
|---|---|---|---|
| 0 | 0x00 | NUL | NUL |
| 1 | 0x01 | ☺ | SOH |
| 2 | 0x02 | ☻ | STX |
| 3 | 0x03 | ♥ | ETX |
| 4 | 0x04 | ♦ | EOT |
| 5 | 0x05 | ♣ | ENQ |
| 6 | 0x06 | ♠ | ACK |
| 7 | 0x07 | • | BEL |
| 8 | 0x08 | ◘ | BS |
| 9 | 0x09 | ○ | TAB |
| 10 | 0x0A | ◙ | LF |
| 11 | 0x0B | ♂ | VT |
| 12 | 0x0C | ♀ | FF |
| 13 | 0x0D | ♪ | CR |
| 14 | 0x0E | ♫ | SO |
| 15 | 0x0F | ☼ | SI |
| 16 | 0x10 | ► | DLE |
| 17 | 0x11 | ◄ | DC1 |
| 18 | 0x12 | ↕ | DC2 |
| 19 | 0x13 | ‼ | DC3 |
| 20 | 0x14 | ¶ | DC4 |
| 21 | 0x15 | § | NAK |
| 22 | 0x16 | ▬ | SYN |
| 23 | 0x17 | ↨ | ETB |
| 24 | 0x18 | ↑ | CAN |
| 25 | 0x19 | ↓ | EM |
| 26 | 0x1A | → | SUB |
| 27 | 0x1B | ← | ESC |
| 28 | 0x1C | ∟ | FS |
| 29 | 0x1D | ↔ | GS |
| 30 | 0x1E | ▲ | RS |
| 31 | 0x1F | ▼ | US |
| 32 | 0x20 | (sp) | |
| 33 | 0x21 | ! | |
| 34 | 0x22 | « | |
| 35 | 0x23 | # | |
| 36 | 0x24 | $ | |
| 37 | 0x25 | % | |
| 38 | 0x26 | & | |
| 39 | 0x27 | ‘ | |
| 40 | 0x28 | ( | |
| 41 | 0x29 | ) | |
| 42 | 0x2A | * | |
| 43 | 0x2B | + | |
| 44 | 0x2C | , | |
| 45 | 0x2D | — | |
| 46 | 0x2E | . | |
| 47 | 0x2F | / | |
| 48 | 0x30 | 0 | |
| 49 | 0x31 | 1 | |
| 50 | 0x32 | 2 | |
| 51 | 0x33 | 3 | |
| 52 | 0x34 | 4 | |
| 53 | 0x35 | 5 | |
| 54 | 0x36 | 6 | |
| 55 | 0x37 | 7 | |
| 56 | 0x38 | 8 | |
| 57 | 0x39 | 9 | |
| 58 | 0x3A | : | |
| 59 | 0x3B | ; | |
| 60 | 0x3C | < | |
| 61 | 0x3D | = | |
| 62 | 0x3E | > | |
| 63 | 0x3F | ? |
| Dec | Hex | Char | Cmd |
|---|---|---|---|
| 64 | 0x40 | @ | |
| 65 | 0x41 | A | |
| 66 | 0x42 | B | |
| 67 | 0x43 | C | |
| 68 | 0x44 | D | |
| 69 | 0x45 | E | |
| 70 | 0x46 | F | |
| 71 | 0x47 | G | |
| 72 | 0x48 | H | |
| 73 | 0x49 | I | |
| 74 | 0x4A | J | |
| 75 | 0x4B | K | |
| 76 | 0x4C | L | |
| 77 | 0x4D | M | |
| 78 | 0x4E | N | |
| 79 | 0x4F | O | |
| 80 | 0x50 | P | |
| 81 | 0x51 | Q | |
| 82 | 0x52 | R | |
| 83 | 0x53 | S | |
| 84 | 0x54 | T | |
| 85 | 0x55 | U | |
| 86 | 0x56 | V | |
| 87 | 0x57 | W | |
| 88 | 0x58 | X | |
| 89 | 0x59 | Y | |
| 90 | 0x5A | Z | |
| 91 | 0x5B | [ | |
| 92 | 0x5C | \ | |
| 93 | 0x5D | ] | |
| 94 | 0x5E | ^ | |
| 95 | 0x5F | _ | |
| 96 | 0x60 | ` | |
| 97 | 0x61 | a | |
| 98 | 0x62 | b | |
| 99 | 0x63 | c | |
| 100 | 0x64 | d | |
| 101 | 0x65 | e | |
| 102 | 0x66 | f | |
| 103 | 0x67 | g | |
| 104 | 0x68 | h | |
| 105 | 0x69 | i | |
| 106 | 0x6A | j | |
| 107 | 0x6B | k | |
| 108 | 0x6C | l | |
| 109 | 0x6D | m | |
| 110 | 0x6E | n | |
| 111 | 0x6F | o | |
| 112 | 0x70 | p | |
| 113 | 0x71 | q | |
| 114 | 0x72 | r | |
| 115 | 0x73 | s | |
| 116 | 0x74 | t | |
| 117 | 0x75 | u | |
| 118 | 0x76 | v | |
| 119 | 0x77 | w | |
| 120 | 0x78 | x | |
| 121 | 0x79 | y | |
| 122 | 0x7A | z | |
| 123 | 0x7B | { | |
| 124 | 0x7C | | | |
| 125 | 0x7D | } | |
| 126 | 0x7E | ~ | |
| 127 | 0x7F | ⌂ | DEL |
Пожалуйста, обратите внимание, что таблица содержит только основные управляющие символы, цифры, латинские буквы (строчные и заглавные), а также некоторые специальные символы. В более расширенной таблице ASCII (расширенная ASCII) есть символы с кодами от 128 до 255, но они могут варьироваться в зависимости от кодировки (например, UTF-8 или ISO-8859-1).
Ниже — таблица кодовой страницы IBM CP866, которую в DOS применяли для вывода кириллицы и псевдографики:
| Dec | Hex | Char |
|---|---|---|
| 128 | 0x80 | А |
| 129 | 0x81 | Б |
| 130 | 0x82 | В |
| 131 | 0x83 | Г |
| 132 | 0x84 | Д |
| 133 | 0x85 | Е |
| 134 | 0x86 | Ж |
| 135 | 0x87 | З |
| 136 | 0x88 | И |
| 137 | 0x89 | Й |
| 138 | 0x8A | К |
| 139 | 0x8B | Л |
| 140 | 0x8C | М |
| 141 | 0x8D | Н |
| 142 | 0x8E | О |
| 143 | 0x8F | П |
| 144 | 0x90 | Я |
| 145 | 0x91 | Р |
| 146 | 0x92 | С |
| 147 | 0x93 | Т |
| 148 | 0x94 | У |
| 149 | 0x95 | Ф |
| 150 | 0x96 | Х |
| 151 | 0x97 | Ц |
| 152 | 0x98 | Ч |
| 153 | 0x99 | Ш |
| 154 | 0x9A | Щ |
| 155 | 0x9B | Ъ |
| 156 | 0x9C | Ы |
| 157 | 0x9D | Ь |
| 158 | 0x9E | Э |
| 159 | 0x9F | Ю |
| 160 | 0xA0 | Я |
| Dec | Hex | Char |
|---|---|---|
| 161 | 0xA1 | а |
| 162 | 0xA2 | б |
| 163 | 0xA3 | в |
| 164 | 0xA4 | г |
| 165 | 0xA5 | д |
| 166 | 0xA6 | е |
| 167 | 0xA7 | ж |
| 168 | 0xA8 | з |
| 169 | 0xA9 | и |
| 170 | 0xAA | й |
| 171 | 0xAB | к |
| 172 | 0xAC | л |
| 173 | 0xAD | м |
| 174 | 0xAE | н |
| 175 | 0xAF | о |
| 176 | 0xB0 | п |
| 177 | 0xB1 | ░ |
| 178 | 0xB2 | ▒ |
| 179 | 0xB3 | ▓ |
| 180 | 0xB4 | │ |
| 181 | 0xB5 | ┤ |
| 182 | 0xB6 | ╡ |
| 183 | 0xB7 | ╢ |
| 184 | 0xB8 | ╖ |
| 185 | 0xB9 | ╕ |
| 186 | 0xBA | ╣ |
| 187 | 0xBB | ║ |
| 188 | 0xBC | ╗ |
| 189 | 0xBD | ╝ |
| 190 | 0xBE | ╜ |
| 191 | 0xBF | ╛ |
| Dec | Hex | Char |
|---|---|---|
| 192 | 0xC0 | ┐ |
| 193 | 0xC1 | └ |
| 194 | 0xC2 | ┴ |
| 195 | 0xC3 | ┬ |
| 196 | 0xC4 | ├ |
| 197 | 0xC5 | ─ |
| 198 | 0xC6 | ┼ |
| 199 | 0xC7 | ã |
| 200 | 0xC8 | Ã |
| 201 | 0xC9 | ╚ |
| 202 | 0xCA | ╔ |
| 203 | 0xCB | ╩ |
| 204 | 0xCC | ╦ |
| 205 | 0xCD | ╠ |
| 206 | 0xCE | ═ |
| 207 | 0xCF | ╬ |
| 208 | 0xD0 | ¤ |
| 209 | 0xD1 | ð |
| 210 | 0xD2 | Ð |
| 211 | 0xD3 | Ê |
| 212 | 0xD4 | Ë |
| 213 | 0xD5 | È |
| 214 | 0xD6 | Í |
| 215 | 0xD7 | Î |
| 216 | 0xD8 | Ï |
| 217 | 0xD9 | ┘ |
| 218 | 0xDA | ┌ |
| 219 | 0xDB | █ |
| 220 | 0xDC | ▄ |
| 221 | 0xDD | ▌ |
| 222 | 0xDE | ▐ |
| 223 | 0xDF | ▀ |
| Dec | Hex | Char |
|---|---|---|
| 224 | 0xE0 | α |
| 225 | 0xE1 | ß |
| 226 | 0xE2 | Γ |
| 227 | 0xE3 | π |
| 228 | 0xE4 | Σ |
| 229 | 0xE5 | σ |
| 230 | 0xE6 | µ |
| 231 | 0xE7 | τ |
| 232 | 0xE8 | Φ |
| 233 | 0xE9 | Θ |
| 234 | 0xEA | Ω |
| 235 | 0xEB | δ |
| 236 | 0xEC | ∞ |
| 237 | 0xED | φ |
| 238 | 0xEE | ε |
| 239 | 0xEF | ∩ |
| 240 | 0xF0 | ≡ |
| 241 | 0xF1 | ± |
| 242 | 0xF2 | ≥ |
| 243 | 0xF3 | ≤ |
| 244 | 0xF4 | ⌠ |
| 245 | 0xF5 | ⌡ |
| 246 | 0xF6 | ÷ |
| 247 | 0xF7 | ≈ |
| 248 | 0xF8 | ° |
| 249 | 0xF9 | ∙ |
| 250 | 0xFA | · |
| 251 | 0xFB | √ |
| 252 | 0xFC | № |
| 253 | 0xFD | ¤ |
| 254 | 0xFE | ■ |
| 255 | 0xFF | (nbsp) |
Что такое ASCII
Таблицу разработали в Америке в 60-х, и ее название расшифровывается как American Standard Code for Information Interchange — Американская стандартная кодировка для обмена информацией. Аббревиатура читается как «аски».
Существуют национальные расширения ASCII, которые кодируют буквы и символы, принятые в других алфавитах. «Стандартная» таблица называется US-ASCII, или международной версией. В большинстве национальных расширений заменена только часть символов, например знак доллара на знак фунта. Но для языков, где используются нелатинские алфавиты, заменяется большинство символов. Русский относится к таким языкам.
Для чего нужна таблица ASCII
Цифровое устройство по умолчанию не понимает символы — только числа. Поэтому буквы, цифры и знаки приходится кодировать, чтобы задавать компьютеру соответствие между определенным начертанием и числовым значением. Сейчас вариантов кодирования несколько, и ASCII — одна из наиболее ранних кодировок. Она задала стандарты для последующих решений.
Когда появилась эта кодировка, компьютеров в современном представлении еще не существовало. Ее разработали для телетайпов — устройств обмена информацией, похожих на телеграфы с печатной машинкой. Сейчас ими практически не пользуются, но некоторые стандарты остались с тех времен. В том числе набор ASCII, который теперь применяется для кодирования информации в компьютерах.
Сейчас с помощью ASCII кодируются данные в компьютерных устройствах, на ней основано несколько других кодировок, кроме того, ее используют в творчестве — создают с помощью символов картинки. Это называется ASCII art.
Применение на практике
- При разработке сайта или приложения разработчику может понадобиться пользоваться ASCII, чтобы закодировать символы, не входящие в национальную кодировку.
- Можно сохранить документ или иной файл в формате ASCII — тогда все символы в нем будут закодированы этим набором. Такое может понадобиться, если человеку нужно передать информацию, которая будет читаться везде, — но некоторые функции форматирования в таком режиме будут недоступны.
- Можно ввести код ASCII с клавиатуры напрямую: при зажатом Alt набрать числовое значение, которое соответствует тому или иному символу из таблицы. Так можно печатать и символы, которые есть в расширенных версиях набора: смайлики, иероглифы, буквы алфавитов других стран и так далее. Код для таких символов может быть намного длиннее, чем для стандартных 128 букв и цифр.
Как устроена ASCII внутри
С помощью ASCII вводят, выводят и передают информацию, поэтому она должна описывать самые часто используемые символы и управляющие элементы (перенос, шаг назад и так далее). Таблица восьмибитная, а числа, которые соответствуют символам, переводятся в двоичный код, чтобы компьютер мог их распознавать. Десятичное же написание удобнее для людей. Еще используют шестнадцатеричное — с его помощью легче представить набор в виде таблицы.
Заглавные и строчные буквы в ASCII — это разные элементы. Причем в таблице строчные буквы расположены под заглавными, в том же столбце, но в разных строчках. Так набор оказывается нагляднее, а информацию легче проверять и работать с ней, например редактировать регистр с помощью автоматических команд.
Как расположены символы в ASCII
- Первые две строчки таблицы — управляющие символы: Backspace, перевод строки, начало и конец абзаца и прочие.
- В третьей строке расположены знаки препинания и специальные символы, такие как процент % или астериск*.
- Четвертая строка — числа и математические символы, а также двоеточие, точка с запятой и вопросительный знак.
- Пятая и шестая строчка — заглавные буквы, а также некоторые другие особые символы.
- Седьмая и восьмая строки описывают строчные буквы и еще несколько символов.
Отличия от Unicode
Когда мы говорим о кодировании, сразу вспоминается система международной кодировки символов Unicode. Важно не путать ее с ASCII — эти понятия не идентичны.
ASCII появилась раньше и включает в себя меньше символов. В стандартной таблице их всего 128, если не считать расширений для других языков. А в «Юникоде», который реализуют кодировки UTF-8 и UTF-32, сейчас 2²¹ символов — это больше чем два миллиона. В набор входят практически все существующие сегодня символы, он очень широкий.
Unicode можно рассматривать как «продолжение», расширение ASCII. Первые 128 символов в «Юникоде» кодируются так же, как в ASCII, и это те же самые символы.


0 комментариев