Баннер мобильный (1) Пройти тест

ASCII

Глоссарий

19 августа 2023

Поделиться

Скопировано

Содержание

    ASCII — это таблица кодировки символов, в которой каждой букве, числу или знаку соответствует определенное число. В стандартной таблице ASCII 128 символов, пронумерованных от 0 до 127. В них входят латинские буквы, цифры, знаки препинания и управляющие символы.

    таблица кодировки символов ASCII
    Как выглядит таблица ASCII

    Что такое ASCII

    Таблицу разработали в Америке в 60-х, и ее название расшифровывается как American Standard Code for Information Interchange — Американская стандартная кодировка для обмена информацией. Аббревиатура читается как «аски».

    Существуют национальные расширения ASCII, которые кодируют буквы и символы, принятые в других алфавитах. «Стандартная» таблица называется US-ASCII, или международной версией. В большинстве национальных расширений заменена только часть символов, например знак доллара на знак фунта. Но для языков, где используются нелатинские алфавиты, заменяется большинство символов. Русский относится к таким языкам.

    Для чего нужна таблица ASCII

    Цифровое устройство по умолчанию не понимает символы — только числа. Поэтому буквы, цифры и знаки приходится кодировать, чтобы задавать компьютеру соответствие между определенным начертанием и числовым значением. Сейчас вариантов кодирования несколько, и ASCII — одна из наиболее ранних кодировок. Она задала стандарты для последующих решений.

    Когда появилась эта кодировка, компьютеров в современном представлении еще не существовало. Ее разработали для телетайпов — устройств обмена информацией, похожих на телеграфы с печатной машинкой. Сейчас ими практически не пользуются, но некоторые стандарты остались с тех времен. В том числе набор ASCII, который теперь применяется для кодирования информации в компьютерах.

    Сейчас с помощью ASCII кодируются данные в компьютерных устройствах, на ней основано несколько других кодировок, кроме того, ее используют в творчестве — создают с помощью символов картинки. Это называется ASCII art.

    Применение на практике

    • При разработке сайта или приложения разработчику может понадобиться пользоваться ASCII, чтобы закодировать символы, не входящие в национальную кодировку.
    • Можно сохранить документ или иной файл в формате ASCII — тогда все символы в нем будут закодированы этим набором. Такое может понадобиться, если человеку нужно передать информацию, которая будет читаться везде, — но некоторые функции форматирования в таком режиме будут недоступны.
    • Можно ввести код ASCII с клавиатуры напрямую: при зажатом Alt набрать числовое значение, которое соответствует тому или иному символу из таблицы. Так можно печатать и символы, которые есть в расширенных версиях набора: смайлики, иероглифы, буквы алфавитов других стран и так далее. Код для таких символов может быть намного длиннее, чем для стандартных 128 букв и цифр.

    Как устроена ASCII внутри

    С помощью ASCII вводят, выводят и передают информацию, поэтому она должна описывать самые часто используемые символы и управляющие элементы (перенос, шаг назад и так далее). Таблица восьмибитная, а числа, которые соответствуют символам, переводятся в двоичный код, чтобы компьютер мог их распознавать. Десятичное же написание удобнее для людей. Еще используют шестнадцатеричное — с его помощью легче представить набор в виде таблицы.

    Заглавные и строчные буквы в ASCII — это разные элементы. Причем в таблице строчные буквы расположены под заглавными, в том же столбце, но в разных строчках. Так набор оказывается нагляднее, а информацию легче проверять и работать с ней, например редактировать регистр с помощью автоматических команд.

    Как расположены символы в ASCII

    • Первые две строчки таблицы — управляющие символы: Backspace, перевод строки, начало и конец абзаца и прочие.
    • В третьей строке расположены знаки препинания и специальные символы, такие как процент % или астериск*.
    • Четвертая строка — числа и математические символы, а также двоеточие, точка с запятой и вопросительный знак.
    • Пятая и шестая строчка — заглавные буквы, а также некоторые другие особые символы.
    • Седьмая и восьмая строки описывают строчные буквы и еще несколько символов.

    Отличия от Unicode

    Когда мы говорим о кодировании, сразу вспоминается система международной кодировки символов Unicode. Важно не путать ее с ASCII — эти понятия не идентичны.

    ASCII появилась раньше и включает в себя меньше символов. В стандартной таблице их всего 128, если не считать расширений для других языков. А в «Юникоде», который реализуют кодировки UTF-8 и UTF-32, сейчас 2²¹ символов — это больше чем два миллиона. В набор входят практически все существующие сегодня символы, он очень широкий.

    Unicode можно рассматривать как «продолжение», расширение ASCII. Первые 128 символов в «Юникоде» кодируются так же, как в ASCII, и это те же самые символы.

    Так выглядит таблица ASCII (American Standard Code for Information Interchange) с символами от 0 до 127:

    DEC  HEX  CHAR
    -------------
      0  00   NUL (Null)
      1  01   SOH (Start of Heading)
      2  02   STX (Start of Text)
      3  03   ETX (End of Text)
      4  04   EOT (End of Transmission)
      5  05   ENQ (Enquiry)
      6  06   ACK (Acknowledgment)
      7  07   BEL (Bell)
      8  08   BS  (Backspace)
      9  09   TAB (Horizontal Tab)
     10  0A   LF  (Line Feed)
     11  0B   VT  (Vertical Tab)
     12  0C   FF  (Form Feed)
     13  0D   CR  (Carriage Return)
     14  0E   SO  (Shift Out)
     15  0F   SI  (Shift In)
     16  10   DLE (Data Link Escape)
     17  11   DC1 (Device Control 1)
     18  12   DC2 (Device Control 2)
     19  13   DC3 (Device Control 3)
     20  14   DC4 (Device Control 4)
     21  15   NAK (Negative Acknowledgement)
     22  16   SYN (Synchronous Idle)
     23  17   ETB (End of Transmission Block)
     24  18   CAN (Cancel)
     25  19   EM  (End of Medium)
     26  1A   SUB (Substitute)
     27  1B   ESC (Escape)
     28  1C   FS  (File Separator)
     29  1D   GS  (Group Separator)
     30  1E   RS  (Record Separator)
     31  1F   US  (Unit Separator)
     32  20   SPACE (Space)
     33  21   !   (Exclamation Mark)
     34  22   "   (Double Quote)
     35  23   #   (Number Sign)
     36  24   $   (Dollar Sign)
     37  25   %   (Percent Sign)
     38  26   &   (Ampersand)
     39  27   '   (Single Quote)
     40  28   (   (Left Parenthesis)
     41  29   )   (Right Parenthesis)
     42  2A   *   (Asterisk)
     43  2B   +   (Plus Sign)
     44  2C   ,   (Comma)
     45  2D   -   (Hyphen-Minus)
     46  2E   .   (Period)
     47  2F   /   (Slash)
     48  30   0   (Digit Zero)
     49  31   1   (Digit One)
     50  32   2   (Digit Two)
     51  33   3   (Digit Three)
     52  34   4   (Digit Four)
     53  35   5   (Digit Five)
     54  36   6   (Digit Six)
     55  37   7   (Digit Seven)
     56  38   8   (Digit Eight)
     57  39   9   (Digit Nine)
     58  3A   :   (Colon)
     59  3B   ;   (Semicolon)
     60  3C   <   (Less-Than Sign)
     61  3D   =   (Equal Sign)
     62  3E   >   (Greater-Than Sign)
     63  3F   ?   (Question Mark)
     64  40   @   (Commercial At)
     65  41   A
     66  42   B
     67  43   C
     68  44   D
     69  45   E
     70  46   F
     71  47   G
     72  48   H
     73  49   I
     74  4A   J
     75  4B   K
     76  4C   L
     77  4D   M
     78  4E   N
     79  4F   O
     80  50   P
     81  51   Q
     82  52   R
     83  53   S
     84  54   T
     85  55   U
     86  56   V
     87  57   W
     88  58   X
     89  59   Y
     90  5A   Z
     91  5B   [   (Left Square Bracket)
     92  5C   \   (Backslash)
     93  5D   ]   (Right Square Bracket)
     94  5E   ^   (Caret / Circumflex)
     95  5F   _   (Underscore)
     96  60   `   (Grave Accent)
     97  61   a
     98  62   b
     99  63   c
    100  64   d
    101  65   e
    102  66   f
    103  67   g
    104  68   h
    105  69   i
    106  6A   j
    107  6B   k
    108  6C   l
    109  6D   m
    110  6E   n
    111  6F   o
    112  70   p
    113  71   q
    114  72   r
    115  73   s
    116  74   t
    117  75   u
    118  76   v
    119  77   w
    120  78   x
    121  79   y
    122  7A   z
    123  7B   {   (Left Curly Brace)
    124  7C   |   (Vertical Bar)
    125  7D   }   (Right Curly Brace)
    126  7E   ~   (Tilde)
    127  7F   DEL (Delete)
    

    Пожалуйста, обратите внимание, что таблица содержит только основные управляющие символы, цифры, латинские буквы (строчные и заглавные), а также некоторые специальные символы. В более расширенной таблице ASCII (расширенная ASCII) есть символы с кодами от 128 до 255, но они могут варьироваться в зависимости от кодировки (например, UTF-8 или ISO-8859-1).

    Поделиться

    Скопировано

    0 комментариев

    Комментарии