Общие наборы символов HTML
Меню
Справочник

Кодирование HTML (наборы символов)

Кодирование HTML (наборы символов)

Для правильного отображения HTML-страницы веб-браузер должен знать, какой набор символов использовать.


Общие наборы символов HTML

Из ASCII в UTF-8

ASCII был первым стандартом кодирования символов. ASCII определяет 128 различных символов, которые можно использовать в Интернете: цифры (0-9), английские буквы (A-Z) и некоторые специальные символы, такие как ! $ + - ( ) @ < > .

ISO-8859-1 был набором символов по умолчанию для HTML 4. Этот набор символов поддерживал 256 различных кодов символов. HTML 4 также поддерживает UTF-8.

ANSI (Windows-1252) был оригинальным набором символов Windows. ANSI идентичен ISO-8859-1, за исключением того, что ANSI имеет 32 дополнительных символа.

Примечание: спецификация HTML5 поощряет веб-разработчиков использовать набор символов UTF-8, который охватывает почти все знаки и символы в мире!

Атрибут HTML - кодировки

Для правильного отображения HTML-страницы веб-браузер должен знать набор символов, используемый на странице.

Это указано в теге <meta>:

<meta charset="UTF-8">

Различия между наборами символов

В следующей таблице показаны различия между наборами символов, описанными выше:

Номер ASCII ANSI 8859 UTF-8 Описание
32         пробел
33 ! ! ! ! восклицательный знак
34 " " " " кавычка
35 # # # # знак номера
36 $ $ $ $ знак доллара
37 % % % % знак процента
38 & & & & амперсанд
39 ' ' ' ' апостроф
40 ( ( ( ( левая скобка
41 ) ) ) ) правая скобка
42 * * * * звездочка
43 + + + + знак плюс
44 , , , , запятая
45 - - - - дефис-минус
46 . . . . точка
47 / / / / солид (косая черта)
48 0 0 0 0 цифра ноль
49 1 1 1 1 цифра один
50 2 2 2 2 цифра два
51 3 3 3 3 цифра три
52 4 4 4 4 цифра четыре
53 5 5 5 5 цифра пять
54 6 6 6 6 цифра шесть
55 7 7 7 7 цифра семь
56 8 8 8 8 цифра восемь
57 9 9 9 9 цифра девять
58 : : : : двоеточие
59 ; ; ; ; точка с запятой
60 < < < < знак меньше
61 = = = = знак равенства
62 > > > > знак больше
63 ? ? ? ? вопросительный знак
64 @ @ @ @ коммерческое „эт“
65 A A A A Латинская заглавная буква А
66 B B B B Латинская заглавная буква В
67 C C C C Латинская заглавная буква C
68 D D D D Латинская заглавная буква D
69 E E E E Латинская заглавная буква E
70 F F F F Латинская заглавная буква F
71 G G G G Латинская заглавная буква G
72 H H H H Латинская заглавная буква H
73 I I I I Латинская заглавная буква I
74 J J J J Латинская заглавная буква J
75 K K K K Латинская заглавная буква K
76 L L L L Латинская заглавная буква L
77 M M M M Латинская заглавная буква M
78 N N N N Латинская заглавная буква N
79 O O O O Латинская заглавная буква O
80 P P P P Латинская заглавная буква P
81 Q Q Q Q Латинская заглавная буква Q
82 R R R R Латинская заглавная буква R
83 S S S S Латинская заглавная буква S
84 T T T T Латинская заглавная буква T
85 U U U U Латинская заглавная буква U
86 V V V V Латинская заглавная буква V
87 W W W W Латинская заглавная буква W
88 X X X X Латинская заглавная буква X
89 Y Y Y Y Латинская заглавная буква Y
90 Z Z Z Z Латинская заглавная буква Z
91 [ [ [ [ левая квадратная скобка
92 \ \ \ \ обратный солид (косая черта)
93 ] ] ] ] правая квадратная скобка
94 ^ ^ ^ ^ циркумфлекс акцент
95 _ _ _ _ нижняя линия
96 ` ` ` ` серьезный акцент
97 a a a a Латинская строчная буква a
98 b b b b Латинская строчная буква b
99 c c c c Латинская строчная буква c
100 d d d d Латинская строчная буква d
101 e e e e Латинская строчная буква e
102 f f f f Латинская строчная буква f
103 g g g g Латинская строчная буква g
104 h h h h Латинская строчная буква h
105 i i i i Латинская строчная буква i
106 j j j j Латинская строчная буква j
107 k k k k Латинская строчная буква k
108 l l l l Латинская строчная буква l
109 m m m m Латинская строчная буква m
110 n n n n Латинская строчная буква n
111 o o o o Латинская строчная буква o
112 p p p p Латинская строчная буква p
113 q q q q Латинская строчная буква q
114 r r r r Латинская строчная буква r
115 s s s s Латинская строчная буква s
116 t t t t Латинская строчная буква t
117 u u u u Латинская строчная буква u
118 v v v v Латинская строчная буква v
119 w w w w Латинская строчная буква w
120 x x x x Латинская строчная буква x
121 y y y y Латинская строчная буква y
122 z z z z Латинская строчная буква z
123 { { { { левая фигурная скобка
124 | | | | вертикальная линия
125 } } } } правая фигурная скобка
126 ~ ~ ~ ~ тильда
127 DEL        
128       знак евро
129      НЕ ИСПОЛЬЗУЕТСЯ
130       одинарная нижняя 9 кавычка
131   ƒ     Латинская строчная буква f с крючком
132       двойная нижняя 9 кавычка
133       горизонтальное многоточие
134       кинжал
135       двойной кинжал
136   ˆ     буква-модификатор с акцентом циркумфлекс
137       знак промилле
138   Š     Латинская заглавная буква S с гачеком
139       одинарная кавычка, указывающая влево
140   Œ     Латинская заглавная лигатура OE
141       НЕ ИСПОЛЬЗУЕТСЯ
142   Ž     Латинская заглавная буква Z с гачеком
143      НЕ ИСПОЛЬЗУЕТСЯ
144      НЕ ИСПОЛЬЗУЕТСЯ
145       левая одинарная кавычка
146       правая одинарная кавычка
147       левая двойная кавычка
148       правая двойная кавычка
149       буллит
150       короткое тире
151       длинное тире
152   ˜     маленькая тильда
153       знак торговой марки
154   š     Латинская строчная буква s с гачеком
155       одинарная правая кавычка
156   œ     Латинская малая лигатура oe
157      НЕ ИСПОЛЬЗУЕТСЯ
158   ž     Латинская строчная буква z с гачеком
159   Ÿ     Латинская заглавная буква Y с диэрезисом
160         неразрывный пробел
161   ¡ ¡ ¡ перевернутый восклицательный знак
162   ¢ ¢ ¢ знак цента
163   £ £ £ знак фунта стерлингов
164   ¤ ¤ ¤ знак валюты
165   ¥ ¥ ¥ знак иены
166   ¦ ¦ ¦ сломанный стержень
167   § § § знак раздела
168   ¨ ¨ ¨ диэрезис
169   © © © знак авторского права
170   ª ª ª женский порядковый индикатор
171   « « « двойная кавычка, указывающая влево
172   ¬ ¬ ¬ знак отрицания
173   ­ ­ ­ мягкий дефис
174   ® ® ® зарегистрированный товарный знак
175   ¯ ¯ ¯ макрон
176   ° ° ° знак градуса
177   ± ± ± знак плюс-минус
178   ² ² ² надстрочный индекс два
179   ³ ³ ³ надстрочный индекс три
180   ´ ´ ´ острый акцент
181   µ µ µ микро знак
182   знак абзаца
183   · · · средняя точка
184   ¸ ¸ ¸ седиль
185   ¹ ¹ ¹ верхний индекс один
186   º º º мужской порядковый индикатор
187   » » » двойная кавычка, указывающая вправо
188   ¼ ¼ ¼ дробь одна четверть
189   ½ ½ ½ дробь одна вторая
190   ¾ ¾ ¾ дробь три четверти
191   ¿ ¿ ¿ перевернутый вопросительный знак
192   À À À Латинская заглавная буква А с грависом
193   Á Á Á Латинская заглавная буква А с акутом
194   Â Â Â Латинская заглавная буква А с циркумфлексом
195   Ã Ã Ã Латинская заглавная буква А с тильдой
196   Ä Ä Ä Латинская заглавная буква А с диэрезисом
197   Å Å Å Латинская заглавная буква А с кружком
198   Æ Æ Æ Латинская заглавная буква АЕ
199   Ç Ç Ç Латинская заглавная буква C с седилью
200   È È È Латинская заглавная буква E с грависом
201   É É É Латинская заглавная буква E с акутом
202   Ê Ê Ê Латинская заглавная буква E с циркумфлексом
203   Ë Ë Ë Латинская заглавная буква E с диэрезисом
204   Ì Ì Ì Латинская заглавная буква I с грависом
205   Í Í Í Латинская заглавная буква I с акутом
206   Î Î Î Латинская заглавная буква I с циркумфлексом
207   Ï Ï Ï Латинская заглавная буква I с диэрезисом
208   Ð Ð Ð Латинская заглавная буква Eth
209   Ñ Ñ Ñ Латинская заглавная буква N с тильдой
210   Ò Ò Ò Латинская заглавная буква O с грависом
211   Ó Ó Ó Латинская заглавная буква O с акутом
212   Ô Ô Ô Латинская заглавная буква O с циркумфлексом
213   Õ Õ Õ Латинская заглавная буква O с тильдой
214   Ö Ö Ö Латинская заглавная буква O с диэрезисом
215   × × × знак умножения
216   Ø Ø Ø Латинская заглавная буква О со штрихом
217   Ù Ù Ù Латинская заглавная буква U с грависом
218   Ú Ú Ú Латинская заглавная буква U с акутом
219   Û Û Û Латинская заглавная буква U с циркумфлексом
220   Ü Ü Ü Латинская заглавная буква U с диэрезисом
221   Ý Ý Ý Латинская заглавная буква Y с акутом
222   Þ Þ Þ Латинская заглавная буква Торн
223   ß ß ß Латинская строчная буква s-диез (эсцет, нем.)
224   à à à Латинская строчная буква a с грависом
225   á á á Латинская строчная буква a с акутом
226   â â â Латинская строчная буква a с циркумфлексом
227   ã ã ã Латинская строчная буква a с тильдой
228   ä ä ä Латинская строчная буква a с диэрезисом
229   å å å Латинская строчная буква a с кружком
230   æ æ æ Латинская строчная буква ae
231   ç ç ç Латинская строчная буква c с седилью
232   è è è Латинская строчная буква e с грависом
233   é é é Латинская строчная буква e с акутом
234   ê ê ê Латинская строчная буква e с циркумфлексом
235   ë ë ë Латинская строчная буква e с диэрезисом
236   ì ì ì Латинская строчная буква i с грависом
237   í í í Латинская строчная буква i с акутом
238   î î î Латинская строчная буква i с циркумфлексом
239   ï ï ï Латинская строчная буква i с диэрезисом
240   ð ð ð Латинская строчная буква eth
241   ñ ñ ñ Латинская строчная буква n с тильдой
242   ò ò ò Латинская строчная буква o с грависом
243   ó ó ó Латинская строчная буква o с акутом
244   ô ô ô Латинская строчная буква o с циркумфлексом
245   õ õ õ Латинская строчная буква o с тильдой
246   ö ö ö Латинская строчная буква o с диэрезисом
247   ÷ ÷ ÷ знак деления
248   ø ø ø Латинская строчная буква o со штрихом
249   ù ù ù Латинская строчная буква u с грависом
250   ú ú ú Латинская строчная буква u с акутом
251   û û û Латинская строчная буква с циркумфлексом
252   ü ü ü Латинская строчная буква u с диэрезисом
253   ý ý ý Латинская строчная буква y с акутом
254   þ þ þ Латинская строчная буква трон
255   ÿ ÿ ÿ Латинская строчная буква y с диэрезисом

Набор символов ASCII

ASCII использует значения от 0 до 31 (и 127) для управляющих символов.

ASCII использует значения от 32 до 126 для букв, цифр и символов.

ASCII не использует значения от 128 до 255.


Набор символов ANSI (Windows-1252)

ANSI идентичен ASCII для значений от 0 до 127.

ANSI имеет собственный набор символов для значений от 128 до 159.

ANSI идентичен UTF-8 для значений от 160 до 255.


Набор символов ISO-8859-1

ISO-8859-1 идентичен ASCII для значений от 0 до 127.

ISO-8859-1 не использует значения от 128 до 159.

ISO-8859-1 идентичен UTF-8 для значений от 160 до 255.


Набор символов UTF-8

UTF-8 идентичен ASCII для значений от 0 до 127.

UTF-8 не использует значения от 128 до 159.

UTF-8 идентичен как ANSI, так и 8859-1 для значений от 160 до 255.

UTF-8 продолжает значение 256 с более чем 10 000 различных символов.


☛ Унифицированные локаторы ресурсов HTML

Использование эмодзи в HTML ☚

 

Поделиться ссылкой