Html кодировки

Range: Decimal 8448-8527. Hex 2100-214F.

If you want any of these characters displayed in HTML, you can use the HTML entity found in the table below.

If the character does not have an HTML entity, you can use the decimal (dec) or hexadecimal (hex) reference.

Will display as:


I will display I will display I will display

Older browsers may not support all the HTML5 entities in the table below. Chrome and Opera have good support, and IE 11+ and Firefox 35+ support all the entities.

Char Dec Hex Entity Name
8448 2100   ACCOUNT OF
8449 2101   ADDRESSED TO THE SUBJECT
8450 2102   DOUBLE-STRUCK CAPITAL C
8451 2103   DEGREE CELSIUS
8452 2104   CENTRE LINE SYMBOL
8453 2105   CARE OF
8454 2106   CADA UNA
8455 2107   EULER CONSTANT
8456 2108   SCRUPLE
8457 2109   DEGREE FAHRENHEIT
8458 210A   SCRIPT SMALL G
8459 210B   SCRIPT CAPITAL H
8460 210C   BLACK-LETTER CAPITAL H
8461 210D   DOUBLE-STRUCK CAPITAL H
8462 210E   PLANCK CONSTANT
8463 210F   PLANCK CONSTANT OVER TWO PI
8464 2110   SCRIPT CAPITAL I
8465 2111 ℑ BLACK-LETTER CAPITAL I
8466 2112   SCRIPT CAPITAL L
8467 2113   SCRIPT SMALL L
8468 2114   L B BAR SYMBOL
8469 2115   DOUBLE-STRUCK CAPITAL N
8470 2116   NUMERO SIGN
8471 2117   SOUND RECORDING COPYRIGHT
8472 2118 ℘ SCRIPT CAPITAL P
8473 2119   DOUBLE-STRUCK CAPITAL P
8474 211A   DOUBLE-STRUCK CAPITAL Q
8475 211B   SCRIPT CAPITAL R
8476 211C ℜ BLACK-LETTER CAPITAL R
8477 211D   DOUBLE-STRUCK CAPITAL R
8478 211E   PRESCRIPTION TAKE
8479 211F   RESPONSE
8480 2120   SERVICE MARK
8481 2121   TELEPHONE SIGN
8482 2122 ™ TRADE MARK SIGN
8483 2123   VERSICLE
8484 2124   DOUBLE-STRUCK CAPITAL Z
8485 2125   OUNCE SIGN
8486 2126 Ω OHM SIGN
8487 2127 ℧ INVERTED OHM SIGN
8488 2128   BLACK-LETTER CAPITAL Z
8489 2129   TURNED GREEK SMALL LETTER IOTA
8490 212A   KELVIN SIGN
8491 212B   ANGSTROM SIGN
8492 212C   SCRIPT CAPITAL B
8493 212D   BLACK-LETTER CAPITAL C
8494 212E   ESTIMATED SYMBOL
8495 212F   SCRIPT SMALL E
8496 2130   SCRIPT CAPITAL E
8497 2131   SCRIPT CAPITAL F
8498 2132   TURNED CAPITAL F
8499 2133   SCRIPT CAPITAL M
8500 2134   SCRIPT SMALL O
8501 2135 ℵ ALEF SYMBOL
8502 2136   BET SYMBOL
8503 2137   GIMEL SYMBOL
8504 2138   DALET SYMBOL
8505 2139   INFORMATION SOURCE
8506 213A   ROTATED CAPITAL Q
8507 213B   FACSIMILE SIGN
8508 213C   DOUBLE-STRUCK SMALL PI
8509 213D   DOUBLE-STRUCK SMALL GAMMA
8510 213E   DOUBLE-STRUCK CAPITAL GAMMA
8511 213F   DOUBLE-STRUCK CAPITAL PI
8512 2140   DOUBLE-STRUCK N-ARY SUMMATION
8513 2141   TURNED SANS-SERIF CAPITAL G
8514 2142   TURNED SANS-SERIF CAPITAL L
8515 2143   REVERSED SANS-SERIF CAPITAL L
8516 2144   TURNED SANS-SERIF CAPITAL Y
8517 2145   DOUBLE-STRUCK ITALIC CAPITAL D
8518 2146   DOUBLE-STRUCK ITALIC SMALL D
8519 2147   DOUBLE-STRUCK ITALIC SMALL E
8520 2148   DOUBLE-STRUCK ITALIC SMALL I
8521 2149   DOUBLE-STRUCK ITALIC SMALL J
8522 214A   PROPERTY LINE
8523 214B   TURNED AMPERSAND
8524 214C   PER SIGN
8525 214D   AKTIESELSKAB
8526 214E   TURNED SMALL F
8527 214F   SYMBOL FOR SAMARITAN SOURCE

HTML Tags

<!—><!DOCTYPE><a><abbr><acronym><address><applet><area><article><aside><audio><b><base><basefont><bdi><bdo><big><blockquote><body><br><button><canvas><caption><center><cite><code><col><colgroup><data><datalist><dd><del><details><dfn><dialog><dir><div><dl><dt><em><embed><fieldset><figcaption><figure><font><footer><form><frame><frameset><h1> — <h6><head><header><hr><html><i><iframe><img><input><ins><kbd><label><legend><li><link><main><map><mark><meta><meter><nav><noframes><noscript><object><ol><optgroup><option><output><p><param><picture><pre><progress><q><rp><rt><ruby><s><samp><script><section><select><small><source><span><strike><strong><style><sub><summary><sup><svg><table><tbody><td><template><textarea><tfoot><th><thead><time><title><tr><track><tt><u><ul><var><video>

HTML Tutorial

HTML HOMEHTML IntroductionHTML EditorsHTML BasicHTML ElementsHTML AttributesHTML HeadingsHTML ParagraphsHTML StylesHTML FormattingHTML QuotationsHTML CommentsHTML Colors Colors RGB HEX HSL

HTML CSSHTML Links Links Link Colors Link Bookmarks

HTML Images Images Image Map Background Images The Picture Element

HTML TablesHTML Lists Lists Unordered Lists Ordered Lists Other Lists

HTML Block & InlineHTML ClassesHTML IdHTML IframesHTML JavaScriptHTML File PathsHTML HeadHTML LayoutHTML ResponsiveHTML ComputercodeHTML SemanticsHTML Style GuideHTML EntitiesHTML SymbolsHTML EmojisHTML CharsetHTML URL EncodeHTML vs. XHTML

In the Beginning: ASCII

Computer data is stored as binary codes (01000101) in the electronics.

To standardize the storing of text, the American Standard Code for Information Interchange (ASCII) was created. It defined a unique binary number for each storable character to support the numbers from 0-9, the upper and lower case alphabet (a-z, A-Z), and special characters like ! $ + — ( ) @ < > , .

Since ASCII used 7 bits for the character, it could only represent 128 different characters.

The biggest weakness with ASCII, was that it excluded non English letters.

ASCII is still in use today, especially in large mainframe computer systems.

For a closer look, please study our Complete ASCII Reference.

Что такое кодировка символов?

Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).

ASCII был первым стандартом кодировки символов (также называемый набором символов). ASCII определил 128 различных буквенно-цифровых символов, которые можно использовать в Интернете: цифры (0-9), английские буквы (A-Z) и некоторые специальные символы, такие как ! $ + — ( ) @ < > .

ISO-8859-1 был набором символов по умолчанию для HTML 4. Этот набор символов также поддерживал 256 различных кодов символов.

ANSI (Windows-1252) был оригинальным набором символов Windows. ANSI идентичен ISO-8859-1, за исключением того, что ANSI имеет 32 дополнительных символа.

Поскольку ANSI и ISO-8859-1 были настолько ограничены, HTML 4 также поддерживал UTF-8.

UTF-8 (Unicode) охватывает практически все знаки и символы в мире.

Кодировка символов по умолчанию для HTML5 — UTF-8.

The Unicode Character Sets

Unicode can be implemented by different character sets. The most commonly used encodings are UTF-8 and UTF-16:

Character-set Description
UTF-8 A character in UTF8 can be from 1 to 4 bytes long. UTF-8 can represent any character in the Unicode standard. UTF-8 is backwards compatible with ASCII. UTF-8 is the preferred encoding for e-mail and web pages
UTF-16 16-bit Unicode Transformation Format is a variable-length character encoding for Unicode, capable of encoding the entire Unicode repertoire. UTF-16 is used in major operating systems and environments, like Microsoft Windows, Java and .NET.

Tip: The first 128 characters of Unicode (which correspond one-to-one with ASCII) are encoded using a single octet with the same binary value as ASCII, making valid ASCII text valid UTF-8-encoded Unicode as well.

HTML 4 supports UTF-8. HTML 5 supports both UTF-8 and UTF-16!

Release History

1.4.1: update dependencies

1.4.0: drop snyk as it doubled dependencies & increased build time; rely on renovatebot

1.3.0: require node 10+


1.2.7: update version info & package lock

1.2.6: streamline dependencies- move lint outside of package/grunt; bump version

1.2.5: exclude renovate.json from published package ; bump version

1.2.4: pin dependencies; integrate renovatebot ; bump version

1.2.3: add to repo to improve ; bump version

1.2.2: at long last properly make a peerDependency ; bump version

1.2.1: drop support for node <= 9.0.0 ; bump version

1.2.0: drop node 6 support; bump version

1.1.2: update dependencies (clears warnings); bump version

1.1.0: drop node 5; enhance eslint rule checks; bump version

1.0.5: bump version to republish with improvements for node 8 + npm 5

1.0.4: switch to eslint and apply best practices feedback from it

1.0.3: updates based on lint and for Code Climate testing/feedback

1.0.2: updated package.json and .travis.tml to use «>5.0.0» and «>1.0.0»

1.0.1: update internals to use es6 let/const; update Travis CI to improve build checks/process

1.0.0: update to current LTS versions of (4.x, 5.x); update to use «>=1.0.0»

0.0.27: update package.json to work with «>=0.11.0» to allow use of 1.00 and beyond

0.0.26: update package.json to work with 0.11.x — 0.12.x; update Copyright in README

0.0.25: update .travis.yml to test with 0.10 0.11, 0.12, 4.2 and 5.0

0.0.24: update package.json to support use of «>=0.10.0» (e.g., now works w/ node 4.0.x)

0.0.23 — 0.0.20: NO FUNCTIONAL CHANGE. bump version so npmjs.com will accept new docs (Markdown parser issues with npmjs.com v. github.com)

0.0.19: update license info in to use new property and SPDX format

0.0.18: update devDependencies and copyright info

0.0.17: work with engine 0.10.x — 0.12.x

0.0.16: January 22, 2015 -update to 0.11.x; add some stricter checks


0.0.15: June 10, 2014 — update to 0.4.x

0.0.14: April 21, 2014 — update to 0.10.x

0.0.13: March 26, 2014 — update to 0.9.x; to 0.3.x

0.0.12: December 27, 2013 — update to 0.8.x and streamline dependencies

0.0.11: December 9, 2013 — update to 0.7.x and integrate Travis CI

0.0.10: November 15, 2013 — bump version and remember to update doc

0.0.9: November 15, 2013 — update dependancies in , bump version (forget to update doc)

0.0.8: July 28, 2013 — update dependancies in , bump version

0.0.7: July 12, 2013 — update dependancies in , bump version

0.0.6: May 20, 2013 — update license URL in , bump version

0.0.5 May 18, 2013 — Update for and , Gruntfile.js edited to remove (now default for jshint 0.5.2)

0.0.4 March 12, 2013 — Update package.json for node 0.10.0 (ie ), added to Gruntfile.js

0.0.3 February 28, 2013 — Stricter jshint Gruntfile options; package.json updates

0.0.2 February 20, 2013 — fully functional / ‘beta’, w/grunt 0.4.0, Gruntfile.js

0.0.1 February 4, 2013 — initial commit / ALPHA SOFTWARE — NOT FULLY FUNCTIONAL

Что такое кодировка сайта и как она работает

Кодировку можно представить в виде таблицы, состоящей из разных букв, цифр и других символов понятных человеку, которые закодированы определенным образом. Когда вы открываете текстовый файл, к которым относятся в том числе HTML-страницы, то компьютер считывает из заголовка файла в какой кодировке он был сохранен и выводит текст в соответствующей кодировке преобразовывая компьютерные данные в вид понятный человеку сопоставляя эти данные с таблицей кодировки. Если информация о кодировке из заголовка файла совпадает с кодировкой в которой сохранены данные в HTML-странице, то пользователь видит привычные ему буквы, цифры и другие символы. Если же есть несовпадение, то в результате пользователю выводится непонятный набор символов, особенно часто это происходит в старых почтовых программах. Если пользователь получил письмо с непонятными крякозябрами, то просто перебирая разные кодировки, обычно получается угадать и выбрать ту, в которой написано письмо, и в результате непонятный набор символов превращается в понятный человеку текст.

То же самое происходит и с HTML-страницами сайта. Если документ был сохранен, например, в кодировке UTF-8, а в самом документе прописан META-тег указывающий что это кодировка windows-1251, то браузер опять же будет сопоставлять сохраненные в файле данные с таблицей указанной ему кодировки и так как символы закодированы по-разному, то браузер выведет вместо привычного текста непонятный набор символов или же часть букв может быть в нормальном виде, а другие буквы или символы могут выводиться, например, в виде знаков вопроса. Все выше сказанное относится в том числе и к отображению имен файлов.

Создавая новый документ в текстовом редакторе лучше сразу убедиться что выбрана нужная кодировка. Современные редакторы позволяют преобразовать текст открытого документа из одной кодировки в другую, а стандартный Блокнот позволяет выбрать кодировку только при сохранении файла.

Range: Decimal 688-767. Hex 02B0-02FF.

If you want any of these characters displayed in HTML, you can use the HTML entity found in the table below.

If the character does not have an HTML entity, you can use the decimal (dec) or hexadecimal (hex) reference.

Will display as:

I will display a I will display ʰ I will display aʰ

Older browsers may not support all the HTML5 entities in the table below. Chrome and Opera have good support, and IE 11+ and Firefox 35+ support all the entities.

Char Dec Hex Entity Name
ʰ 688 02B0   MODIFIER LETTER SMALL H
ʱ 689 02B1   MODIFIER LETTER SMALL H WITH HOOK
ʲ 690 02B2   MODIFIER LETTER SMALL J
ʳ 691 02B3   MODIFIER LETTER SMALL R
ʴ 692 02B4   MODIFIER LETTER SMALL TURNED R
ʵ 693 02B5   MODIFIER LETTER SMALL TURNED R WITH HOOK
ʶ 694 02B6   MODIFIER LETTER SMALL CAPITAL INVERTED R
ʷ 695 02B7   MODIFIER LETTER SMALL W
ʸ 696 02B8   MODIFIER LETTER SMALL Y
ʹ 697 02B9   MODIFIER LETTER PRIME
ʺ 698 02BA   MODIFIER LETTER DOUBLE PRIME
ʻ 699 02BB   MODIFIER LETTER TURNED COMMA
ʼ 700 02BC   MODIFIER LETTER APOSTROPHE
ʽ 701 02BD   MODIFIER LETTER REVERSED COMMA
ʾ 702 02BE   MODIFIER LETTER RIGHT HALF RING
ʿ 703 02BF   MODIFIER LETTER LEFT HALF RING
ˀ 704 02C0   MODIFIER LETTER GLOTTAL STOP
ˁ 705 02C1   MODIFIER LETTER REVERSED GLOTTAL STOP
˂ 706 02C2   MODIFIER LETTER LEFT ARROWHEAD
˃ 707 02C3   MODIFIER LETTER RIGHT ARROWHEAD
˄ 708 02C4   MODIFIER LETTER UP ARROWHEAD
˅ 709 02C5   MODIFIER LETTER DOWN ARROWHEAD
ˆ 710 02C6 &circ; MODIFIER LETTER CIRCUMFLEX ACCENT
ˇ 711 02C7   CARON
ˈ 712 02C8   MODIFIER LETTER VERTICAL LINE
ˉ 713 02C9   MODIFIER LETTER MACRON
ˊ 714 02CA   MODIFIER LETTER ACUTE ACCENT
ˋ 715 02CB   MODIFIER LETTER GRAVE ACCENT
ˌ 716 02CC   MODIFIER LETTER LOW VERTICAL LINE
ˍ 717 02CD   MODIFIER LETTER LOW MACRON
ˎ 718 02CE   MODIFIER LETTER LOW GRAVE ACCENT
ˏ 719 02CF   MODIFIER LETTER LOW ACUTE ACCENT
ː 720 02D0   MODIFIER LETTER TRIANGULAR COLON
ˑ 721 02D1   MODIFIER LETTER HALF TRIANGULAR COLON
˒ 722 02D2   MODIFIER LETTER CENTRED RIGHT HALF RING
˓ 723 02D3   MODIFIER LETTER CENTRED LEFT HALF RING
˔ 724 02D4   MODIFIER LETTER UP TACK
˕ 725 02D5   MODIFIER LETTER DOWN TACK
˖ 726 02D6   MODIFIER LETTER PLUS SIGN
˗ 727 02D7   MODIFIER LETTER MINUS SIGN
˘ 728 02D8   BREVE
˙ 729 02D9   DOT ABOVE
˚ 730 02DA   RING ABOVE
˛ 731 02DB   OGONEK
˜ 732 02DC &tilde; SMALL TILDE
˝ 733 02DD   DOUBLE ACUTE ACCENT
˞ 734 02DE   MODIFIER LETTER RHOTIC HOOK
˟ 735 02DF   MODIFIER LETTER CROSS ACCENT
ˠ 736 02E0   MODIFIER LETTER SMALL GAMMA
ˡ 737 02E1   MODIFIER LETTER SMALL L
ˢ 738 02E2   MODIFIER LETTER SMALL S
ˣ 739 02E3   MODIFIER LETTER SMALL X
ˤ 740 02E4   MODIFIER LETTER SMALL REVERSED GLOTTAL STOP
˥ 741 02E5   MODIFIER LETTER EXTRA-HIGH TONE BAR
˦ 742 02E6   MODIFIER LETTER HIGH TONE BAR
˧ 743 02E7   MODIFIER LETTER MID TONE BAR
˨ 744 02E8   MODIFIER LETTER LOW TONE BAR
˩ 745 02E9   MODIFIER LETTER EXTRA-LOW TONE BAR
˪ 746 02EA   MODIFIER LETTER YIN DEPARTING TONE MARK
˫ 747 02EB   MODIFIER LETTER YANG DEPARTING TONE MARK
ˬ 748 02EC   MODIFIER LETTER VOICING
˭ 749 02ED   MODIFIER LETTER UNASPIRATED
ˮ 750 02EE   MODIFIER LETTER DOUBLE APOSTROPHE
˯ 751 02EF   MODIFIER LETTER LOW DOWN ARROWHEAD
˰ 752 02F0   MODIFIER LETTER LOW UP ARROWHEAD
˱ 753 02F1   MODIFIER LETTER LOW LEFT ARROWHEAD
˲ 754 02F2   MODIFIER LETTER LOW RIGHT ARROWHEAD
˳ 755 02F3   MODIFIER LETTER LOW RING
˴ 756 02F4   MODIFIER LETTER MIDDLE GRAVE ACCENT
˵ 757 02F5   MODIFIER LETTER MIDDLE DOUBLE GRAVE ACCENT
˶ 758 02F6   MODIFIER LETTER MIDDLE DOUBLE ACUTE ACCENT
˷ 759 02F7   MODIFIER LETTER LOW TILDE
˸ 760 02F8   MODIFIER LETTER RAISED COLON
˹ 761 02F9   MODIFIER LETTER BEGIN HIGH TONE
˺ 762 02FA   MODIFIER LETTER END HIGH TONE
˻ 763 02FB   MODIFIER LETTER BEGIN LOW TONE
˼ 764 02FC   MODIFIER LETTER END LOW TONE
˽ 765 02FD   MODIFIER LETTER SHELF
˾ 766 02FE   MODIFIER LETTER OPEN SHELF
˿ 767 02FF   MODIFIER LETTER LOW LEFT ARROW

URL — унифицированный указатель ресурса

Веб-браузеры запрашивают страницы с веб-сервера, используя URL-адрес.

Унифицированный указатель ресурсов (URL) использует адрес документа (или другие данные) в сети.

Веб-адрес, как https://schoolsw3.com/html/index.php следующие правила синтаксиса:

scheme://prefix.domain:port/path/filename


Объяснение:

  • scheme — определяет тип интернет-услуги (чаще всего это http или https)
  • prefix — определяет префикс домена (по умолчанию для http является www)
  • domain — определяет в интернете доменное имя например:( w3schools.com)
  • port — определяет номер порта на хосте (по умолчанию для http является 80)
  • path — определяет путь на сервере (если исключен: корневой каталог сайта)
  • filename — определяет имя документа или ресурса

HTML Reference

HTML by AlphabetHTML by CategoryHTML Browser SupportHTML AttributesHTML Global AttributesHTML EventsHTML ColorsHTML CanvasHTML Audio/VideoHTML Character SetsHTML DoctypesHTML URL EncodeHTML Language CodesHTML Country CodesHTTP MessagesHTTP MethodsPX to EM ConverterKeyboard Shortcuts

HTML Tags

<!—> <!DOCTYPE> <a> <abbr> <acronym> <address> <applet> <area> <article> <aside> <audio> <b> <base> <basefont> <bdi> <bdo> <big> <blockquote> <body> <br> <button> <canvas> <caption> <center> <cite> <code> <col> <colgroup> <data> <datalist> <dd> <del> <details> <dfn> <dialog> <dir> <div> <dl> <dt> <em> <embed> <fieldset> <figcaption> <figure> <font> <footer> <form> <frame> <frameset> <h1> — <h6> <head> <header> <hr> <html> <i> <iframe> <img> <input> <ins> <kbd> <label> <legend> <li> <link> <main> <map> <mark> <meta> <meter> <nav> <noframes> <noscript> <object> <ol> <optgroup> <option> <output> <p> <param> <picture> <pre> <progress> <q> <rp> <rt> <ruby> <s> <samp> <script> <section> <select> <small> <source> <span> <strike> <strong> <style> <sub> <summary> <sup> <svg> <table> <tbody> <td> <template> <textarea> <tfoot> <th> <thead> <time> <title> <tr> <track> <tt> <u> <ul> <var> <video> <wbr>

ASCII Encoding Reference

Your browser will encode input, according to the character-set used in your page.

The default character-set in HTML5 is UTF-8.

Character From Windows-1252 From UTF-8
space %20 %20
! %21 %21
« %22 %22
# %23 %23
$ %24 %24
% %25 %25
& %26 %26
%27 %27
( %28 %28
) %29 %29
* %2A %2A
+ %2B %2B
, %2C %2C
%2D %2D
. %2E %2E
%2F %2F
%30 %30
1 %31 %31
2 %32 %32
3 %33 %33
4 %34 %34
5 %35 %35
6 %36 %36
7 %37 %37
8 %38 %38
9 %39 %39
%3A %3A
; %3B %3B
< %3C %3C
= %3D %3D
> %3E %3E
? %3F %3F
@ %40 %40
A %41 %41
B %42 %42
C %43 %43
D %44 %44
E %45 %45
F %46 %46
G %47 %47
H %48 %48
I %49 %49
J %4A %4A
K %4B %4B
L %4C %4C
M %4D %4D
N %4E %4E
O %4F %4F
P %50 %50
Q %51 %51
R %52 %52
S %53 %53
T %54 %54
U %55 %55
V %56 %56
W %57 %57
X %58 %58
Y %59 %59
Z %5A %5A
%5B %5B
\ %5C %5C
%5D %5D
^ %5E %5E
_ %5F %5F
` %60 %60
a %61 %61
b %62 %62
c %63 %63
d %64 %64
e %65 %65
f %66 %66
g %67 %67
h %68 %68
i %69 %69
j %6A %6A
k %6B %6B
l %6C %6C
m %6D %6D
n %6E %6E
o %6F %6F
p %70 %70
q %71 %71
r %72 %72
s %73 %73
t %74 %74
u %75 %75
v %76 %76
w %77 %77
x %78 %78
y %79 %79
z %7A %7A
{ %7B %7B
| %7C %7C
} %7D %7D
~ %7E %7E
  %7F %7F
` %80 %E2%82%AC
%81 %81
%82 %E2%80%9A
ƒ %83 %C6%92
%84 %E2%80%9E
%85 %E2%80%A6
%86 %E2%80%A0
%87 %E2%80%A1
ˆ %88 %CB%86
%89 %E2%80%B0
Š %8A %C5%A0
%8B %E2%80%B9
Π%8C %C5%92
%8D %C5%8D
Ž %8E %C5%BD
%8F %8F
%90 %C2%90
%91 %E2%80%98
%92 %E2%80%99
%93 %E2%80%9C
%94 %E2%80%9D
%95 %E2%80%A2
%96 %E2%80%93
%97 %E2%80%94
˜ %98 %CB%9C
%99 %E2%84
š %9A %C5%A1
%9B %E2%80
œ %9C %C5%93
%9D %9D
ž %9E %C5%BE
Ÿ %9F %C5%B8
  %A0 %C2%A0
¡ %A1 %C2%A1
¢ %A2 %C2%A2
£ %A3 %C2%A3
¤ %A4 %C2%A4
¥ %A5 %C2%A5
¦ %A6 %C2%A6
§ %A7 %C2%A7
¨ %A8 %C2%A8
%A9 %C2%A9
ª %AA %C2%AA
%AB %C2%AB
¬ %AC %C2%AC
­ %AD %C2%AD
%AE %C2%AE
¯ %AF %C2%AF
° %B0 %C2%B0
± %B1 %C2%B1
² %B2 %C2%B2
³ %B3 %C2%B3
´ %B4 %C2%B4
µ %B5 %C2%B5
%B6 %C2%B6
· %B7 %C2%B7
¸ %B8 %C2%B8
¹ %B9 %C2%B9
º %BA %C2%BA
%BB %C2%BB
¼ %BC %C2%BC
½ %BD %C2%BD
¾ %BE %C2%BE
¿ %BF %C2%BF
À %C0 %C3%80
Á %C1 %C3%81
 %C2 %C3%82
à %C3 %C3%83
Ä %C4 %C3%84
Å %C5 %C3%85
Æ %C6 %C3%86
Ç %C7 %C3%87
È %C8 %C3%88
É %C9 %C3%89
Ê %CA %C3%8A
Ë %CB %C3%8B
Ì %CC %C3%8C
Í %CD %C3%8D
Î %CE %C3%8E
Ï %CF %C3%8F
Ð %D0 %C3%90
Ñ %D1 %C3%91
Ò %D2 %C3%92
Ó %D3 %C3%93
Ô %D4 %C3%94
Õ %D5 %C3%95
Ö %D6 %C3%96
× %D7 %C3%97
Ø %D8 %C3%98
Ù %D9 %C3%99
Ú %DA %C3%9A
Û %DB %C3%9B
Ü %DC %C3%9C
Ý %DD %C3%9D
Þ %DE %C3%9E
ß %DF %C3%9F
à %E0 %C3%A0
á %E1 %C3%A1
â %E2 %C3%A2
ã %E3 %C3%A3
ä %E4 %C3%A4
å %E5 %C3%A5
æ %E6 %C3%A6
ç %E7 %C3%A7
è %E8 %C3%A8
é %E9 %C3%A9
ê %EA %C3%AA
ë %EB %C3%AB
ì %EC %C3%AC
í %ED %C3%AD
î %EE %C3%AE
ï %EF %C3%AF
ð %F0 %C3%B0
ñ %F1 %C3%B1
ò %F2 %C3%B2
ó %F3 %C3%B3
ô %F4 %C3%B4
õ %F5 %C3%B5
ö %F6 %C3%B6
÷ %F7 %C3%B7
ø %F8 %C3%B8
ù %F9 %C3%B9
ú %FA %C3%BA
û %FB %C3%BB
ü %FC %C3%BC
ý %FD %C3%BD
þ %FE %C3%BE
ÿ %FF %C3%BF

In HTML5: Unicode UTF-8

The default character-set for HTML5 is UTF-8.

Example

<meta charset=»UTF-8″>

A character-set different from UTF-8 can be specified in the <meta> tag:

Example

<meta charset=»ISO-8859-1″>

The Unicode Consortium developed the UTF-8 and UTF-16 standards, because the ISO-8859 character-sets are limited, and not compatible a multilingual environment.

The Unicode Standard covers (almost) all the characters, punctuations, and symbols in the world.

All HTML5 and XML processors support UTF-8, UTF-16, Windows-1252, and ISO-8859.

For a closer look, please study: The Complete Unicode Reference.

HTML Учебник

HTML ГЛАВНАЯHTML ВведениеHTML РедакторHTML ОсновыHTML ЭлементыHTML АтрибутыHTML ЗаголовкиHTML ПараграфыHTML СтилиHTML ФорматированиеHTML ЦитированиеHTML КомментарииHTML Цвета Цвета RGB HEX HSL

HTML CSSHTML Ссылки Ссылки Цветные Ссылки Ссылки Закладки

HTML Изображения Изображения Изображение Карта Изображение Фон Элемент Картинки

HTML ТаблицыHTML Списки Списки Неупорядоченный Список Упорядоченный Список Другой Список

HTML Встроенный БлокHTML КлассыHTML ИдентификаторыHTML ФреймыHTML JavaScriptHTML Путь к ФайлуHTML ГоловаHTML МакетHTML АдаптивныйHTML Компьютерный кодHTML СимантикаHTML Руководство по стилюHTML СущностиHTML СимволыHTML СмайликиHTML КодировкаHTML URL КодировкаHTML vs. XHTML

Проблемы с кодировкой не только в HTML-странице

Сайт, независимо от того является ли он просто набором статических HTML-документов или сложных динамических скриптов генерирующих страницы на лету, размещается на веб-сервере, который также работает с определенной кодировкой. И если сервер выдает информацию в одной кодировке, а ваши страницы или скрипты сохранены в другой кодировке, то опять же могут быть проблемы с отображением страниц в браузере пользователя. Многие хостинги позволяют менять настройки и выбрать кодировку в соответствии с той, которая используется в файлах сайта, через панель управления или же прописать ее в файле .htaccess, если на хостинге используется популярный веб-сервер Apache.

Практически ни один современный сайт не обходится без использования базы данных MySQL и она также может стать источником проблем с кодировкой. Если файлы сайта сохранены в одной кодировке, а информация в базе данных в другой, то на странице та часть информации, которая выводится из базы данных может отображаться в виде все тех же знаков вопросов или других непонятных символов. Чтобы избежать проблем с кодировкой она должна быть одинаковой для веб-сервера, базы данных MySQL, в скриптах, в HTML-страницах сайта и в META-теге, который прописывается в HTML-коде. Если есть проблемы с отображением текста, то проверяйте на наличие проблемы все выше перечисленное.

URL Encoding Reference

The ASCII control characters %00-%1F were originally designed to control hardware devices.

Control characters have nothing to do inside a URL.

ASCII Character Description URL-encoding
NUL null character %00
SOH start of header %01
STX start of text %02
ETX end of text %03
EOT end of transmission %04
ENQ enquiry %05
ACK acknowledge %06
BEL bell (ring) %07
BS backspace %08
HT horizontal tab %09
LF line feed %0A
VT vertical tab %0B
FF form feed %0C
CR carriage return %0D
SO shift out %0E
SI shift in %0F
DLE data link escape %10
DC1 device control 1 %11
DC2 device control 2 %12
DC3 device control 3 %13
DC4 device control 4 %14
NAK negative acknowledge %15
SYN synchronize %16
ETB end transmission block %17
CAN cancel %18
EM end of medium %19
SUB substitute %1A
ESC escape %1B
FS file separator %1C
GS group separator %1D
RS record separator %1E
US unit separator %1F

HTML5 UTF-8 Character Codes

Below is a list of some of the UTF-8 character codes supported by HTML5:

Character codes Decimal Hexadecimal
C0 Controls and Basic Latin 0-127 0000-007F
C1 Controls and Latin-1 Supplement 128-255 0080-00FF
Latin Extended-A 256-383 0100-017F
Latin Extended-B 384-591 0180-024F
Spacing Modifiers 688-767 02B0-02FF
Diacritical Marks 768-879 0300-036F
Greek and Coptic 880-1023 0370-03FF
Cyrillic Basic 1024-1279 0400-04FF
Cyrillic Supplement 1280-1327 0500-052F
General Punctuation 8192-8303 2000-206F
Currency Symbols 8352-8399 20A0-20CF
Letterlike Symbols 8448-8527 2100-214F
Arrows 8592-8703 2190-21FF
Mathematical Operators 8704-8959 2200-22FF
Box Drawings 9472-9599 2500-257F
Block Elements 9600-9631 2580-259F
Geometric Shapes 9632-9727 25A0-25FF
Miscellaneous Symbols 9728-9983 2600-26FF
Dingbats 9984-10175 2700-27BF

С этим читают