Унікод

Уніко́д (англ.: Unicode вымаўляецца як Юніко́д; скарачэнне ад Універса́льны код) — стандарт кадзіравання сімвалаў, які дазваляе адлюстраваць літары і знакі амаль усіх пісьмовых моў.^[1]

Стандарт быў прапанован у 1991 годзе некамерцыйнай арганізацыяй «Кансорцыум Унікоду» (англ.: Unicode Consortium, Unicode Inc.).^[2]^[3] Выкарыстанне гэтага стандарту дазваляе надаць коды вельмі вялікай колькасці сімвалаў з розных сістэм пісьма: у дакументах з выкарыстаннем Унікоду могуць разам выкарыстоўвацца кітайскія іерогліфы, матэматычныя сімвалы, літары грэчаскага алфавіта, лацінкі і кірыліцы, а патрэба ў пераключэнні кодавых старонак адпадае.^[4]

Стандарт складаецца з двух асноўных раздзелаў: універсальны набор сімвалаў (англ.: UCS, universal character set) і сямейства кадзіровак (па-англійску: UTF, Unicode transformation format). Універсальны набор сімвалаў вызначае дакладную адпаведнасць сімвалаў кодам — элементам кодавай прасторы, якія ёсць неадмоўнымі цэлымі лікамі. Сямейства кадзіровак вызначае машынны запіс паслядоўнасці кодаў UCS.

Коды ў стандарце Унікод раздзелены на некалькі частак. Частка з кодамі ад U+0000 да U+007F утрымлівае сімвалы з набору ASCII з адпаведнымі кодамі. Далей размешчаны часткі сімвалаў розных пісьмовых сістэм, пунктуацыйныя знакі і тэхнічныя сімвалы. Частка кодаў зарэзервавана для выкарыстання ў будучыні.^[5] Пад сімвалы кірыліцы выдзелены часткі знакаў з кодамі ад U+0400 да U+052F, ад U+2DE0 да U+2DFF і ад U+A640 да U+A69F.^[6]

[1]

[2]

[3]

[4]

[5]

[6]