Унікод
From Wikipedia, the free encyclopedia
Уніко́д (англ.: Unicode вымаўляецца як Юніко́д; скарачэнне ад Універса́льны код) — стандарт кадзіравання сімвалаў, які дазваляе адлюстраваць літары і знакі амаль усіх пісьмовых моў.[1]
Стандарт быў прапанован у 1991 годзе некамерцыйнай арганізацыяй «Кансорцыум Унікоду» (англ.: Unicode Consortium, Unicode Inc.).[2][3] Выкарыстанне гэтага стандарту дазваляе надаць коды вельмі вялікай колькасці сімвалаў з розных сістэм пісьма: у дакументах з выкарыстаннем Унікоду могуць разам выкарыстоўвацца кітайскія іерогліфы, матэматычныя сімвалы, літары грэчаскага алфавіта, лацінкі і кірыліцы, а патрэба ў пераключэнні кодавых старонак адпадае.[4]
Стандарт складаецца з двух асноўных раздзелаў: універсальны набор сімвалаў (англ.: UCS, universal character set) і сямейства кадзіровак (па-англійску: UTF, Unicode transformation format). Універсальны набор сімвалаў вызначае дакладную адпаведнасць сімвалаў кодам — элементам кодавай прасторы, якія ёсць неадмоўнымі цэлымі лікамі. Сямейства кадзіровак вызначае машынны запіс паслядоўнасці кодаў UCS.
Коды ў стандарце Унікод раздзелены на некалькі частак. Частка з кодамі ад U+0000 да U+007F утрымлівае сімвалы з набору ASCII з адпаведнымі кодамі. Далей размешчаны часткі сімвалаў розных пісьмовых сістэм, пунктуацыйныя знакі і тэхнічныя сімвалы. Частка кодаў зарэзервавана для выкарыстання ў будучыні.[5] Пад сімвалы кірыліцы выдзелены часткі знакаў з кодамі ад U+0400 да U+052F, ад U+2DE0 да U+2DFF і ад U+A640 да U+A69F.[6]