|
| КИРИЛЛИЦА: коды символов для HTML |
|
Если в нерусскоязычную страницу требуется вставить русские буквы или же в русском тексте необходимы старославянские (кириллические) символы, например, буква "ѣ" ("ять") (см. страницу "КИРИЛЛИЦА: азбука, буквенное счисление"), то я предложу Вам несколько решений:
1. Рисовать
банально рисуем буквы графикой:
преимущества: 1) гибкость - так можно написать любую букву любого алфавита; 2) универсальность - каждый читатель увидит букву именно в том виде, в каком Вы рассчитывали, со всеми загогулинами, диактрическими значками и т. п.
недостатки: вагон и маленькая тележка. Главное - текст перестает быть текстом, а становится картинкой, непригодной ни к анализу, ни к последующей обработке. Да и "тяжесть" графики - не последний аргумент ("вес" приведенной здесь для примера фразы "иже херувимы" - около 1000 байт, та же фраза, написанная текстом в качестве примера внизу этой страницы "весит" 36 байт); по сравнению с "голым" текстом картинки загружаются невероятно медленно. И подумайте, как тяжело будет Вам создавать и редактировать документ. Простая опечатка выльется в сильнейшую головную боль...
2. Подменять
довольно неплохой результат дает замена недостающих символов другими: например, за букву "ять" сойдет перечеркнутый мягкий знак: Ь, "фиту" нам даст зачеркнутая "О" или цифра ноль: 0; кси-пси-омегу-ижицу и т. п. можно "сотворить" из похожих греческих букв: ξ ψ ω υ (см. коды греческих букв для HTML); "и десятеричное" и та же "ижица" получаются из латиницы: i v; и т. д.
преимущества: текст остается легким и при этом читаемым
недостатки: все-таки ноль или греческая и-псилон - вещи чуждые в русских словах
3. Кодировать
оказывается, в некоторых unicode-шрифтах есть самые настоящие кириллические юсы-яти-ижицы и т. д., предусмотрен практически полный набор символов (не нашел я разве что только "двугласную" "ia"). Как же вставить в текст "интересные" буквы? Во-первых, необходимо использовать по возможности шрифт, имеющий расширенную таблицу кириллических символов, а во-вторых, на месте "сложных" букв ставить их коды (см. таблицу ниже). Пример использования кодов кириллических букв среди русского текста:
Радѹйсѧ, Свѣтъ нєизрєчєннѡ родившаѧ
преимущества: используются полноценные буквы кириллицы, не их эрзац-заменители из чужих алфавитов.
недостатки: не каждый читатель увидит буквы, не входящие в современную русскую азбуку. В системе должен быть установлен "правильный" шрифт. Отрадно, что один из таких шрифтов становится де-факто стандартным: начиная с MS Office-2000, все "Офисы" внедряют в Windows шрифт Arial Unicode MS, содержащий нужные нам значки.
Таблица символов кириллицы, современного русского алфавита и некоторых знаков:
буква/знак | название кир. | название рус. | код |
загл. | строчн. | загл. | строчн. |
буквы кириллицы и русского алфавита (вперемешку): |
А | а | аз | а | А | а |
Б | б | буки | бэ | Б | б |
В | в | веди | вэ | В | в |
Г | г | глаголь | гэ | Г | г |
Д | д | добро | дэ | Д | д |
Є | є | есть | - | Є | є |
Е | е | - | е | Е | е |
Ё | ё | - | ё | Ё | ё |
Ж | ж | живете | же | Ж | ж |
Ѕ | ѕ | зело | - | Ѕ | ѕ |
З | з | земля | зэ | З | з |
І | і | и (десятеричное) | - | І | і |
И | и | иже | и | И | и |
Й | й | - | и краткое | Й | й |
К | к | како | ка | К | к |
Л | л | люди | эль | Л | л |
М | м | мыслете | эм | М | м |
Н | н | наш | эн | Н | н |
О | о | он | о | О | о |
П | п | покой | пэ | П | п |
Р | р | рцы | эр | Р | р |
С | с | слово | эс | С | с |
Т | т | твердо | тэ | Т | т |
Ѹ | ѹ | ук | - | Ѹ | ѹ |
У | у | - | у | У | у |
Ф | ф | ферт | эф | Ф | ф |
Х | х | хер | ха | Х | х |
Ѡ | ѡ | омега | - | Ѡ | ѡ |
Ц | ц | цы | це | Ц | ц |
Ч | ч | червь | че | Ч | ч |
Ш | ш | ша | ша | Ш | ш |
Щ | щ | ща | ща | Щ | щ |
Ъ | ъ | ер | твердый знак | Ъ | ъ |
Ы | ы | еры | ы | Ы | ы |
Ь | ь | ерь | мягкий знак | Ь | ь |
Ѣ | ѣ | ять | - | Ѣ | ѣ |
Э | э | - | э (оборотное) | Э | э |
Ю | ю | ю | ю | Ю | ю |
- | - | (й)я | - | - | - |
Ѥ | ѥ | (й)е | - | Ѥ | ѥ |
Ѧ | ѧ | юс малый | - | Ѧ | ѧ |
Я | я | - | я | Я | я |
Ѫ | ѫ | юс большой | - | Ѫ | ѫ |
Ѩ | ѩ | йотированный юс малый | - | Ѩ | ѩ |
Ѭ | ѭ | йотированный юс большой | - | Ѭ | ѭ |
Ѯ | ѯ | кси | - | Ѯ | ѯ |
Ѱ | ѱ | пси | - | Ѱ | ѱ |
Ѳ | ѳ | фита | - | Ѳ | ѳ |
Ѵ | ѵ | ижица | - | Ѳ | ѳ |
+ дополнительные полезные буквы: |
Ї | ї | i с двумя точками (крапками), i-умляут | - | Ї | ї |
Ѿ | ѿ | от | - | Ѿ | ѿ |
Ѻ | ѻ | омега круглая | - | Ѻ | ѻ |
полезные знаки: |
ˊ | оксия (прямое (острое) ударение) (?) | ˊ |
ˋ | вария (обратное (тупое) ударение) (?) | ˋ |
а̑ | камора (?)* | ̑ |
˘ | краткая (знак краткости) | ˘ |
д̾ | ерок (ерик) (?)* | ̾ |
¨ | две точки (умляут) | ¨ |
҃ | титло | ҃ |
¯ | надчеркивание | ¯ |
ˀ | придыхание (?) | ˀ |
а̉ | крюк (?)* | ̉ |
҄ | смягчение (?) | ҄ |
҂ | знак тысячи | ҂ |
*) данные знаки не являются отдельными символами, не занимают место отдельной буквы в тексте, а "наскакивают" на букву, после которой стоят
Итак, как же использовать наши знания "секретных" кодов для создания web-страниц?
Ситуация 1:
Необходим кириллический текст (с "ятями"). Что делать? Можно буквы, совпадающие в русском и кириллическом алфавитах писать русским текстом, а вместо недостающих "ятей" вставлять их коды из вышеприведенной таблицы.
получаем на экране:
ижє хєрѹвімы тайнѡ ѡбразѹющє |
Текст остается русским, но содержит "расширенную" кириллицу.
Ситуация 2:
В текст, написанный исключительно латиницей (например, английский) или вообще любым другим языком, отличным от русского, необходимо "вживить" русское слово. Обычно такие страницы предлагается писать в формате Unicode, но есть и такой вариант: писать как обычно, а русское слово набирать из кодов символов, взятых из таблицы выше.
получаем на экране:
In Old Russian, "красный" (krasny) meant both "red" and "beautiful". |
Текст остается нерусским, но содержит русские буквы.
CopyLeft © лєта ҂в̃ - ҂в̃г by |