Правила транслитерации кирилловского письма латинским алфавитом. — Соответствует ISO 9-1995. Взамен ГОСТ 16878-71. — Утв. 2001. — (Система стандартов по информации, библиотечному и издательскому делу).
Настоящий стандарт распространяется на правила транслитерации средствами латинского алфавита отдельных букв, слов, выражений, а также связанных текстов на языках, письменность которых базируется на кирилловском алфавите. Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.
Настоящий стандарт не распространяется на правила передачи латинскими буквами звукового облика слов, записанных кириллицей. Определены две системы представления средствами латинского алфавита текстов, написанных кирилловскими алфавитами. Первая система использует для передачи кирилловских букв латинские буквы с диактритикой, но без буквосочетаний. Вторая система использует сочетания основных латинских букв без диакритики. Обе системы обеспечивают однозначное восстановление исконного написания по транслитерированному тексту.
I
ГОСТ 7.79-2000
(ИСО 9-95)
МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ
Система стандартов по информации,
библиотечному и издательскому
делу
ПРАВИЛА ТРАНСЛИТЕРАЦИИ КИРИЛЛОВСКОГО ПИСЬМА ЛАТИНСКИМ АЛФАВИТОМ
Издание официальное
МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ
ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И
СЕРТИФИКАЦИИ
Минск
II
Предисловие
1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской Академии наук и Министерства науки и технологий Российской Федерации, Техническим комитетом по стандартизации ТК 191 «Научно-техническая информация, библиотечное и издательское дело»
ВНЕСЕН Госстандартом России
2 ПРИНЯТ Межгосударственным Советом по стандартизации, метрологии и сертификации (отчет Технического секретариата № 17 от 19—22 июня 2000 г.)
За принятие проголосовали:
Наименование государства |
Наименование национального органа по стандартизации |
Азербайджанская Республика | Азгосстандарт |
Республика Армения | Армтосстандарт |
Республика Беларусь | Госстандарт Республики Беларусь |
Республика Казахстан | Госстандарт Республики Казахстан |
Кыргизская Республика | Кыргызстандарт |
Российская Федерация | Госстандарт России |
Республика Таджикистан | Таджикстандарт |
Туркменистан | Главгосслужба «Туркменстандартлары» |
Республика Узбекистан | Узгосстандарт |
3 Настоящий стандарт представляет собой аутентичный текст ИСО 9—95 «Информация и документация. Транслитерация кириллических букв латинскими. Славянские и неславянские языки»
4 Постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 4 сентября 2001 г. № 371-ст межгосударственный стандарт ГОСТ 7.79—2000 введен в действие непосредственно в качестве государственного стандарта Российской Федерации с 1 июля 2002 г.
5 ВЗАМЕН ГОСТ 16876-71
© ИПК Издательство стандартов, 2002
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания на территории Российской Федерации без разрешения Госстандарта России
III
Содержание
1 Область применения |
1 |
2 Нормативные ссылки |
1 |
3 Определения |
1 |
4 Общие положения |
2 |
5 Система A — транслитерация с использованием диакритики |
3 |
6 Система Б — транслитерация с использованием буквосочетаний |
11 |
Приложение А Список языков с кирилловской письменностью, охваченных настоящим стандартом |
15 |
Приложение Б Небуквенные знаки кириллицы |
18 |
1
ГОСТ 7.79-2000
МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ
Система стандартов по информации, библиотечному и издательскому делу
ПРАВИЛА ТРАНСЛИТЕРАЦИИ КИРИЛЛОВСКОГО ПИСЬМА ЛАТИНСКИМ АЛФАВИТОМ
System of standards on information, librarianship and publishing.
Rules of transliteration of Cyrillic script by Latin alphabet
Дата введения 2002-07-01
1 Область применения
Настоящий стандарт распространяется на правила транслитерации средствами латинского алфавита отдельных букв, слов, выражений, а также связанных текстов на языках, письменность которых базируется на кирилловском алфавите. Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.
Настоящий стандарт не распространяется на правила передачи латинскими буквами звукового облика слов, записанных кириллицей.
Правила представления национальных географических наименований на картах определяются руководящими документами соответствующих картографических служб.
2 Нормативные ссылки
ГОСТ 7.28—80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного латинского алфавита для обмена информацией на магнитных лентах
ГОСТ 7.29—80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного кирилловского алфавита для обмена информацией на магнитных лентах
ГОСТ 27465—87 Системы обработки информации. Символы. Классификация, наименование и обозначение
3 Определения
В настоящем стандарте применяют следующие термины с соответствующими определениями:
3.1 система письма: Совокупность начертательных (графических) символов и приемов, принятая для фиксации на бумаге или другом материале текстов, высказываний, сообщений, составленных на некотором языке;
3.2 конверсия систем письма: Представление текстов, составленных на определенном языке, средствами системы письма, принятой для другого языка;
3.3 транслитерация: Конверсия систем письма, при которой каждый графический элемент (знак) одной системы письма представляется (заменяется) одним и тем же графическим элементом другой системы письма;
3.3.1 строгая транслитерация: Замена каждой буквы исходного текста только одной буквой другой письменности;
2
3.3.2 ослабленная транслитерация: Замена некоторых букв исходного текста сочетанием двух или более букв чужого алфавита;
3.3.3 расширенная транслитерация: Представление некоторых буквосочетаний исходного текста особым образом;
3.4 алфавит: Конечный набор графических символов (букв), используемый в определенной системе письма для передачи элементов звуковой речи;
3.5 буква: Графический символ, входящий в состав алфавита.
Примечание— Каждая система письма устанавливает пределы, в которых может варьировать начертание букв без изменения их алфавитного значения;
3.6 алфавитная система письма: Система письма, основанная на использовании алфавита;
3.7 латиница: Система письма, принятая в разных вариантах западно-европейскими и большим числом других языков мира и основанная на письменной традиции латинского языка;
3.8 латинский алфавит: Алфавит, используемый в том или ином варианте латиницы;
3.9 кириллица: Система письма, принятая в разных вариантах рядом славянских и других языков Европы и Азии и созданная на основе греческого уставного письма в традиции перевода Священного Писания на старославянский язык;
3.10 кирилловский алфавит: Алфавит, используемый в том или ином варианте кириллицы;
3.11 базовый (основной) алфавит: Алфавит, содержащий только те буквы, которые используются большинством систем письма, основанных на алфавите определенного типа.
Примечание — В настоящем стандарте в качестве базового латинского алфавита принят набор латинских букв, установленный ГОСТ 27465;
3.12 расширенный алфавит: Алфавит, включающий в себя буквы базового алфавита, а также буквы, употребляемые лишь некоторыми языками, письменность которых основана на алфавите определенного типа.
Примечание — В настоящем стандарте в качестве расширенного латинского алфавита принят набор символов, установленный ГОСТ 7.28, и в качестве расширенного кирилловского алфавита — набор букв — по ГОСТ 7.29;
3.13 диакритический знак: Графический символ, добавляемый к букве сверху или снизу или наносимый на изображение буквы для изменения ее начертания и функций в системе письма;
3.14 диакритика: Система диакритических знаков.
4 Общие положения
4.1 Настоящий стандарт является одним из серии международных и национальных стандартов, устанавливающих правила конверсии систем письма с целью обеспечения международного обращения письменных сообщений как в автоматизированных информационных и коммуникационных системах, так и при интеллектуальной обработке, требующей точного и однозначного представления текстовых данных, созданных на одном языке, средствами другого языка. Такие правила должны обладать следующими необходимыми свойствами: — однозначностью, обеспечивающей стабильность представления элементов исходной письменности .(букв, слов; выражений) средствами другой (конвертирующей) письменности; — обратимостью, обеспечивающей возможность однозначного точного восстановления текста на исходном языке; — простотой, обеспечивающей автоматическое выполнение процедуры перехода от исходного текста к конвертированному и обратно на основе простых алгоритмов, преимущественно сводящихся к применению таблиц замены знаков одной системы письма знаками другой системы письма. При применении правил конверсии могут не всегда соблюдаться требования звукового соответствия знаков конвертируемых систем письма, эстетические соображения и традиционные нормы, хотя в каждом отдельном случае желательна разработка таких правил, чтобы нарушение традиционных, фонетических и эстетических норм было минимальным. Однако каждый, кто знает исходный язык и правила конверсии, имеет возможность восстановить исходный текст и прочитать его по правилам исходного языка. Для алфавитных систем письма способом, удовлетворяющим сформулированным выше требованиям, является транслитерация.
3
4.2 Устанавливают две системы транслитерации кирилловских алфавитов латинскими буквами:
А) с использованием диакритики — см. раздел 5,
Б) с использованием буквосочетаний — см. раздел 6.
Использование системы А или Б определяет орган, производящий транслитерацию, и это должно быть указано в сопроводительных материалах к документу. В составе одного документа следует использовать только одну систему, либо каждый раз вид транслитерации оговаривать особо и обозначать специальными указателями в тексте. Исключение из этого правила делается только для документов, в которых цитируются тексты, транслитерируемые в другом (цитируемом) документе, с указанием источника цитирования.
4.3 Транслитерированный текст на машиночитаемых носителях должен быть снабжен указателями, определяющими его границы, исходную письменность и способ транслитерации. Спецификация таких указателей должна быть задана стандартами на язык разметки структуры документов.
4.4 Небуквенные знаки письма (знаки препинания и др.), указанные в приложении Б, при транслитерации сохраняются, как правило, без изменения. При отсутствии нужных символов в печатающем устройстве используют символы, предусмотренные ГОСТ 27465, при этом допускается:
— изменять вид кавычек (вместо открывающих строчных кавычек использовать подстрочные кавычки либо надстрочные кавычки, а вместо закрывающих строчных кавычек использовать надстрочные кавычки);
— заменять тире дефисом, окруженным с двух сторон пробелами;
— заменять многоточие тремя последовательными точками;
— заменять символ номера знаком # или сочетанием No.
Не допускается заменять верхние кавычки двумя апострофами или двумя ударениями, а нижние — двумя запятыми.
5 Система А — транслитерация с использованием диакритики
5.1 Транслитерация с использованием диакритики (система А) является строгой транслитерацией. Она задает единое для всех языков, указанных в приложении А, отображение расширенного кирилловского алфавита на расширенный латинский алфавит. Для славянских языков это отображение показано в таблице 1, для неславянских — в таблице 2.
5.2 Транслитерация дополнительных букв славянских языков, которые не вошли в таблицу 1, но употребляются в особых случаях, задается таблицей 2.
5.3 .Заглавные (прописные) буквы кирилловских алфавитов транслитерируют соответствующими заглавными (прописными) буквами латинского алфавита, строчные буквы транслитерируют строчными. Не допускается заменять заглавные (прописные) буквы с диакритическими знаками буквами без диакритики.
5.4 Арабские цифры 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 при транслитерации сохраняются без изменений.
Римские цифры I, V, X, С, М, L, D и их комбинации транслитерации не подлежат. Они должны быть выделены из транслитерируемого текста специальными указателями.
5.5 Таблица 3 определяет обратный переход от транслитерированного текста к исходному.
4
Таблица 1 — Транслитерация славянских алфавитов по системе А
Рисунок 1
5
Продолжение таблицы 1
6
Продолжение таблицы 1
7
Продолжение таблицы 1
8
Окончание таблицы 1
9
Таблица 2 — Транслитерация неславянских алфавитов по системе А
10
Таблица 3 — Ретранслитерация по системе А
11
6 Система Б — транслитерация с использованием буквосочетаний
6.1 Транслитерация с использованием буквосочетаний (система Б) является ослабленной транслитерацией. Она задает для каждой кирилловской буквы представление в виде одной буквы основного (ограниченного) латинского алфавита или в виде такого сочетания букв, которое не может встретиться в тексте иначе чем при представлении данной буквы.
В состав используемых для транслитерации букв входят:
а, b, с, d, е, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z, ’ (апостроф), `(слабое ударение), а также знаки препинания и специальные знаки, используемые распространенными массовыми печатающими устройствами.
6.2 Для каждого языка разрабатывается специальная таблица транслитерации, в максимальной степени учитывающая фонетические и графические особенности данного языка. Таблица 4 определяет переход от кирилловских букв к латинским для славянских языков: русского, белорусского, украинского, болгарского и македонского. Представление сербохорватского текста латинскими буквами осуществляется при помощи национальной латинской системы письма, используемой в этом языке наряду с кириллицей.
Системы транслитерации с использованием буквосочетаний для неславянских языков должны быть установлены отдельными (национальными) стандартами.
6.3 При транслитерации заглавных (прописных) букв буквосочетанием в транслитерированном тексте заглавный (прописной) вариант выбирается только для первой буквы сочетания, если в данном слове имеются строчные. Если все буквы исходного слова заглавные (прописные), то в транслитерированном слове заглавными пишут все буквы сочетания.
6.4 В таблицу 4 включены также ныне не используемые буквы Ѣ, Ѳ, Ѵ, Ѫ, которые прежде широко употреблялись в славянских языках и могут потребоваться для передачи текстов, написанных по старой орфографии.
12
Таблица 4 — Транслитерация славянских алфавитов по системе Б
Кирилловская буква | Латинская транслитерация в языках | ||||
русском | бeлopуccкoм | украинском | болгарском | македонском | |
А | а | a | a | a | a |
Б | b | b | b | b | b |
В | v | v | v | v | v |
Г | g | g | g | g | g |
Ѓ | — | — | — | — | g` |
Д | d | d | d | d | d |
Е | e | e | e | e | e |
Ё | yo | yo | — | — | — |
Є | — | — | ye | — | — |
Ж | zh | zh | zh | zh | zh |
З | z | z | z | z | z |
S | — | — | — | — | z` |
И | i | — | y` | i | i |
Й | j | j | j | j | — |
J | — | — | — | — | j |
I | i, i' | i | i | i, i` | — |
Ї | — | — | yi | — | — |
К | k | k | k | k | k |
Ќ | — | — | — | — | k` |
Л | 1 | 1 | 1 | 1 | 1 |
Љ | — | — | — | — | l` |
М | m | m | m | m | m |
Н | n | n | n | n | п |
Њ | — | — | — | — | n` |
О | о | о | о | о | о |
П | p | p | p | p | p |
Р | r | r | r | r | r |
С | s | s | s | s | s |
Т | t | t | t | t | t |
У | u | u | u | u | u |
Ў | — | u' | — | — | — |
Ф | f | f | f | f | f |
Х | x | x | x | x | x |
Ц | cz, с | cz, с | cz, с | cz, с | cz, с |
Ч | ch | ch | ch | ch | ch |
Џ | — | — | — | — | dh |
Ш | sh | sh | sh | sh | sh |
Щ | shh | — | shh | sth | — |
Ъ | `` | — | — | a' | — |
Ы | y' | y' | — | — | — |
Ь | ` | ` | ` | ` | — |
Э | e` | e` | — | — | — |
Ю | yu | yu | yu | yu | — |
13
Окончание таблицы 4
Кирилловская буква | Латинская транслитерация в языках | ||||
русском | бeлopуccкoм | украинском | болгарском | македонском | |
Я | уа | уа | уа | уа | — |
’(апост- роф) | ’ | ’ | ’ | ’ | ’ |
Ѣ (ять) | уе | — | — | уе | — |
Ѳ (фита) | fh | — | — | fh | — |
Ѵ (ижица) | yh | — | — | yh | — |
Ѫ (юс) | — | — | — | о' | — |
6.5 Однозначная обратимость таблицы 4 обеспечивается специфическим употреблением латинских букв h, у, с и символа `. Буквы h, у не означают сами по себе никаких кирилловских букв и употребляются только в буквосочетаниях.
6.6 Для кирилловских букв Ц и I установлены два варианта транслитерации.
Ц передается либо латинской С, либо сочетанием CZ. Рекомендуется употреблять С перед буквами I, Е, Y, J, а в остальных случаях — CZ.
Кирилловская I в украинском и белорусском языках всегда передается через латинскую I. Также она передается в русских и болгарских текстах, написанных по старой орфографии, где она, как правило, употребляется перед гласными буквами. В редких случаях употребления ее перед согласной (например, в слове "мiрь"), она передается сочетанием I'.
6.7 Таблица 5 определяет обратный переход от транслитерированного текста к исходному. Она предполагает замену на кирилловские буквы сначала трехсимвольных сочетаний, затем двухсимвольных и, наконец, одиночных букв. В таблицу 5 включены также некоторые написания, не предусмотренные таблицей 4, но реально встречающиеся на практике.
14
Таблица 5 — Ретранслитерация по системе Б
Очередность замены | Латиница | Кириллица | Язык |
Трехбуквенные сочетания (преобразования I очереди) | shh | щ | бг, ру, ук |
sth | щ | бг | |
Двухбуквенные сочетания (преобразования II очереди) | уа | я | бг, 6е, ру, ук |
ye | e | ук | |
ye | Ѣ | ст | |
уi | ї | ук | |
yo | ё | бе, ру | |
yu | ю | бг, бе, ру, ук | |
zh | ж | все | |
ch | ч | все | |
sh | ш | все | |
fh | ѳ | ст | |
kh | x | все | |
dh | џ | мк | |
g` | ѓ | мк | |
z` | s | мк | |
k` | ќ | мк | |
l` | љ | мк | |
n` | њ | мк | |
a` | ъ | бг | |
e` | э | ру, бе | |
i' | i | ст | |
u` | у | бе | |
o' | Ѫ | ст | |
yh | ѵ | ст | |
`` | ъ | ру | |
cz | ц | все | |
Однобуквенные соответствия (преобразования III очереди) | a | а | все |
b | б | все | |
с | ц | все | |
d | д | все | |
e | е | все | |
f | ф | все | |
g | г | все | |
h | х | бг, мк, ру | |
h | г | бе, ук | |
i | и | бг, мк, ру | |
i | i | бе, ук | |
i | i | ст (перед гласной) | |
j | й | бг, бе, ру, ук | |
j | j | мк | |
k | к | все |
15
Окончание таблицы 5
Очередность замены | Латиница | Кириллица | Язык |
Однобуквенные соответствия (преобразования III очереди) | l | л | все |
m | м | все | |
n | н | все | |
о | о | все | |
р | п | все | |
q | щ | бг, ру, ук | |
г | р | все | |
s | с | все | |
t | т | все | |
u | У | все | |
v | в | все | |
w | ы | ру | |
w | и | ук | |
x | х | все | |
у | ы | бе, ру | |
у | и | ук | |
z | з | все |
Список языков с кирилловской письменностью, охваченных настоящим стандартом
Таблица А. 1
Русское название | Английское название | Французское название |
абазинский | Abaza | abaza |
абхазский | Abkhaz | abkhaze |
аварский | Awar | avar |
адыгейский (черкесский) | Adyge (Circassian) | adyghé (circassien) |
азербайджанский | Azeri | azeri |
алтайский | Altay | altaien |
балкарский | Balkar | balkar |
башкирский | Bashkir | bachkir |
белорусский | Byelorussian | bielorusse |
болгарский | Bulgarian | boulgare |
бурятский | Buryat | bouriate |
гагаузский | Gagauzi | gagaouze |
даргинский | Dargwa | dargwa |
долганский | Dolgan | dolgane |
дунганский | Dungan | doungane |
16
Продолжение таблицы А.1
Русское название | Английское название | Французское название |
ингушский | Ingush | ingouche |
кабардинский (черкесский) | Kabardian (Circassian) | kabarde (circassien) |
казахский | Kazakh | kazakh |
калмыцкий | Kalmyk | kalmouk |
караимский | Karaim | caraite |
каракалпакский | Karakalpak | karakalpak |
карачаевский | Karachay | karachaï |
карельский | Karelian | carelien |
кетский | Ket | kete |
коми-зырянский | Komi-Zyrian | komi-zyrene |
коми-пермяцкий | Komi-Permian | komi-permien |
корякский | Koryak | koriak |
крымско-татарский | Crimean Tatar | tatar de Crimee |
кумыкский | Kumyk | koumyk |
курдский | Kurdish | kurde |
кыргызский (киргизский) | Kirgiz | kirghize |
лакский | Lak | lak |
лезгинский | Lezgian | lezghien |
македонский | Macedonian | macedonien |
мансийский | Mansi | mansi |
марийский (горный) | Mari (high) | mari (haul) |
марийский (луговой) | Mari (low) | mari (bas) |
молдавский (молдовский) | Moldavian | moldave |
монгольский | Mongolian | mongol |
мордовско-мокшанский | Mordvin-Moksha | mordve-mokcha |
мордовско-эрзянский | Mordvin-Erza | mordve-erza |
нанайский | Nanay | nanaï |
нганасанский | Nganasan | nganassane |
ненецкий | Nenets | nenetse |
нивхский | Nivkh | nivkhe |
ногайский | Noghay | nogaï |
осетинский | Ossetic | ossete |
русский | Russian | russe |
саамский | Saam | same |
селькупский | Selkup | selkoupe |
сербохорватский | Serbo-Croatian | serbo-croatien |
табасаранский | Tabasaran | tabassarane |
таджикский | Tajik | tadjik |
17
Окончание таблицы А. 1
Русское название | Английское название | Французское название |
татарский | Tatar | tatar |
татский | Tat | tate |
тофаларский | Tofalar | tofalar |
тувинский | Tuva | touva |
туркменский | Turkmen | turkmene |
удмуртский | Udmurt | oudmourte |
удэ(ге)йский | Udegey | oudégué |
узбекский | Uzbek | ouzbek |
уйгурский | Uyghur | ouïgour |
украинский | Ukrainian | ukrainien |
ульчский | Ulch | oultche |
хакасский | Khakass | khakasse |
хантыйский (ваховский) | Vakh Khanty | khanty de Vakh |
хантыйский (казымский) | Kazym Khanty | khanty de Kazym |
хантыйский (сургутский) | Surgut Khanty | khanty de Sourgout |
хантыйский (шурыкшарский) | Shurykshar Khanty | khanty de Chourykchar |
цыганский | Tsigane | tsigane |
чеченский | Chechen | tchetchene |
чувашский | Chuvash | tchouvache |
чукотский | Chukcha | tchouktche |
шорский | Shor | chor |
шугнанский | Shugnan | chougnane |
эвенкийский | Evenki | évenke |
эвенский | Even | évene |
эскимосский | Eskimo | esquimau |
юкагирский | Yukagir | ioukaguir |
язгулямский | Yazgulam | iazgoulame |
якутский (саха) | Yakut | iakoute |
18
Небуквенные знаки кириллицы
Таблица Б.1
Изображение знака | Наименование знака |
. | точка |
, | запятая |
; | точка с запятой |
: | двоеточие |
... | многоточие |
- | дефис |
— | тире |
? | вопросительный знак |
! | восклицательный знак |
” | надстрочные кавычки |
„ | подстрочные кавычки |
« | строчные кавычки открывающие |
» | строчные кавычки закрывающие |
( | скобка открывающая |
) | скобка закрывающая |
§ | параграф |
№ | номер |
’ | апостроф |
19
УДК 003.349.3.034:006.354 МКС 01.140.20 T62 ОКСТУ0007
Ключевые слова: кириллица, кирилловский алфавит, латиница, латинский алфавит, транслитерация, буквенно-звуковая система письма, расширенный латинский алфавит, расширенный кирилловский алфавит, диакритика, ограниченный латинский алфавит, славянский кирилловский алфавит