ГОСТ 7.79—2001           SU

Правила транслитерации кирилловского письма латинским алфавитом. — Соответствует ISO 9-1995. Взамен ГОСТ 16878-71. — Утв. 2001. — (Система стандартов по информации, библиотечному и издательскому делу).

Настоящий стандарт распространяется на правила транслитерации средствами латинского алфавита отдельных букв, слов, выражений, а также связанных текстов на языках, письменность которых базируется на кирилловском алфавите. Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.

Настоящий стандарт не распространяется на правила передачи латинскими буквами звукового облика слов, записанных кириллицей. Определены две системы представления средствами латинского алфавита текстов, написанных кирилловскими алфавитами. Первая система использует для передачи кирилловских букв латинские буквы с диактритикой, но без буквосочетаний. Вторая система использует сочетания основных латинских букв без диакритики. Обе системы обеспечивают однозначное восстановление исконного написания по транслитерированному тексту.

I

ГОСТ 7.79-2000
(ИСО 9-95)

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Система стандартов по информации,
библиотечному и издательскому делу

ПРАВИЛА ТРАНСЛИТЕРАЦИИ КИРИЛЛОВСКОГО ПИСЬМА ЛАТИНСКИМ АЛФАВИТОМ

Издание официальное

МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ
ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ
Минск

II

Предисловие

1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской Академии наук и Министерства науки и технологий Российской Федерации, Техническим комитетом по стандартизации ТК 191 «Научно-техническая информация, библиотечное и издательское дело»

ВНЕСЕН Госстандартом России

2 ПРИНЯТ Межгосударственным Советом по стандартизации, метрологии и сертификации (отчет Технического секретариата № 17 от 19—22 июня 2000 г.)

За принятие проголосовали:

Наименование государства

Наименование национального органа по стандартизации

Азербайджанская Республика Азгосстандарт
Республика Армения Армтосстандарт
Республика Беларусь Госстандарт Республики Беларусь
Республика Казахстан Госстандарт Республики Казахстан
Кыргизская Республика Кыргызстандарт
Российская Федерация Госстандарт России
Республика Таджикистан Таджикстандарт
Туркменистан Главгосслужба «Туркменстандартлары»
Республика Узбекистан Узгосстандарт

3 Настоящий стандарт представляет собой аутентичный текст ИСО 9—95 «Информация и документация. Транслитерация кириллических букв латинскими. Славянские и неславянские языки»

4 Постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 4 сентября 2001 г. № 371-ст межгосударственный стандарт ГОСТ 7.79—2000 введен в действие непосредственно в качестве государственного стандарта Российской Федерации с 1 июля 2002 г.

5 ВЗАМЕН ГОСТ 16876-71

© ИПК Издательство стандартов, 2002

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания на территории Российской Федерации без разрешения Госстандарта России

III

Содержание
1 Область применения

1

2 Нормативные ссылки

1

3 Определения

1

4 Общие положения

2

5 Система A — транслитерация с использованием диакритики

3

6 Система Б — транслитерация с использованием буквосочетаний

11

Приложение А Список языков с кирилловской письменностью, охваченных настоящим стандартом

15

Приложение Б Небуквенные знаки кириллицы

18

1

ГОСТ 7.79-2000

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Система стандартов по информации, библиотечному и издательскому делу

ПРАВИЛА ТРАНСЛИТЕРАЦИИ КИРИЛЛОВСКОГО ПИСЬМА ЛАТИНСКИМ АЛФАВИТОМ

System of standards on information, librarianship and publishing.
Rules of transliteration of Cyrillic script by Latin alphabet

Дата введения 2002-07-01

1 Область применения

Настоящий стандарт распространяется на правила транслитерации средствами латинского алфавита отдельных букв, слов, выражений, а также связанных текстов на языках, письменность которых базируется на кирилловском алфавите. Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.

Настоящий стандарт не распространяется на правила передачи латинскими буквами звукового облика слов, записанных кириллицей.

Правила представления национальных географических наименований на картах определяются руководящими документами соответствующих картографических служб.

2 Нормативные ссылки

ГОСТ 7.28—80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного латинского алфавита для обмена информацией на магнитных лентах

ГОСТ 7.29—80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного кирилловского алфавита для обмена информацией на магнитных лентах

ГОСТ 27465—87 Системы обработки информации. Символы. Классификация, наименование и обозначение

3 Определения

В настоящем стандарте применяют следующие термины с соответствующими определениями:

3.1 система письма: Совокупность начертательных (графических) символов и приемов, принятая для фиксации на бумаге или другом материале текстов, высказываний, сообщений, составленных на некотором языке;

3.2 конверсия систем письма: Представление текстов, составленных на определенном языке, средствами системы письма, принятой для другого языка;

3.3 транслитерация: Конверсия систем письма, при которой каждый графический элемент (знак) одной системы письма представляется (заменяется) одним и тем же графическим элементом другой системы письма;

3.3.1 строгая транслитерация: Замена каждой буквы исходного текста только одной буквой другой письменности;

2

3.3.2 ослабленная транслитерация: Замена некоторых букв исходного текста сочетанием двух или более букв чужого алфавита;

3.3.3 расширенная транслитерация: Представление некоторых буквосочетаний исходного текста особым образом;

3.4 алфавит: Конечный набор графических символов (букв), используемый в определенной системе письма для передачи элементов звуковой речи;

3.5 буква: Графический символ, входящий в состав алфавита.

Примечание— Каждая система письма устанавливает пределы, в которых может варьировать начертание букв без изменения их алфавитного значения;

3.6 алфавитная система письма: Система письма, основанная на использовании алфавита;

3.7 латиница: Система письма, принятая в разных вариантах западно-европейскими и большим числом других языков мира и основанная на письменной традиции латинского языка;

3.8 латинский алфавит: Алфавит, используемый в том или ином варианте латиницы;

3.9 кириллица: Система письма, принятая в разных вариантах рядом славянских и других языков Европы и Азии и созданная на основе греческого уставного письма в традиции перевода Священного Писания на старославянский язык;

3.10 кирилловский алфавит: Алфавит, используемый в том или ином варианте кириллицы;

3.11 базовый (основной) алфавит: Алфавит, содержащий только те буквы, которые используются большинством систем письма, основанных на алфавите определенного типа.

Примечание — В настоящем стандарте в качестве базового латинского алфавита принят набор латинских букв, установленный ГОСТ 27465;

3.12 расширенный алфавит: Алфавит, включающий в себя буквы базового алфавита, а также буквы, употребляемые лишь некоторыми языками, письменность которых основана на алфавите определенного типа.

Примечание — В настоящем стандарте в качестве расширенного латинского алфавита принят набор символов, установленный ГОСТ 7.28, и в качестве расширенного кирилловского алфавита — набор букв — по ГОСТ 7.29;

3.13 диакритический знак: Графический символ, добавляемый к букве сверху или снизу или наносимый на изображение буквы для изменения ее начертания и функций в системе письма;

3.14 диакритика: Система диакритических знаков.

4 Общие положения

4.1 Настоящий стандарт является одним из серии международных и национальных стандартов, устанавливающих правила конверсии систем письма с целью обеспечения международного обращения письменных сообщений как в автоматизированных информационных и коммуникационных системах, так и при интеллектуальной обработке, требующей точного и однозначного представления текстовых данных, созданных на одном языке, средствами другого языка. Такие правила должны обладать следующими необходимыми свойствами: — однозначностью, обеспечивающей стабильность представления элементов исходной письменности .(букв, слов; выражений) средствами другой (конвертирующей) письменности; — обратимостью, обеспечивающей возможность однозначного точного восстановления текста на исходном языке; — простотой, обеспечивающей автоматическое выполнение процедуры перехода от исходного текста к конвертированному и обратно на основе простых алгоритмов, преимущественно сводящихся к применению таблиц замены знаков одной системы письма знаками другой системы письма. При применении правил конверсии могут не всегда соблюдаться требования звукового соответствия знаков конвертируемых систем письма, эстетические соображения и традиционные нормы, хотя в каждом отдельном случае желательна разработка таких правил, чтобы нарушение традиционных, фонетических и эстетических норм было минимальным. Однако каждый, кто знает исходный язык и правила конверсии, имеет возможность восстановить исходный текст и прочитать его по правилам исходного языка. Для алфавитных систем письма способом, удовлетворяющим сформулированным выше требованиям, является транслитерация.

3

4.2 Устанавливают две системы транслитерации кирилловских алфавитов латинскими буквами:

А) с использованием диакритики — см. раздел 5,

Б) с использованием буквосочетаний — см. раздел 6.

Использование системы А или Б определяет орган, производящий транслитерацию, и это должно быть указано в сопроводительных материалах к документу. В составе одного документа следует использовать только одну систему, либо каждый раз вид транслитерации оговаривать особо и обозначать специальными указателями в тексте. Исключение из этого правила делается только для документов, в которых цитируются тексты, транслитерируемые в другом (цитируемом) документе, с указанием источника цитирования.

4.3 Транслитерированный текст на машиночитаемых носителях должен быть снабжен указателями, определяющими его границы, исходную письменность и способ транслитерации. Спецификация таких указателей должна быть задана стандартами на язык разметки структуры документов.

4.4 Небуквенные знаки письма (знаки препинания и др.), указанные в приложении Б, при транслитерации сохраняются, как правило, без изменения. При отсутствии нужных символов в печатающем устройстве используют символы, предусмотренные ГОСТ 27465, при этом допускается:

— изменять вид кавычек (вместо открывающих строчных кавычек использовать подстрочные кавычки либо надстрочные кавычки, а вместо закрывающих строчных кавычек использовать надстрочные кавычки);

— заменять тире дефисом, окруженным с двух сторон пробелами;

— заменять многоточие тремя последовательными точками;

— заменять символ номера знаком # или сочетанием No.

Не допускается заменять верхние кавычки двумя апострофами или двумя ударениями, а нижние — двумя запятыми.

5 Система А — транслитерация с использованием диакритики

5.1 Транслитерация с использованием диакритики (система А) является строгой транслитерацией. Она задает единое для всех языков, указанных в приложении А, отображение расширенного кирилловского алфавита на расширенный латинский алфавит. Для славянских языков это отображение показано в таблице 1, для неславянских — в таблице 2.

5.2 Транслитерация дополнительных букв славянских языков, которые не вошли в таблицу 1, но употребляются в особых случаях, задается таблицей 2.

5.3 .Заглавные (прописные) буквы кирилловских алфавитов транслитерируют соответствующими заглавными (прописными) буквами латинского алфавита, строчные буквы транслитерируют строчными. Не допускается заменять заглавные (прописные) буквы с диакритическими знаками буквами без диакритики.

5.4 Арабские цифры 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 при транслитерации сохраняются без изменений.

Римские цифры I, V, X, С, М, L, D и их комбинации транслитерации не подлежат. Они должны быть выделены из транслитерируемого текста специальными указателями.

5.5 Таблица 3 определяет обратный переход от транслитерированного текста к исходному.

4

Таблица 1 — Транслитерация славянских алфавитов по системе А

Рисунок 1

5

Продолжение таблицы 1

6

Продолжение таблицы 1

7

Продолжение таблицы 1

8

Окончание таблицы 1

9

Таблица 2 — Транслитерация неславянских алфавитов по системе А

10

Таблица 3 — Ретранслитерация по системе А

11

6 Система Б — транслитерация с использованием буквосочетаний

6.1 Транслитерация с использованием буквосочетаний (система Б) является ослабленной транслитерацией. Она задает для каждой кирилловской буквы представление в виде одной буквы основного (ограниченного) латинского алфавита или в виде такого сочетания букв, которое не может встретиться в тексте иначе чем при представлении данной буквы.

В состав используемых для транслитерации букв входят:

а, b, с, d, е, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z, ’ (апостроф), `(слабое ударение), а также знаки препинания и специальные знаки, используемые распространенными массовыми печатающими устройствами.

6.2 Для каждого языка разрабатывается специальная таблица транслитерации, в максимальной степени учитывающая фонетические и графические особенности данного языка. Таблица 4 определяет переход от кирилловских букв к латинским для славянских языков: русского, белорусского, украинского, болгарского и македонского. Представление сербохорватского текста латинскими буквами осуществляется при помощи национальной латинской системы письма, используемой в этом языке наряду с кириллицей.

Системы транслитерации с использованием буквосочетаний для неславянских языков должны быть установлены отдельными (национальными) стандартами.

6.3 При транслитерации заглавных (прописных) букв буквосочетанием в транслитерированном тексте заглавный (прописной) вариант выбирается только для первой буквы сочетания, если в данном слове имеются строчные. Если все буквы исходного слова заглавные (прописные), то в транслитерированном слове заглавными пишут все буквы сочетания.

6.4 В таблицу 4 включены также ныне не используемые буквы Ѣ, Ѳ, Ѵ, Ѫ, которые прежде широко употреблялись в славянских языках и могут потребоваться для передачи текстов, написанных по старой орфографии.

12

Таблица 4 — Транслитерация славянских алфавитов по системе Б
Кирилловская буква Латинская транслитерация в языках
русском бeлopуccкoм украинском болгарском македонском
А а a a a a
Б b b b b b
В v v v v v
Г g g g g g
Ѓ g`
Д d d d d d
Е e e e e e
Ё yo yo
Є ye
Ж zh zh zh zh zh
З z z z z z
S z`
И i y` i i
Й j j j j
J j
I i, i' i i i, i`
Ї yi
К k k k k k
Ќ k`
Л 1 1 1 1 1
Љ l`
М m m m m m
Н n n n n п
Њ n`
О о о о о о
П p p p p p
Р r r r r r
С s s s s s
Т t t t t t
У u u u u u
Ў u'
Ф f f f f f
Х x x x x x
Ц cz, с cz, с cz, с cz, с cz, с
Ч ch ch ch ch ch
Џ dh
Ш sh sh sh sh sh
Щ shh shh sth
Ъ `` a'
Ы y' y'
Ь ` ` ` `
Э e` e`
Ю yu yu yu yu

13

Окончание таблицы 4
Кирилловская буква Латинская транслитерация в языках
русском бeлopуccкoм украинском болгарском македонском
Я уа уа уа уа
’(апост-
роф)
Ѣ (ять) уе уе
Ѳ (фита) fh fh
Ѵ (ижица) yh yh
Ѫ (юс) о'

6.5 Однозначная обратимость таблицы 4 обеспечивается специфическим употреблением латинских букв h, у, с и символа `. Буквы h, у не означают сами по себе никаких кирилловских букв и употребляются только в буквосочетаниях.

6.6 Для кирилловских букв Ц и I установлены два варианта транслитерации.

Ц передается либо латинской С, либо сочетанием CZ. Рекомендуется употреблять С перед буквами I, Е, Y, J, а в остальных случаях — CZ.

Кирилловская I в украинском и белорусском языках всегда передается через латинскую I. Также она передается в русских и болгарских текстах, написанных по старой орфографии, где она, как правило, употребляется перед гласными буквами. В редких случаях употребления ее перед согласной (например, в слове "мiрь"), она передается сочетанием I'.

6.7 Таблица 5 определяет обратный переход от транслитерированного текста к исходному. Она предполагает замену на кирилловские буквы сначала трехсимвольных сочетаний, затем двухсимвольных и, наконец, одиночных букв. В таблицу 5 включены также некоторые написания, не предусмотренные таблицей 4, но реально встречающиеся на практике.

14

Таблица 5 — Ретранслитерация по системе Б
Очередность замены Латиница Кириллица Язык
Трехбуквенные сочетания
(преобразования I очереди)
shh щ бг, ру, ук
sth щ бг
Двухбуквенные сочетания
(преобразования II очереди)
уа я бг, 6е, ру, ук
ye e ук
ye Ѣ ст
уi ї ук
yo ё бе, ру
yu ю бг, бе, ру, ук
zh ж все
ch ч все
sh ш все
fh ѳ ст
kh x все
dh џ мк
g` ѓ мк
z` s мк
k` ќ мк
l` љ мк
n` њ мк
a` ъ бг
e` э ру, бе
i' i ст
u` у бе
o' Ѫ ст
yh ѵ ст
`` ъ ру
cz ц все
Однобуквенные соответствия
(преобразования III очереди)
a а все
b б все
с ц все
d д все
e е все
f ф все
g г все
h х бг, мк, ру
h г бе, ук
i и бг, мк, ру
i i бе, ук
i i ст
(перед гласной)
j й бг, бе, ру, ук
j j мк
k к все

15

Окончание таблицы 5
Очередность замены Латиница Кириллица Язык
Однобуквенные соответствия
(преобразования III очереди)
l л все
m м все
n н все
о о все
р п все
q щ бг, ру, ук
г р все
s с все
t т все
u У все
v в все
w ы ру
w и ук
x х все
у ы бе, ру
у и ук
z з все

ПРИЛОЖЕНИЕ А
(справочное)

Список языков с кирилловской письменностью, охваченных настоящим стандартом

Таблица А. 1
Русское название Английское название Французское название
абазинский Abaza abaza
абхазский Abkhaz abkhaze
аварский Awar avar
адыгейский (черкесский) Adyge (Circassian) adyghé (circassien)
азербайджанский Azeri azeri
алтайский Altay altaien
балкарский Balkar balkar
башкирский Bashkir bachkir
белорусский Byelorussian bielorusse
болгарский Bulgarian boulgare
бурятский Buryat bouriate
гагаузский Gagauzi gagaouze
даргинский Dargwa dargwa
долганский Dolgan dolgane
дунганский Dungan doungane

16

Продолжение таблицы А.1
Русское название Английское название Французское название
ингушский Ingush ingouche
кабардинский (черкесский) Kabardian (Circassian) kabarde (circassien)
казахский Kazakh kazakh
калмыцкий Kalmyk kalmouk
караимский Karaim caraite
каракалпакский Karakalpak karakalpak
карачаевский Karachay karachaï
карельский Karelian carelien
кетский Ket kete
коми-зырянский Komi-Zyrian komi-zyrene
коми-пермяцкий Komi-Permian komi-permien
корякский Koryak koriak
крымско-татарский Crimean Tatar tatar de Crimee
кумыкский Kumyk koumyk
курдский Kurdish kurde
кыргызский (киргизский) Kirgiz kirghize
лакский Lak lak
лезгинский Lezgian lezghien
македонский Macedonian macedonien
мансийский Mansi mansi
марийский (горный) Mari (high) mari (haul)
марийский (луговой) Mari (low) mari (bas)
молдавский (молдовский) Moldavian moldave
монгольский Mongolian mongol
мордовско-мокшанский Mordvin-Moksha mordve-mokcha
мордовско-эрзянский Mordvin-Erza mordve-erza
нанайский Nanay nanaï
нганасанский Nganasan nganassane
ненецкий Nenets nenetse
нивхский Nivkh nivkhe
ногайский Noghay nogaï
осетинский Ossetic ossete
русский Russian russe
саамский Saam same
селькупский Selkup selkoupe
сербохорватский Serbo-Croatian serbo-croatien
табасаранский Tabasaran tabassarane
таджикский Tajik tadjik

17

Окончание таблицы А. 1
Русское название Английское название Французское название
татарский Tatar tatar
татский Tat tate
тофаларский Tofalar tofalar
тувинский Tuva touva
туркменский Turkmen turkmene
удмуртский Udmurt oudmourte
удэ(ге)йский Udegey oudégué
узбекский Uzbek ouzbek
уйгурский Uyghur ouïgour
украинский Ukrainian ukrainien
ульчский Ulch oultche
хакасский Khakass khakasse
хантыйский (ваховский) Vakh Khanty khanty de Vakh
хантыйский (казымский) Kazym Khanty khanty de Kazym
хантыйский (сургутский) Surgut Khanty khanty de Sourgout
хантыйский (шурыкшарский) Shurykshar Khanty khanty de Chourykchar
цыганский Tsigane tsigane
чеченский Chechen tchetchene
чувашский Chuvash tchouvache
чукотский Chukcha tchouktche
шорский Shor chor
шугнанский Shugnan chougnane
эвенкийский Evenki évenke
эвенский Even évene
эскимосский Eskimo esquimau
юкагирский Yukagir ioukaguir
язгулямский Yazgulam iazgoulame
якутский (саха) Yakut iakoute

18

ПРИЛОЖЕНИЕ Б
(справочное)

Небуквенные знаки кириллицы

Таблица Б.1
Изображение
знака
Наименование знака
. точка
, запятая
; точка с запятой
: двоеточие
... многоточие
- дефис
тире
? вопросительный знак
! восклицательный знак
надстрочные кавычки
подстрочные кавычки
« строчные кавычки открывающие
» строчные кавычки закрывающие
( скобка открывающая
) скобка закрывающая
§ параграф
номер
апостроф

19

УДК 003.349.3.034:006.354         МКС 01.140.20        T62           ОКСТУ0007

Ключевые слова: кириллица, кирилловский алфавит, латиница, латинский алфавит, транслитерация, буквенно-звуковая система письма, расширенный латинский алфавит, расширенный кирилловский алфавит, диакритика, ограниченный латинский алфавит, славянский кирилловский алфавит