ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
<е>
НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ
ГОСТ Р исо 1951 —
2012
Представление и изложение словарных статей. Требования, рекомендации и информация
ISO 1951:2007
Presentation/representation of entries in dictionaries — Requirements, recommendations and information (IDT)
Издание официальное
Москва Стандартинформ 2014 |
Предисловие
1 ПОДГОТОВЛЕН ЗАО «Проспект» на основе собственного аутентичного перевода на русский язык международного стандарта, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 55 «Терминология, элементы данных и документация в бизнес-процессах и электронной торговле»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. № 966-ст
4 Настоящий стандарт идентичен международному стандарту ИСО 1951:2007 «Представление низложение словарных статей. Требования, рекомендации и информация» (IS0 1951:2007 «Presenta-tion/representation of entries in dictionaries — Requirements, recommendations and information»).
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в ГОСТР 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок—в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования—на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)
©Стандартинформ, 2014
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
II
Продолжение таблицы 2 |
||||||||||||||||||||||||||||||||||||||||||||||||
|
Окончание таблицы 2 |
||||||||||||||||||||||||||||||||||||||||||||
|
4.1.2 Иерархические структуры: словарь и словарные статьи
Словарь состоит из обычных или гнездовых статей.
Таблица 3 — Список высокоуровневых структур |
||||||||||||||||
|
Статья в словаре состоит из элементов данных, которые самодостаточны или компонуются в рамках композиционных элементов.
4.1.3 Композиционные элементы
4.1.3.1 Контейнеры
Всюду, где это возможно, кодированному примеру на языке XML предшествует его печатный вид, взятый из реального словаря. В данном случае вся словарная статья полностью представляется на бумаге текстом внутри прямоугольника с серым фоном (на экране — это зеленый цвет). Если кодируются только какие-то части статьи, то на бумаге они [в данном случае — это текст «Farad n (F) DIN 1301»] располагаются на белом фоне (на экране — это желтый цвет).
Контейнер определяется в приложении С.4.5 стандарта ISO 16642:2003 как структура, используемая при необходимости уточнения соответствующего элемента данных с помощью других информационных элементов (для заглавного слова — это его часть речи; для цитаты — это имя автора цитируемых слов; для символического обозначения — его источник и т.п.). Пример контейнера приводится в таблице 4.
ГОСТ Р ИС01951—2012
Таблица 4 — Исходные данные (пример 23 из приложения С)
F <phys> (unit of capacity: As/V) • Farad n (F) DIN 1301
Хотя в данном англо-немецком словаре слова «Farad», «п», «F» и «DIN 1301» напечатаны в одну строку, между этими элементами существуют зависимости следующего характера:
[Фарада («Farad»)—это имя существительное («поил»), обозначается символом «F» в соответствии со стандартом «DIN 1301»]
Таблица 5 — Кодовое представление (пример 23 из приложения С)
1. <TranslationCtn>
2. <Тranslation>Farad</Translation>
3. <PartOfSpeech value = ‘noun’/>
4. <SymbolCtn>
5. <Symbol>F</Symbol>
6. <Source>DIN 1301</Source>
7. </SymbolCtn>
8. <TranslationCtn>
Контейнер перевода (<TranslalionCtn>) используется для уточнения перевода (Farad) путем указания его части речи (<PartOfSpeech>). Контейнер символа (<SymbolCtn>) используется для уточнения символа (F) посредством указания его источника (DIN 1301). Этот контейнер символа встроен в контейнер перевода для добавления к переводу символического обозначения.
4.1.3.2 Блоки
В издаваемых типографским способом словарях часто используются знаки пунктуации (запятая или точка с запятой) для обозначения степени схожести элементов статьи. Например, в таблице 6 слово «feelings» («чувства») в квадратных скобках, которое стоит перед двумя переводами, разделенными запятой, определяет «область использования» этих двух переводов. Точка с запятой закрывает список возможных переводов слова «dam» в рамках области «feelings». Заключенное в квадратные скобки слово «Words» («разговорная речь») открывает новую «область использования».
Блоки используются для кодирования характера такой логической связи.
Таблица 6 — Исходные данные — блок с базовыми компонентами (англо-французский пример 1 из приложения С)
dam…
figurative [feelings] refouler, ravaler; [words] endiguer
Таблица 7 — Схематическое представление блоков с базовыми компонентами
Sense
Block
feelings
refouler
ravaler
Block
words
endiguer
Здесь имеются три родственных узла <Translation>. Блок TranslationBlock используется для объединения двух из этих узлов в одну группу, где они разделяют одну и ту же область использования <RangeOfApplication>.
9
Таблица 8 — Кодовое представление блока с базовыми компонентами (пример 1 из приложения С)
1. <SenseGroup>
2. <SenseQualifier>figurative</SenseQualifier>
3. <TranslationBlock>
4. <RangeOfApplication>feeling</RangeOfApplication>
5. <Translation>refouler</Translation>
6. <Translation>ravaler</Translation>
7. </TranslationBlock>
8. <TranslationBlock>
9. <RangeOfApplication>words</RangeOfApplication>
10. <Translation>endiguer</Translation>
11. </TranslationBlock>
12. </SenseGroup>
Таблица 9 — Исходные данные — блок с контейнерами
cleave [kliv:] v {pt cleaved, cleft [kleft], Lit clove [kl..v]; pp cleaved, cleft, Lit cloven [‘kl..v(.)n])
Здесь имеются три производные формы прошедшего времени глагола “cleave” (раскалывать) и три формы причастия прошедшего времени от этого глагола. Каждая производная форма может быть уточнена указанием для нее произношения или регистра.
Таблица 10 — Схематическое представление блока с контейнерами
Derivation
Block 1 preterit
cleaved
cleft
[pron]
[register]
clove
[pron]
Block 2
past
participle
cleaved
cleft
[register]
cloven
[pron]
Таблица 11 — Кодовое представление блока с контейнерами
1. <DerivationBlock>
2. <Tense value = ‘preterit’/>
3. <Derivation>cleaved</Derivation>
4. <DerivationCtn>
5. <Derivation>cleft</Derivation>
6. <Pronunciation>kleft</Pronunciation>
7. </DerivationCtn>
8. <DerivationCtn>
9. <Derivation>clove</Derivation>
10. <Pronunciation>[kl..v]</Pronunciation>
11. <Register value = ‘literary’/>
12. </DerivationCtn>
13. </DerivationBlock>
14. <DerivationBlock>
15. <Tense value = ‘pastParticiple7>
16. <Derivation>cleaved</Derivation>
17. <Derivation>cleft</Derivation>
18. <DerivationCtn>
19. <Derivation>cloven</Derivation>
20. <Pronunciation>’kl..v(.)n</Pronunciation>
21. <Register value = ‘Iiterary7>
22. </DerivationCtn>
23. </DerivationBlock>
10
ГОСТ РИС01951—2012
Таблица 12 — Исходные данные производного блока
— atEtestable adj.
— at’testant, at’tester or esp. in legal usage at’testor, at’testator n.
— attestation (Qa3te£stelS«n) n.
Таблица 13— Схематическое представление производного блока
Derivation
Block
noun
attestant
attester
Block
legal
usage
attestor
attestator
Блок <DerivationBlock> используется для ассоциирования уточнения <PartOfSpeech> с четырьмя производными блоками <Derivation>. Вложенный блок <DerivationBloclo используется для объединения в группу двух последних производных блоков, разделяющих одну и ту же область использования <Range OfApplication>.
Модель XmLex определяет блоки для семи тем: CompositionalPhrase (композиционная фраза), Derivation (производный элемент), Headword (заглавное слово), Inflection (изменение формы слова), MultiWordllnit (многословная единица), Synonym (синоним) и Translation (перевод).
Таблица 14 — Кодовое представление вложенного производного блока
1. <DerivationBlock>
2. <PartOfSpeech value = ‘noun’/>
3. <Derivation>at<Stress/>testant</Derivation>
4. <Derivation>at<Stress/>tester</Derivation>
5. <DerivationBlock>
6. <RangeOfApplication>esp. in legal usage</RangeOfApplication>
7. <Derivation>at<Stress/>testor</Derivation>
8. <Derivation>at<Stress/>testator</Derivation>
9. </DerivationBlock>
10. </DerivationBlock>
4.1.3.3 Группы
Группа объединяет независимые элементы данных, контейнеры и блоки.
Группа является композиционным элементом, который используется для представления различных (и повторяющихся) наборов информации, например, множественных смысловых значений заглавного слова в рамках словарной статьи.
Таблица 15 — Пример группы (фрагмент примера 3 из приложения С)
pneumatophore 1. (Bot) Pneumatophor n, Atemwurzel f; 2. (Zoo) Pneumatophor n, Schwimmglocke f, Gasflasche f (der Siphonophoren)
11
Таблица 16— Кодовое представление (фрагмент примера 3 из приложения С)
1. <SenseGroup>
2. <SubjectField>Bot</SubjectField>
3. <TranslationCtn>
4. <Translation>Pneumatophor</Translation>
5. <PartOfSpeech value = ‘noun’/>
6. </TranslationCtn>
7. </SenseGroup>
8. <SenseGroup>
9. <SubjectField>Zoo</SubjectField>
10. <TranslationCtn>
11. <Translation>Pneumatophor</Translation>
12. <PartOfSpeech value = ‘noun’/>
13. </TranslationCtn>
14. </SenseGroup>
В соответствии с предметной областью заглавное слово имеет два смысловых значения. Каждое из них описывается в группе <SenseGroup>.
Таблица 17 — Список групп |
||||||||||||||||||||||||||||
|
4.2 Формальная структура словарной статьи
4.2.1 Формальная грамматика для высокоуровневых структур
Словарная статья включает в себя:
— одну или несколько основных лексических единиц («заглавных слов») и связанные с ними другие лексические единицы (часть речи, произношение, орфографические варианты, словообразование и т.п.);
— описание каждого смыслового значения заглавных слов и лексических единиц, ассоциируемых с данным значением (композиционных фраз, многословных единиц, переводов, синонимов и др.).
Когда заглавное слово имеет сильно различающиеся смысловые значения, словарная статья может разбиваться на подстатьи по каждому омографу или для каждого значения может создаваться отдельная статья (с соответствующим номером омографа).
Несколько статей могут группироваться внутри уникального «гнезда» для сборки родственных заглавных слов в компактный словарь.
Модель представляется с использованием следующих соглашений расширенной формы Бэкуса — Наура (РБНФ):
— терминальные элементы являются существительными без разделителей; их объяснение дается до начала использования (примером может служить заглавное слово);
— символы разделяются знаками <>;
— {} обозначает любое число вхождений, включая 0;
— [ ] обозначает отсутствие или ровно одно вхождение;
— + означает одно или множество вхождений.
ГОСТ РИС01951—2012
Необходимо помнить, что:
— порядок следования элементов внутри правила не имеет значения; например, внутри контейнера повторяющиеся уточняющие элементы могут появляться как до, так и после уточняемого элемента данных;
— символы, имя которых заканчивается словом <Л/а1ие»(значение), как, например, <Gramma-ticalGenderValue>, или словом «Туре» (тип), KaK<HeadwordType>, в настоящем международном стандарте не рассматриваются; они относятся к допустимым значениям, которые определены в ISO 12620:1999 и в «Реестре категорий данных Технического комитета 37» (ТС 37 Data Category Registry).
Для элемента данных разрешаются списки допустимых значений. Например, элемент грамматического рода <GrammaticalGenderValue> может содержать значения «мужской», «женский», «средний» и т.п.
Определение типов дает дополнительную информацию о характере элемента данных. Например, <HeadwordType> будет содержать перечисление типов заглавных слов (имя нарицательное, имя собственное, приставка, суффикс, географическое название и др.).
Реализация этой модели всегда дает пользователю возможность добавлять собственные новые типы или нужные ему допустимые значения.
— Описание цитирования (CitationCtn) в настоящем стандарте отсутствует. Его компоненты следует заимствовать в ISO 15836 (Дублинское ядро) или ISO 12615 (ссылки на источники).
1. |
<Dictionary> ::= <generalQualifiers> [sourceLanguage] [targetLanguage] {<DictionaryEntry> | <NestEntry> | <lnsert>) |
2. |
<NestEntry> ::= <generalQualifiers> [sourceLanguage] [targetLanguage] {DictionaryEntry>} |
3. |
<DictionaryEntry> ::= [sortKey] [sourceLanguage] [targetLanguage] [homographNumber] <generalQualifiers> (Headword! HeadwordCtn| HeadwordBlock)+ {HomographGroup} | {SenseGroup} {MultiWordUnitCtn | CompositionalPhraseCtn| {<Administrativelnformation>} |
4. |
<HomographGroup> ::= <generalQualifiers> [Headword! HeadwordCtn| Headword Block] {<CoreComments> | <SenseGroup>) {<RelatedTopics>} |
5. |
<SenseGroup> ::= <generalQualifiers> [senseNumber] [targetLanguage] {<CoreComments>| <RelatedTopics>| <SenseGroup>) (See|SeeCtn) |
6. |
<RelatedTopic> ::= {AbbreviatedForm| <AbbreviatedFormCtn> Analogy |<AnalogyCtn>| <AnalogyBlock>| Antonym| <AntonymCtn> Citation| <CitationCtn>| CompanySpecificUsage| CompanySpecificllsageCtn| CompositionalPhrase| <CompositionalPhraseCtn>| <CompositionalPhraseBlock>| Derivation|<DerivationCtn>|<DerivationBlock>| Example|<ExampleCtn>| FalseFriend|<FalseFriendCtn>| FreeTopic|<FreeTopicCtn>| FullForm|<FullFormCtn>| Flomonym| FlomonymCtn| lnflection|<lnflectionCtn>|<lnflectionBlock>| lnternationalScientificTerm|<lnternationalScientificTermCtn>| MultiWordUnit|<MultiWordUnitCtn>|<MultiWordUnitBlock>| Proprietary Restriction! ProprietaryRestrictionCtn| Synonym|<SynonymCtn>|<SynonymBlock>| Translation |<TranslationCtn>|<TranslationBlock>| Variant|<VariantCtn>} |
7. |
<FleadwordCtn> ::= <generalQualifiers> Fleadword {<CoreComments>| <RelatedTopics>} |
8. |
<FleadwordBlock> ::= <generalQualifiers> (Fleadword | FleadwordCtn)+ {<CoreComments>} |
9. |
<MultiWordllnitCtn> ::= <generalQualifiers> MultiWordllnit+ {<CoreComments>| <RelatedTopics>} {<SenseGroup>} |
10. |
<CompositionalPhraseCtn> ::= <generalQualifiers> CompositionalPhrase+ {<CoreComments>| <RelatedTopics>} {<SenseGroup>} |
11. |
<LinguisticComment> ::= Attestation | < Attestation Ctn > | Case|<CaseCtn>| Complement! <ComplementCtn>| Display! Etymology|<EtymologyCtn>| Formation |<FormationCtn>| Formula! <FormulaCtn>| Frequency|<FrequencyCtn>| GeographicalUsage|<GeographicalUsageCtn>| GrammaticalGender|<GrammaticalGenderCtn>| GrammaticalNumber|<GrammaticalNumberCtn>| GrammaticalPatteml GrammaticalPatternCtn| GuidePhrase|<GuidePhraseCtn>| Mood|<MoodCtn>| NormativeStatus|<NormativeStatusCtn>| PartOfSpeech|<PartOfSpeechCtn>| Person|<PersonCtn>| Pronunciation|<PronunciationCtn>| RangeOfApplication|<RangeOfApplicationCtn>| Register|<RegisterCtn>| SearchForm|<SearchFormCtn>| Syllabification|<SyllabificationCtn>| Symbol|<SymbolCtn>| TypicalComplementl TypicalComplementCtn| Tense|<TenseCtn>| UsageNote|<UsageNoteCtn> |
12. |
<SemanticComment> :: = Definition! <DefinitionCtn>| Senselndicator| SenselndicatorCtn| SenseQualifier|<SenseQualifierCtn>| SubjectField|<SubjectFieldCtn> |
13. |
<CoreComments> ::= {<LinguisticComments>| <SemanticComments>| <CrossReferences>| <FreeElements>| <GeneralElements>| <Administrativelnformations>} |
14. |
<CrossReferences> ::= SeeAlso |
15. |
<Administrativelnformation> ::= Origination | Modification |
16. |
<FreeElements> ::= FreeComment| <FreeCommentCtn> |
17. |
<GeneralElements> ::= Note| <NoteCtn>| Source! <SourceCtn> |
18. |
<ContainerComplement> ::= <FreeElements>| <GeneralElements> |
19. |
<generalQualifiers> ::= [id] [class] [style] [xmhlang] [documentSize] [display] |
4.2.2 Формальная грамматика для контейнеров других лексических единиц |
||||||||||||||||||||||||||||
|
4.2.3 Формальная грамматика для блоков |
||||||||||||||||||
|
4.2.4 Формальная грамматика для контейнеров других комментариев |
||||||||||||||||||
|
||||||||||||||||||
52. <GrammaticalGenderCtn> ::= <generalQualifiers> GrammaticalGender {<ContainerComplement>} |
ГОСТ РИС01951—2012
Содержание
1 Область применения………………………………… 1
2 Нормативные ссылки………………………………… 1
3 Термины и определения……………………………….. 1
4 Формализованное описание словарных статей……………………… 2
4.1 Общий обзор элементов данных и композиционных элементов……………. 2
4.1.1 Элементы данных……………………………… 3
4.1.2 Иерархические структуры: словарь и словарные статьи…………….. 8
4.1.3 Композиционные элементы………………………….. 8
4.2 Формальная структура словарной статьи……………………… 12
4.2.1 Формальная грамматика для высокоуровневых структур…………….. 12
4.2.2 Формальная грамматика для контейнеров других лексических единиц………. 15
4.2.3 Формальная грамматика для блоков……………………… 16
4.2.4 Формальная грамматика для контейнеров других комментариев…………. 16
4.2.5 Формальная грамматика для лексических единиц……………….. 18
4.2.6 Формальная грамматика для комментариев………………….. 18
4.3 Модели контента…………………………………. 20
4.3.1 Элементы контента……………………………… 20
4.3.2 Вложенные элементы……………………………. 20
4.3.3 Базовые элементы……………………………… 22
4.3.4 Указатель…………………………………. 22
4.3.5 Формальная грамматика для вложенных контейнеров……………… 23
4.3.6 Формальная грамматика контента категории данных………………. 23
4.4 Общие спецификаторы……………………………… 24
5 Способы представления………………………………. 25
5.1 Средства макетирования……………………………… 25
5.1.1 Общие положения……………………………… 25
5.1.2 Средства разметки словарей…………………………. 25
5.2 Механизмы уплотнения……………………………… 26
5.2.1 Общепринятые сокращения…………………………. 26
5.2.2 Повторения сокращенной формы заглавного слова……………….. 26
5.2.3 Символы повторения (тильда или тире)…………………….. 26
5.2.4 Гнездовой принцип……………………………… 26
Приложение А (справочное) Арабская, римская и греческая системы нумерации………. 27
Приложение В (справочное) Таблицы функций лексикографических символов………… 29
Приложение С (справочное) Примеры кодовых представлений на языке XML………… 44
Приложение D (справочное) Определение средств сборки компонентов словаря и сжатия словарных
статей…………………………………. 65
Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов
ссылочным национальным стандартам Российской Федерации………. 73
53. |
<GrammaticalNumberCtn> ::= <generalQualifiers> GrammaticalNumber {<ContainerComplement>} |
54. |
<GrammaticalPatternCtn> ::= <generalQualifiers> GrammaticalPattern {<ContainerComplement>} |
55. |
<lnsertCtn> ::= <generalQualifiers> Insert {<ContainerComplement>} |
56. |
<MoodCtn> ::= <generalQualifiers> Mood {Example| ExampleCtn| <ContainerComplement>} |
57. |
<NormativeStatusCtn> ::= <generalQualifiers> NormativeStatus {<ContainerComplement>} |
58. |
<NoteCtn> ::= <generalQualifiers> Note {<ContainerComplement>} |
59. |
<PartOfSpeechCtn> ::= <generalQualifiers> PartOfSpeech [Subcategorisation| SubcategorisationCtn] [GrammaticalGender] [GrammaticalNumber] {<ContainerComplement>} |
60. |
<PersonCtn> ::= <generalQualifiers> Person { Example| ExampleCtn| <ContainerComplement>} |
61. |
<PronunciationCtn ::= <generalQualifiers> Pronunciation {<ContainerComplement>} |
62. |
<RegisterCtn ::= <generalQualifiers> Register {<ContainerComplement>} |
63. |
<RangeOfApplicationCtn> ::= <generalQualifiers> RangeOfApplication {<ContainerComplement>} |
64. |
<SeeCtn> ::= <generalQualifiers> See { Corecomments } (HomographNumber) (SenseNumber) {<ContainerComplement>} |
65. |
<SenselndicatorCtn> ::= <generalQualifiers> Senselndicator {<ContainerComplement>} |
66. |
<SenseQualifierCtn> ::= <generalQualifiers> SenseQualifier {<ContainerComplement>} |
67. |
<SourceCtn> ::= <generalQualifiers> Source {<ContainerComplement>} |
68. |
<SubcategorisationCtn> ::= <generalQualifiers> Subcategorisation {<ContainerComplement> [SubcategorisationCtn]} |
69. |
<SubjectFieldCtn> ::= <generalQualifiers> SubjectField {<ContainerComplement>} |
70. |
<SyllabificationCtn> ::= <generalQualifiers> Syllabification {<ContainerComplement>} |
71. |
<SymbolCtn> ::= <generalQualifiers> Symbol { Source } {<ContainerComplement>} |
72. |
<TenseCtn> ::= <generalQualifiers> Tense { Example| ExampleCtn| <ContainerComplement>} |
73. |
<TypicalComplementCtn> ::= <generalQualifiers> TypicalComplement {<ContainerComplement>} |
74. |
<UsageNoteCtn> ::= <generalQualifiers> UsageNote {<CoreComments>} |
Введение
За последние 10 лет процессы создания словарной продукции претерпели важные изменения по причине широкого распространения электронных словарей. Вследствие этого лексикографы оказались перед фактом огромного разнообразия методов разработки и публикации словарей.
Настоящий стандарт имеет целью информационную поддержку процессов создания и организации использования самых разных типов словарной продукции. При этом принимаются во внимание различные способы применения словарей, в особенности такие, которые связаны с новыми функциональными возможностями электронных документов — гиперссылками.
Для того, чтобы сделать информационное содержимое словарей многократно используемым в разных печатных и электронных форматах, лексикографы постоянно стремятся создать надлежащую единую, четко структурированную лексикографическую первооснову или информационный репозиторий. В настоящем стандарте предлагается конкретная модель, основанная на профессиональном опыте и лучших достижениях сложившейся практики и призванная способствовать дальнейшему совершенствованию процедур создания, взаимообмена и организации эффективного использования словарей.
IV
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Представление и изложение словарных статей. Требования, рекомендации и информация
Presentation and representation of entries in dictionaries. Requirements, recommendations and information
Дата введения — 2014 — 01 — 01
1 Область применения
Настоящий стандарт касается одноязычных и многоязычных общих и отраслевых словарей. Он определяет формализованную общую структуру, не зависящую от носителя информации, и устанавливает способы и средства представления статей в «бумажных» и электронных словарях. Связь между этой формальной структурой и представлениями словарных статей, которые используются издателями и читаются пользователями, поясняется примерами, рассмотренными в информативных приложениях.
Цель данного стандарта состоит в том, чтобы облегчить задачи создания, слияния, сравнения, поиска, информационного обмена, распространения и извлечения лексикографических словарных данных. В стандарте используется лексикографический подход к проблеме, основанный на выработке рекомендаций и не имеющий отношения к концептуальным разработкам, определенным в стандарте ИСО 704.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним.
ИСО 704:2000 Терминологическая работа. Принципы и методы (ISO 704:2009, Terminology work — Principles and methods)
ИСО 1087-1:2000 Терминологическая работа. Словарь. Часть 1: Теория и применение (ISO 1087-1:2000, Terminology work — Vocabulary — Part 1: Theory and application)
3 Термины и определения
В настоящем стандарте использованы следующие термины с соответствующими определениями:
3.1 комментарий (comment): Металингвистическая информация, описывающая лексическую единицу с помощью лексикографических элементов данных или составных элементов.
3.2 составной элемент (component element): Составной информационный объект, образованный элементами.
Примечание — Существуют три семейства составных элементов: блоки, контейнеры и группы.
3.3 блок (block): Разложимая структура данных, составной элемент, служащий для факторизации элементов, которые используются множеством экземпляров конкретного элемента в качестве общих уточнений.
Примечание — Примеры блоков приведены в таблицах 6—14.
Издание официальное
3.4 контейнер (container): Уточняющая структура, составной элемент, используемый для предоставления дополнительной информации об одном конкретном элементе данных с помощью других элементов.
Пример — Контейнер заглавного слова, используемый для представления его произношения или указания части речи и уточняющий таким образом заглавное слово, которое само по себе является уточненным элементом данных.
3.5 группа (group): Составной элемент, используемый для объединения нескольких независимых
элементов.
Пример — Смысл понятия описывается группой элементов, таких как определение, предметная область и др.
Примечание — Пример группы представлен в таблицах 15 и 16.
3.6 элемент данных (data element): Единица информации определенной категории, для которой с помощью набора признаков заданы определение, идентификатор, форма представления и диапазон допустимых значений.
[ИСО/МЭК 11179-1:2004, определение 3.3.8]
Примечание — Списки элементов данных представлены в таблицах 1 и 2.
3.7 словарная статья (dictionary entry): Лексический вход, часть словаря, которая содержит информацию, относящуюся к одной лемме и ее вариантам.
3.8 элемент (element): Любой элемент данных или составной элемент.
3.9 заглавное слово (headword): Слово лексического входа, лемма, которая служит заголовком для
статьи в словаре.
3.10 лемма (lemma): Базовое слово, лексическая единица, выбранная в соответствии с лексикографическими соглашениями о представлении различных форм инфлективной парадигмы.
Пример — «Продавать» — это лемма парадигмы «продает, продал, продающий и т. д.».
3.11 лексическая единица, лексема (lexical unit): Языковая единица, принадлежащая к лексикону данного языка и описанная или упомянутая в словаре.
3.12 лексикографический символ (lexicographical symbol): Буква, знак пунктуации или иной типографский либо графический символ или группа символов, равно как их комбинация, используемые для представления определенных лексикографических или терминологических данных, которые отображаются или выводятся автономно либо в сочетании с другим элементом лексикографических данных.
3.13 гнездовая рубрика (nested entry): Группирующая структура для родственных словарных статей с общим заглавным словом.
4 Формализованное описание словарных статей
Для большей четкости изложения рассматриваемая ниже формализованная модель, именуемая в дальнейшем как XmLex, иллюстрируется короткими примерами, запрограммированными в соответствии с документом, касающимся определения типов данных в языке XML и носящим имя XmLex_V00 (более подробную информацию см. в справочном приложении С).
4.1 Общий обзор элементов данных и композиционных элементов
Словарные статьи могут рассматриваться как комментарии копределенным темам, образующим лексические единицы словаря. Статья имеет главную тему (определяемую заглавным словом); все другие темы (например, варианты, переводы) называются «зависимыми темами». Темы и комментарии являются элементами данных. Каждому элементу данных соответствует модель информационного содержания (контента). Элементы данных группируются в композиционные элементы для создания непротиворечивого и полностью поддающегося вычислительной обработке лексического входа. Приводимые ниже открытые списки элементов данных и композиционных элементов могут расширяться пользователем в соответствии с конкретными целями.
В словарях, издаваемых типографским способом, для определения связей между темами и комментариями, как правило, соблюдаются определенные типографские соглашения (использование обычного,
2
ГОСТ Р ИС01951—2012
полужирного и курсивного шрифтов); соглашения по размещению (до/после) и по знакам пунктуации (запятая и точка с запятой). В модели XmLex:
— положение элемента никогда не используется для обозначения связи между двумя элементами;
— не существует никаких маркеров, эквивалентных типографским знакам (запятой и точке с запятой).
Композиционные элементы (контейнеры, блоки и группы) используются для кодирования логических
зависимостей между комментариями и темами таким образом, что, с одной стороны, всегда имеется возможность автоматически скомпоновать и выдать на печать любую форму, а, с другой стороны, автоматически «просчитать» все взаимосвязи между элементами в случае преобразования данных (например, для обращения двуязычного словаря) или при повторном использовании данных в иных контекстах, например, в среде систем памяти переводов или лексических баз данных.
В данной части стандарта:
— описываются элементы данных и их объединение в композиционные элементы, необходимые для представления наиболее общих словарных статей1 >;
— определяется формализованная модель словаря в расширенном представлении Бэкуса — Наура, которое часто используется в качестве формальной нотации для описания синтаксической структуры данного языка;
— даются в приложениях примеры реализации и средства контроля, основанные на использовании спецификаций XML, Xpointer, XSL и XHTML.
4.1.1 Элементы данных
4.1.1.1 Лексические единицы
Представленная ниже таблица содержит перечень лексических единиц и комментариев, которые следует использовать в стандартизованной словарной статье.
В первом столбце таблицы дается обозначение элемента данных. Второй столбец показывает групповой идентификатор этого элемента в рамках формализованной модели. В третьем столбце приводится короткое пояснение, а в четвертом — помещена ссылка на первый соответствующий пример (если таковой существует) элемента данных в приложениях (буква обозначает приложение, подчеркнутый номер указывает номер примера, а последний номер определяет нужную строку).
Таблица 1 — Список лексических единиц |
||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||
^ Каждому элементу данных присваивается условное имя и описание, которое должно в максимально возможной степени отвечать требованиям стандарта ISO 12620:1999. Произвольные элементы данных, тип которых определяется пользователем, позволяют осуществить расширение модели на ситуации «договорного информационного обмена». |
3
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4 |
|
||||||||||||||||||||||||||||
Таблица 2 — Список комментариев |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5 |
Имя |
Групповой идентификатор |
Пояснение |
См. приложение поимео строка |
свободный комментарий |
FreeComment |
Металингвистические средства, используемые для описания лексической единицы. |
с 17 1 |
география |
GeographicalUsage |
Использование лексической единицы, отражающее |
С |
применения |
региональные различия. [адаптированный пример из ISO 12620:1999, А.2.3.2] |
21 10 |
|
грамматический род |
GrammaticalGender |
Совокупность из двух или более грамматических категорий, на которые разделяются имена существительные конкретного языка. |
С 1 15 |
грамматическое |
GrammaticalNumber |
Во многих языках — грамматический признак раз- |
С |
число |
личия, который указывает на количество объектов, определяемых данной лексической единицей, [адаптированный пример из ISO 12620:1999, А.2.2.3] |
2 48 |
|
грамматическая |
GrammaticalPattern |
Грамматическая конструкция, в которой часто ветре- |
С |
структура |
чается конкретная лингвистическая единица. |
34 5 |
|
направляющая |
GuidePhrase |
Грамматический оборот, иллюстрирующий случай |
С |
фраза |
употребления слова или его конкретного смыслового значения. |
2 50 |
|
вставка |
Insert |
Текст, таблица или рисунок, которые представляют некоторые грамматические, энциклопедические, научные или культурологические сведения, относящиеся к словарной статье или к нескольким словарным статьям. Такая вставка может совершенно не зависеть от текста словаря. |
|
наклонение |
Mood |
Свойство глаголов, выражающее отношение говорящего к реальности или правдоподобию того, о чем идет речь. |
С 25 6 |
нормативный статус |
NormativeStatus |
Указатель статуса термина, присвоенный полномочным органом власти, таким как организация по стандартизации или государственным регуляционным учреждением. [адаптированный пример из ISO 12620:1999, А.2.9.1] |
С 26 4 |
примечание |
Note |
Дополнительная информация, касающаяся любого другого элемента совокупности данных, [адаптированный пример из ISO 12620:1999, А.8] |
С 3 24 |
часть речи |
PartOfSpeech |
Тип, присвоенный лексической единице на основании ее грамматических и семантических свойств, [адаптированный пример из ISO 12620:1999, А.2.2.1] |
С 1 11 |
лицо |
Person |
Индикатор грамматического лица (1-го, 2-го, 3-го и т.п.), ассоциируемого с данной изменяемой лексической единицей. |
С 25 7 |
1 Область применения
2 Нормативные ссылки
3 Термины и определения
4 Формализованное описание словарных статей
4.1 Общий обзор элементов данных и композиционных элементов
4.1.1 Элементы данных
4.1.2 Иерархические структуры: словарь и словарные статьи
4.1.3 Композиционные элементы
4.2 Формальная структура словарной статьи
4.2.1 Формальная грамматика для высокоуровневых структур
4.2.2 Формальная грамматика для контейнеров других лексических единиц
4.2.3 Формальная грамматика для блоков
4.2.4 Формальная грамматика для контейнеров других комментариев
4.2.5 Формальная грамматика для лексических единиц
4.2.6 Формальная грамматика для комментариев
4.3 Модели контента
4.3.1 Элементы контента
4.3.2 Вложенные элементы
4.3.3 Базовые элементы
4.3.4 Указатель
4.3.5 Формальная грамматика для вложенных контейнеров
4.3.6 Формальная грамматика контента категории данных
4.4 Общие спецификаторы
5 Способы представления
5.1 Средства макетирования
5.1.1 Общие положения
5.1.2 Средства разметки словарей
5.2 Механизмы уплотнения
5.2.1 Общепринятые сокращения
5.2.2 Повторения сокращенной формы заглавного слова
5.2.3 Символы повторения (тильда или тире)
5.2.4 Гнездовой принцип
Приложение А (справочное) Арабская, римская и греческая системы нумерации
Приложение В (справочное) Таблицы функций лексикографических символов
Приложение С (справочное) Примеры кодовых представлений на языке XML
Приложение D (справочное) Определение средств сборки компонентов словаря и сжатия словарных статей
Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов ссылочным национальным стандартам Российской Федерации
стр. 1
стр. 2
стр. 3
стр. 4
стр. 5
стр. 6
стр. 7
стр. 8
стр. 9
стр. 10
стр. 11
стр. 12
стр. 13
стр. 14
стр. 15
стр. 16
стр. 17
стр. 18
стр. 19
стр. 20
стр. 21
стр. 22
стр. 23
стр. 24
стр. 25
стр. 26
стр. 27
стр. 28
стр. 29
стр. 30