Получите образец ТУ или ГОСТа за 3 минуты

Получите ТУ или ГОСТ на почту за 4 минуты

ГОСТ Р ИСО 1951-2012 Представление и изложение словарных статей. Требования, рекомендации и информация

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

<е>

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

ГОСТ Р исо 1951 —

2012

Представление и изложение словарных статей. Требования, рекомендации и информация

ISO 1951:2007

Presentation/representation of entries in dictionaries — Requirements, recommendations and information (IDT)

Издание официальное

Москва

Стандартинформ

2014

Предисловие

1    ПОДГОТОВЛЕН ЗАО «Проспект» на основе собственного аутентичного перевода на русский язык международного стандарта, указанного в пункте 4

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 55 «Терминология, элементы данных и документация в бизнес-процессах и электронной торговле»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 20 ноября 2012 г. № 966-ст

4    Настоящий стандарт идентичен международному стандарту ИСО 1951:2007 «Представление низложение словарных статей. Требования, рекомендации и информация» (IS0 1951:2007 «Presenta-tion/representation of entries in dictionaries — Requirements, recommendations and information»).

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА

5 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТР 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок—в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования—на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)

©Стандартинформ, 2014

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

II

Продолжение таблицы 2

Имя

Групповой

идентификатор

Пояснение

См.

приложение

поимео

строка

произношение

Pronunciation

Представление артикуляции при произнесении лексической единицы.

[адаптированный пример из ISO 12620:1999, А.2.5] Представление может быть фонетическим или фонологическим.

с

11

3

область

применения

RangeOfApplication

Область, в рамках которой сохраняется истинный смысл конкретного понятия.

с

1

14

регистр

Register

Классификация, показывающая относительный уровень языка, присвоенный конкретной лексической единице.

[адаптированный пример из ISO 12620:1999, А.2.3.3]

С

24

9

поисковая форма

SearchForm

Лексическая единица, добавленная к лексическому входу с целью облегчения процедуры поиска, [адаптированный пример из ISO 12620:1999, А. 10.6.3]

С

1

16

смотри

See

Перекрестная ссылка на другое заглавное слово, которое является синонимом текущего заглавного слова.

С

3

5

смотри также

SeeAlso

Перекрестная ссылка на родственное заглавное слово.

С

6

19

спецификатор

эмоциональной

окраски

SenseQualifier

Любой указатель эмоциональной окраски лексической единицы ( «фигуральный», «буквализм», «устаревший»…).

С

1

45

сортировочный

ключ

SortKey

Лексическая единица, которая вводится в лексикографическую статью для целей удобства сортировки, когда порядок расположения статей не позволяет отследить местоположение нужного словосочетания.

исходный язык

SourceLanguage

Язык лексической единицы, которая должна быть переведена на другой язык.

С

1

1

субкатегоризация

Subcategorisation

Приписывание лексического объекта к подклассу его части речи, особенно в тех случаях, когда учитываются синтаксические элементы, с которыми он может сочетаться.

Примечание — Этот элемент появляется только в грамматических контейнерах.

С

21

4

предметная

область

SubjectField

Область человеческих знаний.

[адаптированный пример из ISO 12620:1999, А.4]

С

2

11

Окончание таблицы 2

См.

Имя

Групповой

Пояснение

приложение

идентификатор

ппимеп

строка

слогоделение

Syllabification

Разделение слова на слоги, отражающее его арти-

с

куляцию по слогам, то есть по неделимым элемен-

34

там произношения.

[адаптированный пример из ISO 12620:1999, А.2.6]

4

целевой язык

TargetLanguage

Язык, на который должна быть переведена лекси-

С

ческая единица.

1

1

грамматическое

Tense

Отличительный признак в виде разных форм глаго-

С

время

ла для выражения различий во времени или про-

31

должительности выполнения обозначаемого этим глаголом действия или состояния.

5

4.1.2 Иерархические структуры: словарь и словарные статьи

Словарь состоит из обычных или гнездовых статей.

Таблица 3 — Список высокоуровневых структур

Имя

Групповой

идентификатор

Пояснение

См.

приложение

поимео

строка

словарь

Dictionary

Совокупность словарных статей или гнездовых рубрик.

с

1

1

словарная статья

DictionaryEntry

См. определение 3.4.

с

1

2

гнездовая рубрика

NestEntry

См. определение 3.10.

D

1

8

Статья в словаре состоит из элементов данных, которые самодостаточны или компонуются в рамках композиционных элементов.

4.1.3 Композиционные элементы

4.1.3.1 Контейнеры

Всюду, где это возможно, кодированному примеру на языке XML предшествует его печатный вид, взятый из реального словаря. В данном случае вся словарная статья полностью представляется на бумаге текстом внутри прямоугольника с серым фоном (на экране — это зеленый цвет). Если кодируются только какие-то части статьи, то на бумаге они [в данном случае — это текст «Farad n (F) DIN 1301»] располагаются на белом фоне (на экране — это желтый цвет).

Контейнер определяется в приложении С.4.5 стандарта ISO 16642:2003 как структура, используемая при необходимости уточнения соответствующего элемента данных с помощью других информационных элементов (для заглавного слова — это его часть речи; для цитаты — это имя автора цитируемых слов; для символического обозначения — его источник и т.п.). Пример контейнера приводится в таблице 4.

ГОСТ Р ИС01951—2012

Таблица 4 — Исходные данные (пример 23 из приложения С)

F <phys> (unit of capacity: As/V) • Farad n (F) DIN 1301

Хотя в данном англо-немецком словаре слова «Farad», «п», «F» и «DIN 1301» напечатаны в одну строку, между этими элементами существуют зависимости следующего характера:

[Фарада («Farad»)—это имя существительное («поил»), обозначается символом «F» в соответствии со стандартом «DIN 1301»]

Таблица 5 — Кодовое представление (пример 23 из приложения С)

1.    <TranslationCtn>

2.    <Тranslation>Farad</Translation>

3.    <PartOfSpeech value = ‘noun’/>

4.    <SymbolCtn>

5.    <Symbol>F</Symbol>

6.    <Source>DIN 1301</Source>

7.    </SymbolCtn>

8.    <TranslationCtn>

Контейнер перевода (<TranslalionCtn>) используется для уточнения перевода (Farad) путем указания его части речи (<PartOfSpeech>). Контейнер символа (<SymbolCtn>) используется для уточнения символа (F) посредством указания его источника (DIN 1301). Этот контейнер символа встроен в контейнер перевода для добавления к переводу символического обозначения.

4.1.3.2 Блоки

В издаваемых типографским способом словарях часто используются знаки пунктуации (запятая или точка с запятой) для обозначения степени схожести элементов статьи. Например, в таблице 6 слово «feelings» («чувства») в квадратных скобках, которое стоит перед двумя переводами, разделенными запятой, определяет «область использования» этих двух переводов. Точка с запятой закрывает список возможных переводов слова «dam» в рамках области «feelings». Заключенное в квадратные скобки слово «Words» («разговорная речь») открывает новую «область использования».

Блоки используются для кодирования характера такой логической связи.

Таблица 6 — Исходные данные — блок с базовыми компонентами (англо-французский пример 1 из приложения С)

dam…

figurative [feelings] refouler, ravaler; [words] endiguer

Таблица 7 — Схематическое представление блоков с базовыми компонентами

Sense

Block

feelings

refouler

ravaler

Block

words

endiguer

Здесь имеются три родственных узла <Translation>. Блок TranslationBlock используется для объединения двух из этих узлов в одну группу, где они разделяют одну и ту же область использования <RangeOfApplication>.

9

Таблица 8 — Кодовое представление блока с базовыми компонентами (пример 1 из приложения С)

1.    <SenseGroup>

2.    <SenseQualifier>figurative</SenseQualifier>

3.    <TranslationBlock>

4.    <RangeOfApplication>feeling</RangeOfApplication>

5.    <Translation>refouler</Translation>

6.    <Translation>ravaler</Translation>

7.    </TranslationBlock>

8.    <TranslationBlock>

9.    <RangeOfApplication>words</RangeOfApplication>

10.    <Translation>endiguer</Translation>

11.    </TranslationBlock>

12.    </SenseGroup>

Таблица 9 — Исходные данные — блок с контейнерами

cleave [kliv:] v {pt cleaved, cleft [kleft], Lit clove [kl..v]; pp cleaved, cleft, Lit cloven [‘kl..v(.)n])

Здесь имеются три производные формы прошедшего времени глагола “cleave” (раскалывать) и три формы причастия прошедшего времени от этого глагола. Каждая производная форма может быть уточнена указанием для нее произношения или регистра.

Таблица 10 — Схематическое представление блока с контейнерами

Derivation

Block 1 preterit

cleaved

cleft

[pron]

[register]

clove

[pron]

Block 2

past

participle

cleaved

cleft

[register]

cloven

[pron]

Таблица 11 — Кодовое представление блока с контейнерами

1.    <DerivationBlock>

2.    <Tense value = ‘preterit’/>

3.    <Derivation>cleaved</Derivation>

4.    <DerivationCtn>

5.    <Derivation>cleft</Derivation>

6.    <Pronunciation>kleft</Pronunciation>

7.    </DerivationCtn>

8.    <DerivationCtn>

9.    <Derivation>clove</Derivation>

10.    <Pronunciation>[kl..v]</Pronunciation>

11.    <Register value = ‘literary’/>

12.    </DerivationCtn>

13.    </DerivationBlock>

14.    <DerivationBlock>

15.    <Tense value = ‘pastParticiple7>

16.    <Derivation>cleaved</Derivation>

17.    <Derivation>cleft</Derivation>

18.    <DerivationCtn>

19.    <Derivation>cloven</Derivation>

20.    <Pronunciation>’kl..v(.)n</Pronunciation>

21.    <Register value = ‘Iiterary7>

22.    </DerivationCtn>

23.    </DerivationBlock>

10

ГОСТ РИС01951—2012

Таблица 12 — Исходные данные производного блока

—    atEtestable adj.

—    at’testant, at’tester or esp. in legal usage at’testor, at’testator n.

—    attestation (Qa3te£stelS«n) n.

Таблица 13— Схематическое представление производного блока

Derivation

Block

noun

attestant
attester

Block

legal

usage

attestor
attestator

Блок <DerivationBlock> используется для ассоциирования уточнения <PartOfSpeech> с четырьмя производными блоками <Derivation>. Вложенный блок <DerivationBloclo используется для объединения в группу двух последних производных блоков, разделяющих одну и ту же область использования <Range OfApplication>.

Модель XmLex определяет блоки для семи тем: CompositionalPhrase (композиционная фраза), Derivation (производный элемент), Headword (заглавное слово), Inflection (изменение формы слова), MultiWordllnit (многословная единица), Synonym (синоним) и Translation (перевод).

Таблица 14 — Кодовое представление вложенного производного блока

1.    <DerivationBlock>

2.    <PartOfSpeech value = ‘noun’/>

3.    <Derivation>at<Stress/>testant</Derivation>

4.    <Derivation>at<Stress/>tester</Derivation>

5.    <DerivationBlock>

6.    <RangeOfApplication>esp. in legal usage</RangeOfApplication>

7.    <Derivation>at<Stress/>testor</Derivation>

8.    <Derivation>at<Stress/>testator</Derivation>

9.    </DerivationBlock>

10.    </DerivationBlock>

4.1.3.3 Группы

Группа объединяет независимые элементы данных, контейнеры и блоки.

Группа является композиционным элементом, который используется для представления различных (и повторяющихся) наборов информации, например, множественных смысловых значений заглавного слова в рамках словарной статьи.

Таблица 15 — Пример группы (фрагмент примера 3 из приложения С)

pneumatophore 1. (Bot) Pneumatophor n, Atemwurzel f; 2. (Zoo) Pneumatophor n, Schwimmglocke f, Gasflasche f (der Siphonophoren)

11

Таблица 16— Кодовое представление (фрагмент примера 3 из приложения С)

1.    <SenseGroup>

2.    <SubjectField>Bot</SubjectField>

3.    <TranslationCtn>

4.    <Translation>Pneumatophor</Translation>

5.    <PartOfSpeech value = ‘noun’/>

6.    </TranslationCtn>

7.    </SenseGroup>

8.    <SenseGroup>

9.    <SubjectField>Zoo</SubjectField>

10.    <TranslationCtn>

11.    <Translation>Pneumatophor</Translation>

12.    <PartOfSpeech value = ‘noun’/>

13.    </TranslationCtn>

14.    </SenseGroup>

В соответствии с предметной областью заглавное слово имеет два смысловых значения. Каждое из них описывается в группе <SenseGroup>.

Таблица 17 — Список групп

Имя

Групповой

идентификатор

Пояснение

См.

приложение

ппимеп

строка

омографическая

HomographGroup

Группирующий элемент для описания омографов.

с

группа

1

10

смысловая группа

SenseGroup

Группирующий элемент для описания одного смыс-

с

лового значения заглавного слова в словарной ста-

1

тье. См. определение 3.2.3.

12

4.2 Формальная структура словарной статьи

4.2.1 Формальная грамматика для высокоуровневых структур

Словарная статья включает в себя:

—    одну или несколько основных лексических единиц («заглавных слов») и связанные с ними другие лексические единицы (часть речи, произношение, орфографические варианты, словообразование и т.п.);

—    описание каждого смыслового значения заглавных слов и лексических единиц, ассоциируемых с данным значением (композиционных фраз, многословных единиц, переводов, синонимов и др.).

Когда заглавное слово имеет сильно различающиеся смысловые значения, словарная статья может разбиваться на подстатьи по каждому омографу или для каждого значения может создаваться отдельная статья (с соответствующим номером омографа).

Несколько статей могут группироваться внутри уникального «гнезда» для сборки родственных заглавных слов в компактный словарь.

Модель представляется с использованием следующих соглашений расширенной формы Бэкуса — Наура (РБНФ):

—    терминальные элементы являются существительными без разделителей; их объяснение дается до начала использования (примером может служить заглавное слово);

—    символы разделяются знаками <>;

—    {} обозначает любое число вхождений, включая 0;

—    [ ] обозначает отсутствие или ровно одно вхождение;

—    + означает одно или множество вхождений.

ГОСТ РИС01951—2012

Необходимо помнить, что:

—    порядок следования элементов внутри правила не имеет значения; например, внутри контейнера повторяющиеся уточняющие элементы могут появляться как до, так и после уточняемого элемента данных;

—    символы, имя которых заканчивается словом <Л/а1ие»(значение), как, например, <Gramma-ticalGenderValue>, или словом «Туре» (тип), KaK<HeadwordType>, в настоящем международном стандарте не рассматриваются; они относятся к допустимым значениям, которые определены в ISO 12620:1999 и в «Реестре категорий данных Технического комитета 37» (ТС 37 Data Category Registry).

Для элемента данных разрешаются списки допустимых значений. Например, элемент грамматического рода <GrammaticalGenderValue> может содержать значения «мужской», «женский», «средний» и т.п.

Определение типов дает дополнительную информацию о характере элемента данных. Например, <HeadwordType> будет содержать перечисление типов заглавных слов (имя нарицательное, имя собственное, приставка, суффикс, географическое название и др.).

Реализация этой модели всегда дает пользователю возможность добавлять собственные новые типы или нужные ему допустимые значения.

—    Описание цитирования (CitationCtn) в настоящем стандарте отсутствует. Его компоненты следует заимствовать в ISO 15836 (Дублинское ядро) или ISO 12615 (ссылки на источники).

1.

<Dictionary> ::=

<generalQualifiers>

[sourceLanguage]

[targetLanguage]

{<DictionaryEntry> | <NestEntry> | <lnsert>)

2.

<NestEntry> ::= <generalQualifiers> [sourceLanguage] [targetLanguage] {DictionaryEntry>}

3.

<DictionaryEntry> ::=

[sortKey]

[sourceLanguage]

[targetLanguage]

[homographNumber]

<generalQualifiers>

(Headword! HeadwordCtn| HeadwordBlock)+ {HomographGroup} | {SenseGroup} {MultiWordUnitCtn | CompositionalPhraseCtn| {<Administrativelnformation>}

4.

<HomographGroup> ::=

<generalQualifiers>

[Headword! HeadwordCtn| Headword Block] {<CoreComments> | <SenseGroup>) {<RelatedTopics>}

5.

<SenseGroup> ::= <generalQualifiers> [senseNumber] [targetLanguage] {<CoreComments>| <RelatedTopics>| <SenseGroup>) (See|SeeCtn)

6.

<RelatedTopic> ::=

{AbbreviatedForm| <AbbreviatedFormCtn>

Analogy |<AnalogyCtn>| <AnalogyBlock>|

Antonym| <AntonymCtn>

Citation| <CitationCtn>|

CompanySpecificUsage| CompanySpecificllsageCtn| CompositionalPhrase| <CompositionalPhraseCtn>| <CompositionalPhraseBlock>| Derivation|<DerivationCtn>|<DerivationBlock>| Example|<ExampleCtn>|

FalseFriend|<FalseFriendCtn>|

FreeTopic|<FreeTopicCtn>|

FullForm|<FullFormCtn>|

Flomonym| FlomonymCtn|

lnflection|<lnflectionCtn>|<lnflectionBlock>|

lnternationalScientificTerm|<lnternationalScientificTermCtn>|

MultiWordUnit|<MultiWordUnitCtn>|<MultiWordUnitBlock>|

Proprietary Restriction! ProprietaryRestrictionCtn|

Synonym|<SynonymCtn>|<SynonymBlock>|

Translation |<TranslationCtn>|<TranslationBlock>| Variant|<VariantCtn>}

7.

<FleadwordCtn> ::= <generalQualifiers> Fleadword {<CoreComments>| <RelatedTopics>}

8.

<FleadwordBlock> ::= <generalQualifiers> (Fleadword | FleadwordCtn)+

{<CoreComments>}

9.

<MultiWordllnitCtn> ::= <generalQualifiers> MultiWordllnit+ {<CoreComments>| <RelatedTopics>} {<SenseGroup>}

10.

<CompositionalPhraseCtn> ::= <generalQualifiers> CompositionalPhrase+ {<CoreComments>| <RelatedTopics>} {<SenseGroup>}

11.

<LinguisticComment> ::=

Attestation | < Attestation Ctn > |

Case|<CaseCtn>|

Complement! <ComplementCtn>|

Display!

Etymology|<EtymologyCtn>|

Formation |<FormationCtn>|

Formula! <FormulaCtn>|

Frequency|<FrequencyCtn>|

GeographicalUsage|<GeographicalUsageCtn>|

GrammaticalGender|<GrammaticalGenderCtn>|

GrammaticalNumber|<GrammaticalNumberCtn>|

GrammaticalPatteml GrammaticalPatternCtn|

GuidePhrase|<GuidePhraseCtn>|

Mood|<MoodCtn>|

NormativeStatus|<NormativeStatusCtn>|

PartOfSpeech|<PartOfSpeechCtn>|

Person|<PersonCtn>|

Pronunciation|<PronunciationCtn>|

RangeOfApplication|<RangeOfApplicationCtn>|

Register|<RegisterCtn>|

SearchForm|<SearchFormCtn>|

Syllabification|<SyllabificationCtn>|

Symbol|<SymbolCtn>|

TypicalComplementl TypicalComplementCtn| Tense|<TenseCtn>|

UsageNote|<UsageNoteCtn>

12.

<SemanticComment> :: =

Definition! <DefinitionCtn>| Senselndicator| SenselndicatorCtn| SenseQualifier|<SenseQualifierCtn>| SubjectField|<SubjectFieldCtn>

13.

<CoreComments> ::= {<LinguisticComments>| <SemanticComments>| <CrossReferences>| <FreeElements>| <GeneralElements>| <Administrativelnformations>}

14.

<CrossReferences> ::= SeeAlso

15.

<Administrativelnformation> ::= Origination | Modification

16.

<FreeElements> ::= FreeComment| <FreeCommentCtn>

17.

<GeneralElements> ::= Note| <NoteCtn>| Source! <SourceCtn>

18.

<ContainerComplement> ::= <FreeElements>| <GeneralElements>

19.

<generalQualifiers> ::= [id] [class] [style] [xmhlang] [documentSize] [display]

4.2.2 Формальная грамматика для контейнеров других лексических единиц

20.

<AbbreviatedFormCtn> ::= <generalQualifiers> Abbreviated Form {<CoreComments>| <RelatedTopics>}

21.

<AnalogyCtn> ::= <generalQualifiers> Analogy {<CoreComments>| <RelatedTopics>}

22.

<AntonymCtn> ::= <generalQualifiers> Antonym {<CoreComments>| <RelatedTopics>}

23.

<DerivationCtn> ::= <generalQualifiers> Derivation {<CoreComments>| <RelatedTopics>}

24.

<ExampleCtn> ::= <generalQualifiers> Example {<CoreComments>| <RelatedTopics>}

25.

<FalseFriendCtn> ::= <generalQualifiers> FalseFriend {<CoreComments>| <RelatedTopics>}

26.

<FreeTopicCtn> ::= <generalQualifiers> FreeTopic {<CoreComments>| <RelatedTopics>}

27.

<FullFormCtn> ::= <generalQualifiers> FullForm {<CoreComments>| <RelatedTopics>}

28.

<lnflectionCtn> ::= <generalQualifiers> Inflection {<CoreComments>| <RelatedTopics>}

29.

<lnternationalScientificTermCtn> ::= <generalQualifiers> InternationalScientificTerm {<CoreComments>| <RelatedTopics>}

30.

<SearchFormCtn> ::= <generalQualifiers> SearchForm {<CoreComments>| <RelatedTopics>}

31.

<SynonymCtn> ::= <generalQualifiers> Synonym {<CoreComments>| <RelatedTopics>}

32.

<TranslationCtn> ::= <generalQualifiers> Translation {<CoreComments>| <RelatedTopics>}

33.

<VariantCtn> ::= <generalQualifiers> Variant {<CoreComments>| <RelatedTopics>}

4.2.3 Формальная грамматика для блоков

34.

<AnalogyBlock> ::= <generalQualifiers> (Analogy| AnalogyCtn>| <AnalogyBlock>)+ {<CoreComments>}

35.

<CompositionalPhraseBlock> ::= <generalQualifiers> (CompositionalPhrase| <CompositionalPhraseCtn>| <CompositionalPhraseBlock>)+ {<CoreComments>}

36.

<DerivationBlock> ::= <generalQualifiers> (Derivation! <DerivationCtn>| <DerivationBlock>)+ {<CoreComments>}

37.

<HeadwordBlock> ::= <generalQualifiers> (Headword! <HeadwordCtn>| <HeadwordBlock>)+ {<CoreComments>}

38.

<lnflectionBlock> ::= <generalQualifiers> (Inflection! <lnflectionCtn>| <lnflectiontionBlock>)+ {<CoreComments>}

39.

<MultiWordllnitBlock> ::= <generalQualifiers>

(MultiWordUnit|<MultiWordUnitCtn>|<MultiWordUnitBlock>)+

{<CoreComments>}

40.

<SynonymBlock> ::= <generalQualifiers>

(Synonym|<SynonymCtn>|<SynonymBlock>)+ {<CoreComments>}

41.

<TranslationBlock> ::= <generalQualifiers> (Translation |<TranslationCtn>|<TranslationBlock>)+ {<CoreComments>}

42.

<VariantBlock> ::= <generalQualifiers> (Variant|<VariantCtn>|<VariantBlock>)+ {<CoreComments>}

4.2.4 Формальная грамматика для контейнеров других комментариев

43.

<AttestationCtn> ::= <generalQualifiers> Attestation {<ContainerComplement>}

44.

<CaseCtn> ::= <generalQualifiers> Case { Example! ExampleCtn| <ContainerComplement>}

45.

<DefinitionCtn> ::= <generalQualifiers> Definition {<ContainerComplement>}

46.

<EtymologyCtn> ::= <generalQualifiers> Etymology {<ContainerComplement>}

47.

<FormulaCtn> ::= <generalQualifiers> Formula [Source] <lnflectionCtn> ::= Inflection { <LinguisticComment> }

48.

<FreeCommentCtn> ::= <generalQualifiers> FreeComment {<CoreComments>}

49.

<FrequencyCtn> ::= <generalQualifiers> Frequency {<ContainerComplement>}

50.

<GeographicalUsageCtn> ::= <generalQualifiers> Geographical Usage {<ContainerComplement>}

51.

<GuidePhraseCtn> ::= <generalQualifiers> GuidePhrase {<ContainerComplement>}

52.

<GrammaticalGenderCtn> ::= <generalQualifiers> GrammaticalGender {<ContainerComplement>}

ГОСТ РИС01951—2012

Содержание

1    Область применения………………………………… 1

2    Нормативные ссылки………………………………… 1

3    Термины и определения……………………………….. 1

4    Формализованное описание словарных статей……………………… 2

4.1    Общий обзор элементов данных и композиционных элементов……………. 2

4.1.1    Элементы данных……………………………… 3

4.1.2    Иерархические структуры: словарь и словарные статьи…………….. 8

4.1.3    Композиционные элементы………………………….. 8

4.2    Формальная структура словарной статьи……………………… 12

4.2.1    Формальная грамматика для высокоуровневых структур…………….. 12

4.2.2    Формальная грамматика для контейнеров других лексических единиц………. 15

4.2.3    Формальная грамматика для блоков……………………… 16

4.2.4    Формальная грамматика для контейнеров других комментариев…………. 16

4.2.5    Формальная грамматика для лексических единиц……………….. 18

4.2.6    Формальная грамматика для комментариев………………….. 18

4.3    Модели контента…………………………………. 20

4.3.1    Элементы контента……………………………… 20

4.3.2    Вложенные элементы……………………………. 20

4.3.3    Базовые элементы……………………………… 22

4.3.4    Указатель…………………………………. 22

4.3.5    Формальная грамматика для вложенных    контейнеров……………… 23

4.3.6    Формальная грамматика контента    категории данных………………. 23

4.4    Общие спецификаторы……………………………… 24

5    Способы представления………………………………. 25

5.1    Средства макетирования……………………………… 25

5.1.1    Общие положения……………………………… 25

5.1.2    Средства разметки словарей…………………………. 25

5.2    Механизмы уплотнения……………………………… 26

5.2.1    Общепринятые сокращения…………………………. 26

5.2.2    Повторения сокращенной формы заглавного слова……………….. 26

5.2.3    Символы повторения (тильда или тире)…………………….. 26

5.2.4    Гнездовой принцип……………………………… 26

Приложение А (справочное) Арабская, римская и греческая системы нумерации………. 27

Приложение В (справочное) Таблицы функций лексикографических символов………… 29

Приложение С (справочное) Примеры кодовых представлений на языке XML………… 44

Приложение D (справочное) Определение средств сборки компонентов словаря и сжатия словарных

статей…………………………………. 65

Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов

ссылочным национальным    стандартам Российской Федерации………. 73

53.

<GrammaticalNumberCtn> ::= <generalQualifiers> GrammaticalNumber {<ContainerComplement>}

54.

<GrammaticalPatternCtn> ::= <generalQualifiers> GrammaticalPattern {<ContainerComplement>}

55.

<lnsertCtn> ::= <generalQualifiers> Insert {<ContainerComplement>}

56.

<MoodCtn> ::= <generalQualifiers> Mood {Example| ExampleCtn| <ContainerComplement>}

57.

<NormativeStatusCtn> ::= <generalQualifiers> NormativeStatus {<ContainerComplement>}

58.

<NoteCtn> ::= <generalQualifiers> Note {<ContainerComplement>}

59.

<PartOfSpeechCtn> ::= <generalQualifiers> PartOfSpeech [Subcategorisation| SubcategorisationCtn] [GrammaticalGender] [GrammaticalNumber] {<ContainerComplement>}

60.

<PersonCtn> ::= <generalQualifiers> Person { Example| ExampleCtn| <ContainerComplement>}

61.

<PronunciationCtn ::= <generalQualifiers> Pronunciation {<ContainerComplement>}

62.

<RegisterCtn ::= <generalQualifiers> Register {<ContainerComplement>}

63.

<RangeOfApplicationCtn> ::= <generalQualifiers> RangeOfApplication {<ContainerComplement>}

64.

<SeeCtn> ::= <generalQualifiers> See { Corecomments } (HomographNumber) (SenseNumber) {<ContainerComplement>}

65.

<SenselndicatorCtn> ::= <generalQualifiers> Senselndicator {<ContainerComplement>}

66.

<SenseQualifierCtn> ::= <generalQualifiers> SenseQualifier {<ContainerComplement>}

67.

<SourceCtn> ::= <generalQualifiers> Source {<ContainerComplement>}

68.

<SubcategorisationCtn> ::= <generalQualifiers> Subcategorisation {<ContainerComplement> [SubcategorisationCtn]}

69.

<SubjectFieldCtn> ::= <generalQualifiers> SubjectField {<ContainerComplement>}

70.

<SyllabificationCtn> ::= <generalQualifiers> Syllabification {<ContainerComplement>}

71.

<SymbolCtn> ::= <generalQualifiers> Symbol { Source } {<ContainerComplement>}

72.

<TenseCtn> ::= <generalQualifiers> Tense { Example| ExampleCtn| <ContainerComplement>}

73.

<TypicalComplementCtn> ::= <generalQualifiers> TypicalComplement {<ContainerComplement>}

74.

<UsageNoteCtn> ::= <generalQualifiers> UsageNote {<CoreComments>}

Введение

За последние 10 лет процессы создания словарной продукции претерпели важные изменения по причине широкого распространения электронных словарей. Вследствие этого лексикографы оказались перед фактом огромного разнообразия методов разработки и публикации словарей.

Настоящий стандарт имеет целью информационную поддержку процессов создания и организации использования самых разных типов словарной продукции. При этом принимаются во внимание различные способы применения словарей, в особенности такие, которые связаны с новыми функциональными возможностями электронных документов — гиперссылками.

Для того, чтобы сделать информационное содержимое словарей многократно используемым в разных печатных и электронных форматах, лексикографы постоянно стремятся создать надлежащую единую, четко структурированную лексикографическую первооснову или информационный репозиторий. В настоящем стандарте предлагается конкретная модель, основанная на профессиональном опыте и лучших достижениях сложившейся практики и призванная способствовать дальнейшему совершенствованию процедур создания, взаимообмена и организации эффективного использования словарей.

IV

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Представление и изложение словарных статей. Требования, рекомендации и информация

Presentation and representation of entries in dictionaries. Requirements, recommendations and information

Дата введения — 2014 — 01 — 01

1    Область применения

Настоящий стандарт касается одноязычных и многоязычных общих и отраслевых словарей. Он определяет формализованную общую структуру, не зависящую от носителя информации, и устанавливает способы и средства представления статей в «бумажных» и электронных словарях. Связь между этой формальной структурой и представлениями словарных статей, которые используются издателями и читаются пользователями, поясняется примерами, рассмотренными в информативных приложениях.

Цель данного стандарта состоит в том, чтобы облегчить задачи создания, слияния, сравнения, поиска, информационного обмена, распространения и извлечения лексикографических словарных данных. В стандарте используется лексикографический подход к проблеме, основанный на выработке рекомендаций и не имеющий отношения к концептуальным разработкам, определенным в стандарте ИСО 704.

2    Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним.

ИСО 704:2000 Терминологическая работа. Принципы и методы (ISO 704:2009, Terminology work — Principles and methods)

ИСО 1087-1:2000 Терминологическая работа. Словарь. Часть 1: Теория и применение (ISO 1087-1:2000, Terminology work — Vocabulary — Part 1: Theory and application)

3    Термины и определения

В настоящем стандарте использованы следующие термины с соответствующими определениями:

3.1    комментарий (comment): Металингвистическая информация, описывающая лексическую единицу с помощью лексикографических элементов данных или составных элементов.

3.2    составной элемент (component element): Составной информационный объект, образованный элементами.

Примечание — Существуют три семейства составных элементов: блоки, контейнеры и группы.

3.3    блок (block): Разложимая структура данных, составной элемент, служащий для факторизации элементов, которые используются множеством экземпляров конкретного элемента в качестве общих уточнений.

Примечание — Примеры блоков приведены в таблицах 6—14.

Издание официальное

3.4    контейнер (container): Уточняющая структура, составной элемент, используемый для предоставления дополнительной информации об одном конкретном элементе данных с помощью других элементов.

Пример — Контейнер заглавного слова, используемый для представления его произношения или указания части речи и уточняющий таким образом заглавное слово, которое само по себе является уточненным элементом данных.

3.5    группа (group): Составной элемент, используемый для объединения нескольких независимых

элементов.

Пример — Смысл понятия описывается группой элементов, таких как определение, предметная область и др.

Примечание — Пример группы представлен в таблицах 15 и 16.

3.6    элемент данных (data element): Единица информации определенной категории, для которой с помощью набора признаков заданы определение, идентификатор, форма представления и диапазон допустимых значений.

[ИСО/МЭК 11179-1:2004, определение 3.3.8]

Примечание — Списки элементов данных представлены в таблицах 1 и 2.

3.7    словарная статья (dictionary entry): Лексический вход, часть словаря, которая содержит информацию, относящуюся к одной лемме и ее вариантам.

3.8    элемент (element): Любой элемент данных или составной элемент.

3.9    заглавное слово (headword): Слово лексического входа, лемма, которая служит заголовком для

статьи в словаре.

3.10    лемма (lemma): Базовое слово, лексическая единица, выбранная в соответствии с лексикографическими соглашениями о представлении различных форм инфлективной парадигмы.

Пример — «Продавать» — это лемма парадигмы «продает, продал, продающий и т. д.».

3.11    лексическая единица, лексема (lexical unit): Языковая единица, принадлежащая к лексикону данного языка и описанная или упомянутая в словаре.

3.12    лексикографический символ (lexicographical symbol): Буква, знак пунктуации или иной типографский либо графический символ или группа символов, равно как их комбинация, используемые для представления определенных лексикографических или терминологических данных, которые отображаются или выводятся автономно либо в сочетании с другим элементом лексикографических данных.

3.13    гнездовая рубрика (nested entry): Группирующая структура для родственных словарных статей с общим заглавным словом.

4 Формализованное описание словарных статей

Для большей четкости изложения рассматриваемая ниже формализованная модель, именуемая в дальнейшем как XmLex, иллюстрируется короткими примерами, запрограммированными в соответствии с документом, касающимся определения типов данных в языке XML и носящим имя XmLex_V00 (более подробную информацию см. в справочном приложении С).

4.1 Общий обзор элементов данных и композиционных элементов

Словарные статьи могут рассматриваться как комментарии копределенным темам, образующим лексические единицы словаря. Статья имеет главную тему (определяемую заглавным словом); все другие темы (например, варианты, переводы) называются «зависимыми темами». Темы и комментарии являются элементами данных. Каждому элементу данных соответствует модель информационного содержания (контента). Элементы данных группируются в композиционные элементы для создания непротиворечивого и полностью поддающегося вычислительной обработке лексического входа. Приводимые ниже открытые списки элементов данных и композиционных элементов могут расширяться пользователем в соответствии с конкретными целями.

В словарях, издаваемых типографским способом, для определения связей между темами и комментариями, как правило, соблюдаются определенные типографские соглашения (использование обычного,

2

ГОСТ Р ИС01951—2012

полужирного и курсивного шрифтов); соглашения по размещению (до/после) и по знакам пунктуации (запятая и точка с запятой). В модели XmLex:

—    положение элемента никогда не используется для обозначения связи между двумя элементами;

—    не существует никаких маркеров, эквивалентных типографским знакам (запятой и точке с запятой).

Композиционные элементы (контейнеры, блоки и группы) используются для кодирования логических

зависимостей между комментариями и темами таким образом, что, с одной стороны, всегда имеется возможность автоматически скомпоновать и выдать на печать любую форму, а, с другой стороны, автоматически «просчитать» все взаимосвязи между элементами в случае преобразования данных (например, для обращения двуязычного словаря) или при повторном использовании данных в иных контекстах, например, в среде систем памяти переводов или лексических баз данных.

В данной части стандарта:

—    описываются элементы данных и их объединение в композиционные элементы, необходимые для представления наиболее общих словарных статей1 >;

—    определяется формализованная модель словаря в расширенном представлении Бэкуса — Наура, которое часто используется в качестве формальной нотации для описания синтаксической структуры данного языка;

—    даются в приложениях примеры реализации и средства контроля, основанные на использовании спецификаций XML, Xpointer, XSL и XHTML.

4.1.1    Элементы данных

4.1.1.1    Лексические единицы

Представленная ниже таблица содержит перечень лексических единиц и комментариев, которые следует использовать в стандартизованной словарной статье.

В первом столбце таблицы дается обозначение элемента данных. Второй столбец показывает групповой идентификатор этого элемента в рамках формализованной модели. В третьем столбце приводится короткое пояснение, а в четвертом — помещена ссылка на первый соответствующий пример (если таковой существует) элемента данных в приложениях (буква обозначает приложение, подчеркнутый номер указывает номер примера, а последний номер определяет нужную строку).

Таблица 1 — Список лексических единиц

См.

Имя

Групповой

Пояснение

приложение

идентификатор

поимео

строка

сокращенная

AbbreviatedForm

Лексическая единица, образованная путем удале-

с

форма

ния отдельных слов или букв из более длинной

7

формы […].

[адаптированный пример из IS01087-1:2000, определение 3.4.9]

3

аналогия

Analogy

Лексическая единица, имеющая некоторое сход-

С

ство по смысловому содержанию с текущей лекси-

10

ческой единицей.

[адаптированный пример из IS0 1087-1:2000, определение 3.4.9]

4

антоним

Antonym

Лексическая единица, которая представляет по-

С

нятие, противоположное по смыслу текущей лек-

5

сической единице.

[адаптированный пример из ISO 12620:1999, А. 10.18.6]

45

^ Каждому элементу данных присваивается условное имя и описание, которое должно в максимально возможной степени отвечать требованиям стандарта ISO 12620:1999. Произвольные элементы данных, тип которых определяется пользователем, позволяют осуществить расширение модели на ситуации «договорного информационного обмена».

3

См.

Имя

Групповой

Пояснение

приложение

идентификатор

поимео

строка

композиционная

CompositionalPhrase

Любое многократно повторяющееся общепринятое

с

фраза

словосочетание, такое как коллокация, пословица,

4

поговорка и т.п.

15

словообразование

Derivation

Изменение формы лексической единицы, обычно

С

выражающееся в модифицировании корневой ос-

5

новы или аффиксации и сигнализирующее об изменении информации о части речи.

9

пример

Example

Экземпляр, типичный для применения лексической

С

единицы в определенном контексте.

4

10

ложный друг

FalseFriend

Лексическая единица языка, кажущаяся формаль-

С

ным или семантическим подобием лексической

15

единице другого языка, но не соответствует ей по

6

смыслу.

[адаптированный пример из ISO 12620:1999, А.3.2]

произвольная тема

FreeTopic

Лексическая единица, тип которой в данном меж-

С

дународном стандарте не определен.

18

5

полная форма

FullForm

Полная форма представления лексической едини-

С

цы, для которой существует сокращенная форма.

20

[адаптированный пример из ISO 12620:1992, А.2.1.7]

3

заглавное слово

Fleadword

Лемма, являющаяся заголовком словарной статьи.

С

1

4

инфлексия

Inflection

Модификация формы слова для выражения других

С

грамматических связей, в которых оно может уча-

22

ствовать.

5

международный

InternationalScie-

Термин, являющийся частью научной терминологии,

С

научный термин

ntificTerm

принятой соответствующим научным распоряди-

39

тельным органом.

[адаптированный пример из ISO 12620:1999, А.2.1.4]

12

многословная

MultiWordllnit

Лексическая единица, состоящая из нескольких слов

С

лексическая

и выражающая только одно понятие.

1

единица

42

СИМВОЛ

Symbol

Обозначение некоторого понятия буквами, числа-

С

ми, пиктограммами или любой их комбинацией.

23

[адаптированный пример из ISO 12620:1999, А.2.1.13]

7

синоним

Synonym

Лексическая единица, которая представляет то же

С

самое или очень близкое понятие, что и заглавное

5

слово словарной статьи.

27

[адаптированный пример из ISO 12620:1999, А.2.1.2]

4

Имя

Групповой

идентификатор

Пояснение

См.

приложение

ппимеп

строка

перевод

Translation

Эквивалентная лексическая единица, принадлежа-

с

щая целевому языку перевода.

1

15

вариант

Variant

Одна из альтернативных форм лексической еди-

С

ницы.

32

[адаптированный пример из ISO 12620:1999, А.2.1.9]

5

Таблица 2 — Список комментариев

См.

Имя

Групповой

Пояснение

приложение

идентификатор

поимео

строка

Засвидетельство-

Attestation

Дата или время просмотра лексической единицы.

с

вание

И

8

падеж

Case

Грамматическая форма лексической единицы (су-

С

ществительное, местоимение или модификатор),

24

указывающая на ее грамматическую связь с другими словами в статье или предложении.

7

цитата

Citation

Цитата из книги, статьи или документа.

С

4

25

дополнение

Complement

Вспомогательная часть лексической единицы (например, предлог «to» с английским глаголом), [адаптированный пример из ISO 16642:2003, С.4.10.2]

определение

Definition

Предложение, которое описывает некоторое поня-

С

тие и позволяет отличать его от других понятий в

4

рамках системы концептов.

[адаптированный пример из ISO 12620:1999, А.5.1]

61

отображение

Display

Синтезированный текст, который может показывать-

С

ся вместо раздельного представления тем или ком-

2

ментариев.

33

ЭТИМОЛОГИЯ

Etymology

Информация о происхождении конкретного слова

С

и эволюции его смыслового значения.

4

[адаптированный пример из ISO 12620:1999, А.2.4.2]

6

формула

Formula

Цифры, символы или иные средства краткого выра-

С

жения понятия, как, например, математическая или

16

химическая формула.

[адаптированный пример из ISO 12620:1999, А.2.1.14]

3

частота

Frequency

Характеристика относительной интенсивности и

С

общности использования лексической единицы.

19

[адаптированный пример из ISO 12620:1999, А.2.3.4]

3

5

Имя

Групповой

идентификатор

Пояснение

См.

приложение

поимео

строка

свободный

комментарий

FreeComment

Металингвистические средства, используемые для описания лексической единицы.

с

17

1

география

GeographicalUsage

Использование лексической единицы, отражающее

С

применения

региональные различия.

[адаптированный пример из ISO 12620:1999, А.2.3.2]

21

10

грамматический род

GrammaticalGender

Совокупность из двух или более грамматических категорий, на которые разделяются имена существительные конкретного языка.

С

1

15

грамматическое

GrammaticalNumber

Во многих языках — грамматический признак раз-

С

число

личия, который указывает на количество объектов, определяемых данной лексической единицей, [адаптированный пример из ISO 12620:1999, А.2.2.3]

2

48

грамматическая

GrammaticalPattern

Грамматическая конструкция, в которой часто ветре-

С

структура

чается конкретная лингвистическая единица.

34

5

направляющая

GuidePhrase

Грамматический оборот, иллюстрирующий случай

С

фраза

употребления слова или его конкретного смыслового значения.

2

50

вставка

Insert

Текст, таблица или рисунок, которые представляют некоторые грамматические, энциклопедические, научные или культурологические сведения, относящиеся к словарной статье или к нескольким словарным статьям. Такая вставка может совершенно не зависеть от текста словаря.

наклонение

Mood

Свойство глаголов, выражающее отношение говорящего к реальности или правдоподобию того, о чем идет речь.

С

25

6

нормативный статус

NormativeStatus

Указатель статуса термина, присвоенный полномочным органом власти, таким как организация по стандартизации или государственным регуляционным учреждением.

[адаптированный пример из ISO 12620:1999, А.2.9.1]

С

26

4

примечание

Note

Дополнительная информация, касающаяся любого другого элемента совокупности данных, [адаптированный пример из ISO 12620:1999, А.8]

С

3

24

часть речи

PartOfSpeech

Тип, присвоенный лексической единице на основании ее грамматических и семантических свойств, [адаптированный пример из ISO 12620:1999, А.2.2.1]

С

1

11

лицо

Person

Индикатор грамматического лица (1-го, 2-го, 3-го и т.п.), ассоциируемого с данной изменяемой лексической единицей.

С

25

7

1 Область применения

2 Нормативные ссылки

3 Термины и определения

4 Формализованное описание словарных статей

     4.1 Общий обзор элементов данных и композиционных элементов

     4.1.1 Элементы данных

     4.1.2 Иерархические структуры: словарь и словарные статьи

     4.1.3 Композиционные элементы

     4.2 Формальная структура словарной статьи

     4.2.1 Формальная грамматика для высокоуровневых структур

     4.2.2 Формальная грамматика для контейнеров других лексических единиц

     4.2.3 Формальная грамматика для блоков

     4.2.4 Формальная грамматика для контейнеров других комментариев

     4.2.5 Формальная грамматика для лексических единиц

     4.2.6 Формальная грамматика для комментариев

     4.3 Модели контента

     4.3.1 Элементы контента

     4.3.2 Вложенные элементы

     4.3.3 Базовые элементы

     4.3.4 Указатель

     4.3.5 Формальная грамматика для вложенных контейнеров

     4.3.6 Формальная грамматика контента категории данных

     4.4 Общие спецификаторы

5 Способы представления

     5.1 Средства макетирования

     5.1.1 Общие положения

     5.1.2 Средства разметки словарей

     5.2 Механизмы уплотнения

     5.2.1 Общепринятые сокращения

     5.2.2 Повторения сокращенной формы заглавного слова

     5.2.3 Символы повторения (тильда или тире)

     5.2.4 Гнездовой принцип

Приложение А (справочное) Арабская, римская и греческая системы нумерации

Приложение В (справочное) Таблицы функций лексикографических символов

Приложение С (справочное) Примеры кодовых представлений на языке XML

Приложение D (справочное) Определение средств сборки компонентов словаря и сжатия словарных статей

Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов ссылочным национальным стандартам Российской Федерации

Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30
Николай Иванов

Эксперт по стандартизации и метрологии! Разрешительная и нормативная документация.

Оцените автора
Все-ГОСТЫ РУ
Добавить комментарий