WWW.MASH.DOBROTA.BIZ
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - онлайн публикации
 

«ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ ГОСТР ^ ^ НАЦИОНАЛЬНЫЙ 57773— СТАНДАРТ РОССИЙСКОЙ (ИСО 19157: ФЕДЕРАЦИИ 2013) ПРОСТРАНСТВЕННЫЕ ДАННЫЕ Качество данных (ISO ...»

ФЕДЕРАЛЬНОЕ АГЕНТСТВО

ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

ГОСТР

^ ^

НАЦИОНАЛЬНЫЙ 57773—

СТАНДАРТ

РОССИЙСКОЙ

(ИСО 19157:

ФЕДЕРАЦИИ

2013)

ПРОСТРАНСТВЕННЫЕ ДАННЫЕ

Качество данных

(ISO 19157:2013,

Geographic information — Data quality, MOD)

Издание официальное Москва Стандартинформ салфетка роза ГОСТ Р 57773—2017 Предисловие 1 ПОДГОТОВЛЕН Федеральным государственным бюджетным учреждением «Федеральный на­ учно-технический центр геодезии, картографии и инфраструктуры пространственных данных» (ФГБУ «Центр геодезии, картографии и ИПД») на основе собственного перевода на русский язык англоязыч­ ной версии стандарта, указанного в пункте 4 2 ВНЕСЕН Техническим комитетом по стандартизации ТК 394 «Географическая информация/геоматика»

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому ре­ гулированию и метрологии от 6 октября 2017 г. № 1367-ст 4 Настоящий стандарт является модифицированным по отношению к международному стандар­ ту ИСО 19157:2013 «Географическая информация — Качество данных» (ISO 19157:2013 «Geographic information — Data quality, MOD») путем включения дополнительных фраз, слов, ссылок и внесения изменений по отношению к тексту применяемого международного стандарта, которые выделены курси­ вом, подчеркиванием сплошной горизонтальной линией, а также невключения отдельных структурных элементов, ссылок и дополнительных элементов. Объяснения причин внесения этих технических от­ клонений приведены во введении .



Сопоставление структуры настоящего стандарта со структурой указанного международного стан­ дарта приведено в дополнительном приложении ДА .

Наименование настоящего стандарта изменено относительно наименования указанного между­ народного стандарта для приведения в соответствие с ГОСТ Р 1.5—2012 (пункт 3.5) .

Сведения о соответствии ссылочных национальных стандартов международным стандартам, ис­ пользованным в качестве ссылочных в примененном международном стандарте, приведены в допол­ нительном приложении ДБ 5 ВВЕДЕН ВПЕРВЫЕ Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ «О стандартизации в Российской Федерации». Информация об из­ менениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе «Национальные стандарты». Соответ­ ствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулиро­ ванию и метрологии в сети Интернет (www.gost.ru)

–  –  –

1 Область применения

2 Соответствие

3 Нормативные ссылки

4 Термины и определения

5 Сокращенные терм ины

6 Обзор качества данны х

7 Компоненты качества данных

7.1 Обзор компонентов

7.2 Единица качества данных (data quality u n it)

7.3 Элементы качества данных (data quality elements)



7.4 Дескрипторы элементов качества (descriptors of data quality elem ents)

7.5 Элементы метакачества (metaquality elem ents)

7.6 Дескрипторы элемента метакачества (descriptors of a metaquality element)

8 Меры качества данных (data quality m easures)

8.1 Общие положения

8.2 Стандартизированные меры качества данных

8.3 Создание определяемых пользователем мер качества данны х

8.4 Каталог мер качества данных

8.5 Список компонентов

8.6 Подробное описание компонентов

9 Оценка качества данных (data quality evaluation)

9.1 Процесс оценки качества данных

9.2 Методы оценки качества данных (data quality evaluation methods)

9.3 Обобщение и преобразование (aggregation and derivation)

10 Отчетность о качестве данных (data quality reporting)

10.1 Общие положения

10.2 Частные случаи

Приложение А (обязательное) Комплекс проверок

Приложение В (справочное) Концепции оценки качества данных и их применение

Приложение С (обязательное) Словарь данных для оценки качества

Приложение D (обязательное) Перечень стандартизированных мер качества д а н н ы х

Приложение Е (справочное) Оценка и выдача информации о качестве данных

Приложение F (справочное) Методы выборочной оценки

Приложение G (обязательное) Базовые меры качества данных

Приложение Н (справочное) Управление мерами качества данных

Приложение I (справочное) Руководство по использованию элементов качества

Приложение J (справочное) Обобщение результатов оценки качества

Приложение ДА (справочное) Сопоставление структуры настоящего стандарта со структурой примененного в нем международного стандарта

Приложение ДБ (справочное) Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандарте

Библиография

–  –  –

Пространственные данные все чаще распространяют, обменивают и используют для целей, от­ личных от тех, которые предусматривались разработчиком. Информация о качестве доступных данных имеет важнейшее значение для процесса отбора наборов данных, в которых ценность данных напря­ мую связана с их качеством. Пользователям пространственных данных представляется множество на­ боров данных на выбор. В связи с этим возникает необходимость сравнения качества наборов данных с целью определения тех, которые наилучшим образом отвечают потребностям пользователя .

Цель описания качества пространственных данных состоит в облегчении сравнения и выбора набора данных, которые наилучшим образом удовлетворяют потребностям или требованиям прило­ жений. Полные описания качества наборов данных будут способствовать распространению, обмену и использованию соответствующих наборов данных. Информация о качестве пространственных данных позволяет их разработчику оценить, насколько точно данный набор отвечает критериям, изложенным в спецификации продукта, и помогает пользователям данных оценить способность продукта удовлет­ ворять требованиям его конкретного приложения. Для осуществления такой оценки используется ряд четко определенных процедур в последовательном порядке .





С целью облегчения сравнения важно, чтобы результаты в отчетах информации о качестве дан­ ных были выражены в сопоставимом виде, а также чтобы было общее понимание использованных мер качества данных. Эти меры качества обеспечивают дескрипторы качества пространственных данных путем сравнения с данными предметной области. Использование несовместимых мер делает сравне­ ние качества данных невозможным. Настоящий стандарт устанавливает требования к компонентам и структуре мер качества данных и определяет общие базовые меры качества данных .

В настоящем стандарте отмечается, что мнение производителя и мнение пользователя о каче­ стве данных могут не совпадать. Уровень соответствия качеству может быть установлен с помощью спецификации на продукт производителя данных или требований к качеству пользователя данных .

Если пользователю данных требуется больше информации о качестве данных, чем предусмотрено их производителем, то пользователь данных может ознакомиться с ходом процесса оценки качества данных у производителя, чтобы получить дополнительную информацию. В этом случае требования пользователя данных рассматриваются как спецификация продукта с целью использования в процессе производства данных .

Цель настоящего стандарта — установить принципы описания качества пространственных дан­ ных и концепций обработки информации о качестве пространственных данных, а также последователь­ ные и стандартные методы определения и выдачи информации о качестве наборов данных. Задачей стандарта также является обеспечение руководящими принципами процедур оценки количественной информации о качестве пространственных данных .

Настоящий стандарт является модифицированным по отношению к международному стандар­ ту ИСО 19157:2013 «Географическая информация — Качество данных» (ISO 19157:2013 «Geographic information — Data quality»). В настоящий стандарт внесены изменения, необходимые для приведения его в соответствие современным международным и национальным стандартам, в частности изменен раздел нормативных ссылок, уточнена библиография, в тексте стандарта приведены ссылки на нацио­ нальные стандарты .

–  –  –

1 Область применения Настоящий стандарт устанавливает принципы описания качества пространственных данных, в том числе:

- определяет компоненты для описания качества данных;

- устанавливает компоненты и структуру содержания реестра для мер качества данных;

- описывает общие процедуры оценки качества пространственных данных;

- устанавливает принципы составления отчетности о качестве данных .

Настоящий стандарт также определяет меры качества данных для использования при оценке и составлении отчетности об их качестве. Он предназначен для разработчиков данных, обеспечивающих информацию о качестве, для описания и оценки того, насколько набор данных соответствует специфи­ кации продукта, а также для пользователей данных, пытающихся определить, обладают ли конкретные пространственные данные достаточным качеством, необходимым для их частного применения .

Настоящий стандарт не преследует цель определения минимально приемлемых уровней каче­ ства пространственных данных .

2 Соответствие Любой продукт, заявляющий о соответствии настоящему стандарту, должен отвечать всем требо­ ваниям, описанным в комплексе проверок, который приведен в приложении А, а именно:

- процесс оценки качества данных должен пройти проверку, изложенную в разделе А.1 приложе­ ния А;

- метаданные о качестве данных должны пройти проверку, изложенную в разделах А.2 и А.З при­ ложения А;

- независимый отчет о качестве должен пройти проверку, изложенную в разделе А.4 приложе­ ния А;

- меры качества данных должны пройти проверку, изложенную в разделе А.5 приложения А .

3 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ Р 50779.72— 99 Статистические методы. Процедуры выборочного контроля по альтер­ нативному признаку. Часть 2. Планы выборочного контроля отдельных партий на основе предель­ ного качества LC ГОСТ Р 57668—2017 Пространственные данные. Метаданные. Часть 1. Основные положения ГОСТ Р 57656—2017 Пространственные данные. Метаданные. Часть 2. Расширения для изобра­ жений и матричных данных ГОСТ Р 57657—2017 Пространственные данные. Спецификация информационного продукта ГОСТ Р ИСО 2859-3—2009 Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 3. Контроль с пропуском партий

Издание официальное ГОСТ Р 57773— 2017

ГО С Т Р ИСО 3951-1— 2015 Стат ист ические методы. Процедуры выборочного конт роля по ко­ личест венном у признаку. Часть 1. Требования к одност упенчат ым планам на основе AQ L при кон­ троле последоват ельных парт ий по единст венной характ ерист ике и единст венной AQL П р и м е ч а н и е — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю «Национальные стандарты», который опубликован по состоянию на 1 января текущего года, и по выпускам еже­ месячно издаваемого информационного указателя «Национальные стандарты» за текущий год. Если заменен ссы­ лочный документ, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого документа с учетом всех внесенных в данную версию изменений .

Если заменен ссылочный документ, на который дана датированная ссылка, то рекомендуется использовать версию этого документа с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный документ, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это по­ ложение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку .

4 Термины и определения

4.1 точность (accuracy): Степень соответствия результата проверки или измерений принятому истинному значению .

П р и м е ч а н и е — В настоящем стандарте истинным значением может выступать эталонное значение, принятое за истинное .

4.2 каталог (catalogue): Набор элементов (4.18) либо электронный или бумажный документ, кото­ рый содержит инф ормацию о наборе элементов .

4.3 соответствие (conform ance): Выполнение заданны х требований .

4.4 уровень соответствия качества (conform ance quality level): Пороговое значение или набор пороговых значений для результирующих оценок качества данны х (4.21), по которым определяют сте­ пень соответствия набора данны х (4.8) специф икации инф ормационного продукта (4.6) или потребно­ стям пользователя .

4.5 корректность (correctness): Соответствие предметной области (4.24) .

4.6 спецификация информационного продукта (data product specification): Детальное описа­ ние набора данны х (4.8) или ряда наборов данных, а также дополнительная инф ормация, которая обе­ спечивает его (их) создание, поставку и использование другой стороной .

4.7 базовая мера качества данных (data quality basic measure): Универсальная мера качества данны х (4.21), используемая как основа для специализированных мер качества данных .

П р и м е ч а н и е — Базовые меры качества данных — абстрактные типы данных. Непосредственное их ис­ пользование при составлении отчета о качестве данных не представляется возможным .

4.8 набор данных (dataset): Идентиф ицируемая совокупность данных .

П р и м е ч а н и е — Набором данных может быть также малая группа данных, которая, хотя и имеет неко­ торые ограничения в виде пространственной протяженности или типа объекта (4.15), физически расположена в пределах более крупного набора данных. Теоретически набором данных могут быть отдельный объект (4.11) или атрибут объекта (4.12), расположенные в пределах большого набора данных. Печатная копия топографической или морской карты может рассматриваться как набор данных .

4.9 комплект наборов данных (dataset series): Совокупность наборов данны х (4.8), обладаю щ их одинаковыми характеристиками .

4.10 метод прямой оценки (direct evaluation method): Метод оценки качества (4.21) набора дан­ ных (4.8), основанный на проверке элементов (4.18) набора данных .

4.11 пространственный объект, объект (feature): Абстракция явления реального мира .

П р и м е ч а н и е — Объект может быть представлен как тип или экземпляр. Тип объекта (4.15) или экземп­ ляр объекта (4.13) используются в зависимости от назначения .

4.12 атрибут пространственного объекта (feature attribute): Характеристика объекта (4.11) .

П р и м е ч а н и е — Атрибут объекта имеет имя, характеризуется определенным типом данных и имеет об­ ласть допустимых значений. Атрибут экземпляра объекта (4.13) также имеет значение атрибута, принадлежащее области допустимых значений .

4.13 экземпляр объекта (feature instance): Объект данного типа (4.15), имеющий определенные значения атрибутов объекта (4.12) .

ГОСТ Р 57773—2017

4.14 операция с объектом (feature operation): Операция, которую может выполнить любой экзем­ пляр некоторого типа пространственного объекта .

4.15 тип объекта (feature type): Класс объектов (4.11), имеющих общие характеристики .

4.16 пространственные данные (spatial data): Данные о пространственных объектах, вклю­ чающие сведения об их форме, местоположении и свойствах, в том числе представленные с исполь­ зованием координат .

4.17 метод косвенной оценки (indirect evaluation method): Метод оценки качества (4.21) набора данных (4.8), основанный на дополнительных знаниях .

Примечание — Примером дополнительных знаний служит происхождение набора данных, таких как метод производства или исходные данные .

4.18 элемент (item): То, что может быть описано и рассмотрено отдельно .

Пр и м е ч а н и е — Элемент может являться любой частью набора данных (4.8), такой как объект (4.11), от­ ношения объектов, атрибут объекта (4.12) или их комбинация .

4.19 метаданные (metadata): Данные о данных .

4.20 метакачество (metaquality): Информация, описывающая качество (4.21) оценки качества данных .

4.21 качество (quality): Степень соответствия совокупности собственных характеристик заявлен­ ным требованиям .

4.22 реестр (register): Набор файлов, содержащий идентификаторы элементов (4.18) с описани­ ем соответствующих элементов .

4.23 самостоятельный отчет о качестве (standalone quality report): Свободный текстовый до­ кумент, содержащий подробную информацию о примененных методах оценки качества данных (4.21), результатах и мерах .

4.24 предметная область (universe of discourse): Отображение реального или гипотетического мира, которое включает все, что представляет интерес .

–  –  –

6 Обзор качества данных

Работа с качеством данных включает:

- изучение концепций качества в отношении пространственных данных. В приложении В пред­ ставлено описание концепций качества данных, применяемых при определении компонентов для опи­ сания качества пространственных данных;

ГОСТ Р 57773— 2017

–  –  –

Компоненты качества данных описаны в разделе 7. На рисунке 2 представлен обзор компонен­ тов и связей между ними. Подробнее о компонентах и их атрибутах см. в словаре данных в прило­ жении С .

–  –  –

Для описания качества пространственных данных могут рассматриваться различные элементы качества и различные поднаборы данных, с целью описания которых используются единицы качества данных. Единица качества данных — это совокупность области определения и элементов качества данных (см. рисунок 3) .

ГОСТ Р 57773— 2017

–  –  –

Область определения единиц(ы) качества данных задает протяженность, пространственные, и/или временные, и/или общие характеристики, идентифицирующие данные, качество которых должно быть оценено .

Одна область определения качества данных должна быть предусмотрена для каждой единицы качества данных. Один отчет о качестве данных (метаданные или самостоятельный отчет по оценке качества) может включать несколько единиц качества данных, так как часто области для отдельных элементов качества данных различны. Эти различные области могут быть, например, пространственно разделены, перекрываться или даже совпадать .

Ниже приведены примеры того, что определяет область определения качества данных (см. также

MD_Scope в ГОСТ Р 57656):

а) комплект наборов данных;

б) набор данных;

в) поднабор данных, определяемый одной или несколькими из следующих характеристик:

1) типы элементов (наборы типов объектов, атрибутов объектов, операций с объектами или от­ ношений объектов);

2) конкретные элементы (наборы экземпляров объектов, значения атрибутов или экземпляры от­ ношений объектов);

3) географическая протяженность;

4) временная протяженность (заданные временные рамки и точность временных рамок) .

7.3 Элементы качества д а н н ы х (data q uality elements) 7.3.1 Общие положения Элемент качества данных — это компонент, описывающий определенный аспект качества про­ странственных данных, организованный по различным категориям. Данные категории представлены на рисунке 4 .

Рисунок 4 — Обзор элементов качества данных ГОСТ Р 57773— 2017 7.3.2 Полнота (completeness) Полнота определяется наличием и отсутствием объектов, их атрибутов и отношений.

Она состоит из двух элементов качества данных:

- присутствие (commission): избыточность данных в наборе данных;

- отсутствие (omission): отсутствие данных в наборе данных .

7.3.3 Логическая согласованность (logical consistency) Под логической согласованностью понимают степень соответствия логических правил структуры данных, атрибутов и отношений (структура данных может быть концептуальной, логической или фи­ зической). Если эти логические правила документально оформлены в другом источнике (например, в спецификации на информационный продукт), то необходимо ссылаться на этот источник (например, при оценке качества данных). Логическая согласованность состоит из четырех элементов качества данных:

- концептуальная согласованность (conceptual consistency): соответствие правилам концептуаль­ ной схемы;

- доменная согласованность (domain consistency): соответствие значений атрибутов области до­ пустимых значений;

- согласованность по формату (format consistency): степень, с которой данные хранятся в соот­ ветствии с физической структурой набора данных;

- топологическая согласованность (topological consistency): корректность представления закоди­ рованных топологических характеристик набора данных .

7.3.4 Позиционная точность (positional accuracy) Под позиционной точностью понимают точность положения объектов внутри пространственной системы координат. Она состоит из трех элементов качества:

- абсолютная или внешняя точность (absolute or external accuracy): степень соответствия заяв­ ленных значений координат значениям координат, принятым в качестве правильных или являющимся правильными;

- относительная или внутренняя точность (relative or internal accuracy): степень соответствия от­ носительного положения объектов в наборе данных их соответствующим исходным положениям, при­ нятым в качестве правильных или являющимся правильными;

- позиционная точность матричных данных (gridded data positional accuracy): соответствие зна­ чений пространственного позиционирования матричных данных значениям, принятым в качестве пра­ вильных или являющимся правильными .

7.3.5 Тематическая точность (thematic accuracy) Под тематической точностью понимают точность количественных атрибутов и корректность не­ количественных атрибутов, классификаций объектов и их отношений. Она состоит из трех элементов качества:

- правильность классификации (classification correctness): соответствие классов объектов или их атрибутов предметной области (например, реальной ситуации или эталонному набору данных);

- правильность неколичественных атрибутов (non-quantitative attribute correctness): определение, является ли неколичественный атрибут правильным или неправильным;

- точность количественных атрибутов (quantitative attribute accuracy): степень соответствия зна­ чения количественного атрибута значению, принятому в качестве правильного или являющемуся пра­ вильным .

7.3.6 Временное качество (temporal quality) Под временным качеством понимают качество временных атрибутов и временных отношений объектов. Оно состоит из трех элементов качества:

- точность измерения времени (accuracy of a time measurement): степень соответствия заявленных временных измерений значениям, принятым в качестве правильных или являющимся правильными;

- согласованность по времени (temporal consistency): правильность временного порядка событий;



- временная достоверность (temporal validity): достоверность данных по отношению ко времени .

П р и м е ч а н и е — В качестве измерения времени может выступать определенный момент времени или период .

Пример 33 марта — пример неверных данных .

— 7.3.7 Элемент применимости (usability element) Применимость основана на требованиях пользователя. Все элементы качества могут быть ис­ пользованы для оценки применимости. Оценка применимости может основываться на конкретных ГОСТ Р 57773— 2017 требованиях пользователей, которые не могут быть описаны с использованием элементов качества, описанных выше. В этом случае должен использоваться элемент применимости с целью предоставле­ ния конкретной информации о качестве в отношении пригодности определенного набора данных для конкретного приложения или удовлетворения набору требований .

При использовании элемента применимости рекомендуется использовать все приемлемые де­ скрипторы элементов качества (см. 7.4) и определять меры качества в соответствии с разделом 8 или приложением D в целях предоставления детальной информации по оценке .

П р и м е р — С помощью данного элемента производитель данных может продемонстрировать, насколько набор данных пригоден для различных указанных способов использования. Данный элемент может быть применен для подтверждения соответствия набора данных конкретной спецификации .

7.4 Д е скр и п то р ы элем ентов качества (d e s c rip to rs o f data q u a lity elem ents) 7.4.1 Общие полож ения

Оценка элемента качества данных осуществляется с помощью:

- меры (measure): тип оценки;

- метода оценки (evaluation method): процедура, используемая для оценки меры;

- результата (result): итог оценки .

Данные дескрипторы представлены на рисунке 5 и описаны в 7.4.2, 7.4.3 и 7.4.4 .

Рисунок 5 — Дескрипторы элементов качества

7.4.2 Мера (m easure) Элемент качества данных должен ссылаться только на одну меру посредством ссылки (см. ри­ сунок 6), указывая идентификатор меры, полностью описанный в другом месте (DQM_Measure .

measureldentifier, см. 8.6.1), и/или указывая имя и краткое описание меры .

П р и м е ч а н и е — Полное описание можно найти в реестре или каталоге мер, которые могут образовывать часть спецификации информационного продукта или самостоятельного отчета по качеству .

–  –  –

Меры качества данных более подробно описаны в разделе 8 настоящего стандарта. В приложе­ нии D приведен список стандартизированных мер качества данных .

П р и м е р — Процент значений атрибутов, которые являются верными .

Настоящий стандарт устанавливает, что для измерения качества набора данных используются различные методы. Одной меры качества данных может быть недостаточно для полной оценки каче­ ства данных, задаваемых областью определения качества данных, а также для предоставления мер ка­ чества для всевозможных вариантов использования набора данных. Комбинация мер качества данных может давать полезную информацию. Несколько мер качества данных могут быть описаны для данных, заданных одной областью определения качества данных. В этом случае отчет о качестве данных дол­ жен включать один экземпляр DQ_Element для каждой примененной меры .

7.4.3 М етод оценки (eva lu a tion m ethod) Метод оценки качества данных описывает те процедуры и методы, которые применяются к про­ странственным данным для получения результата оценки качества данных (см. рисунок 7). Для различ­ ных элементов качества данных часто используются различные методы оценки .

Для каждой примененной меры качества должен быть включен метод оценки качества. Метод оценки качества данных используется для описания методологии, используемой для применения меры качества данных для данных, задаваемых некоторой областью их определения, или для описания до­ кументации, в которой такая методология описывается .

П р и м е ч а н и е — Оценка качества данных подробнее описана в разделе 9 .

П р и м е р — Примерами такой документации являются спецификации на информационный про­ дукт, опубликованные статьи или утвержденные отраслевые стандарты .

Для каждой оценки следует указывать дату или диапазон дат. Если оценка проводилась в непо­ следовательном временном порядке, то следует указывать каждую отдельную дату. Даты изложены в соответствии с требованиями [2] .

Рисунок 7 — Метод оценки качества данных

7.4.4 Результат (result) 7.4.4.1 Общие положения Для каждого элемента качества данных должно быть обеспечено не менее одной результирую­ щей оценки качества. Это может быть количественный результат, результат соответствия, описатель­ ный результат или результат покрытия (см. также рисунок 8) .

П р и м е ч а н и е — Для одного элемента качества данных могут применяться различные типы результатов .

Для различных частей набора данных качество часто различается. Поэтому несколько оценок могут быть применены для одного элемента качества данных для более полного и более детального описания количественной информации о качестве. Чтобы избежать повторных описаний мер и процеГОСТ Р 57773— 2017 <

Рисунок 8 — Результат оценки качества

дур оценки для нескольких экземпляров элемента качества данны х (DQ_Element), можно использовать несколько результатов с областью применения индивидуальных результатов .

Примечание — Результирующая область — это подгруппа области определения качества данных (см. 7.2) .

П р и м е р — Набор данных содержит объекты идентичного типа, положение кот орых было установлено с помощ ью отличающ ихся методов и с различной т очност ью определения местополо­ жения. Однако для всего набора данных применяются одни и те же процедура и мера оценки качества, которые дают различные результаты в зависимости от метода сбора данных. В этом случае может быт ь желательно иметь несколько результатов с отдельными результирующ ими областями (зона, охватываемая каждым методом сбора данных) и одной областью определения качества данных (набор данных) .

7.4.4.2 Количественный результат (quantitative result) Количественным результатом может быть одно или несколько значений, в зависимости от значе­ ний атрибутов valueType и valueStructure, определенных в описании применяемой меры .

Атрибут valueRecordType используется для описания того, как valueType и valueStructure, опреде­ ленные данной мерой, реализованы для получения значения количественного результата .

П р и м е ч а н и е — Атрибут valueRecordType принадлежит к типу RecordType, который является универ­ сальным типом данных согласно [3]. Его значение меняется в зависимости оттого, какое решение по реализации используется для получения количественного результата. Пример реализации XML для RecordType дан в [4] .

П р и м е р 1 — Использование XML: простой пример: value = 5, valueRecordType = geo: Integer, valueUnit = «metre.»

П р и м е р 2 — В рамках описания меры, valueType — целочисленная переменная, a valueStructure:

матрица ( п/ п). Значение атрибута количественного результата обеспечивает результат самой мат рицы в пределах числового кодирования, использующего определенный тип XML, называемый MatrixType (например). В XML атрибут valueRecordType обеспечивает описание типа MatrixType. Если применяется другая кодировка, то атрибут valueRecordType изменяется для обеспечения описания ГОСТ Р 57773—2017 типа Matrix в другой кодировке, и, соответственно, изменяется реализация вычисления значения атрибута, но само значение остается прежним .

Для каждого результата должна быть установлена отдельная единица значения в соответствую­ щ их случаях .

П р и м е р 3 — Возможные единицы расстояния: метр, сантиметр, миллиметр .

П р и м е р 4 — Мера «уровень избыточных элементов» (см. таблицу D.3) используется для оценки количества избыточных элементов в наборе данных по отношению к количеству элементов, которые должны быть представлены. Результат количественного значения имеет тип значения Real. В этом случае единица значения указывается в процентах, значение умножается на 100. В этом примере еди­ ницей значения является «процент», «%» .

7.4.4.3 Результат соответствия (conform ance result) Результат соответствия — это результат сравнения значения или набора значений, полученных в результате применения некоторой меры качества к данным, заданным областью определения каче­ ства, с учетом установленного приемлемого уровня соответствия качества .

Когда уровень соответствия качества определен, его сравнивают с полученным результатом с целью выявления того факта, что качество данны х удовлетворяет заданному уровню качества .

Результат соответствия может быть установлен для каждой меры. Уровень соответствия качества определяется в соответствующей документации, такой как специф икация к инф ормационному про­ дукту или специф икация требований, определенных пользователем. При определении соответствия необходимо ссылаться на соответствующ ую нормативно-техническую документацию и указывать при­ мененный уровень соответствия качества .

Для одной меры предусмотрено более одного результата соответствия качества данных, если процедура оценки противоречит уровню соответствия, установленного в различных источниках .

7.4.4.4 Описательный результат (descriptive result) В некоторых случаях (например, при тем атических и геонаучных исследованиях) проведение ко­ личественной результирующей оценки для элемента качества данны х не представляется возможным .

Тогда субъективная оценка элемента может быть выражена в текстовом формате в качестве описа­ тельного результата качества данных .

П р и м е р — Относительная точность положения выше между геологическим объектом и со­ седним объектом на топографической карте (дороги, реки, озера и т. д.), чем абсолютная точность положения самого геологического объекта .

Данный описательный результат также может быть использован для проведения короткого син­ тетического описания результата оценки качества данных, сопровождения полного количественного результата или полной его замены в случае, если количественные значения не могут быть предостав­ лены .

7.4.4.5 Результат покрытия (coverage result) Результат покрытия — это результат оценки качества данных, ф ормализованных в виде покрытия .

Он описан в ГО С Т Р 57656 .

7.5 Элементы метакачества (metaquality elements) Элементы метакачества представляют собой набор количественных и качественных отчетных данны х об оценке качества и его результате. Знания о качестве и пригодности метода оценки, приме­ ненных мерах и данном результате могут иметь такое же значение, как и сам результат .

Пример оценки метакачества см. в Е.5.3 приложения Е .

М етакачество может быть описано с использованием следую щ их элементов, представленных на рисунке 9:

- достоверность (confidence): надежность результата качества данных .

П р и м е ч а н и е — Количественные показатели достоверности могут быть получены посредством ста­ тистических параметров, таких как стандартное отклонение или доверительный интервал с заданным уровнем достоверности .

П р и м е р — Достоверность зависит в первую очередь от используемого метода и его надежно­ сти, а также в меньшей мере от соответствующей генеральной совокупности;

ГОСТ Р 57773—2017

- репрезентативность (representativity): степень репрезентативности данны х в пределах области определения качества данны х в соответствии с результатом выборки .

П р и м е ч а н и е — Статистический метод, основанный на выборке, может считаться таким же надежным, как и глобальный метод, когда охвачены все географические зоны и рассматриваемые временные диапазоны, а ге­ неральная совокупность достаточно велика. Важен не только объем выборки, который имеет решающее значение, но и тот факт, насколько точно отражается текущее состояние данных. См. также 9.2.2 и приложение F;

- гомогенность (homogeneity): ожидаемая или тестируемая однородность результатов, получен­ ных для оценки качества данных .

П р и м е ч а н и е — Однородность заключается в сравнении результатов оценки нескольких сегментов глобального набора данных. Это сравнение может быть выражено, например, посредством среднеквадратиче­ ских ошибок. Гомогенность невозможно оценить в случае общего процесса, так как результат носит глобальный характер .

П р и м е ч а н и е — Такие тесты часто проводятся при сборе данных различными операторами в зависимо­ сти от зоны или времени сбора данных .

Рисунок 9 — Элементы метакачества

7.6 Дескрипторы элемента метакачества (descriptors of a metaquality element) Для описания элемента метакачества используются те же дескрипторы, что и для элемента ка­ чества [мера, метод оценки и результат (см. 7.4 и рисунок 10)]. Дополнительно должен применяться следующий дескриптор:

- связанный элемент качества .

Примечание — Связанный элемент качества — это элемент, к которому применяется элемент метакачества .

Пример оценки метакачества см. в Е.5.3 приложения Е .

–  –  –

8 Меры качества данных (data quality measures)

8.1 Общие положения Для облегчения сравнения набора данных необходимо, чтобы результаты в отчетах по качеству данных представлялись в сравнительном виде, а также чтобы имелось общее представление об ис­ пользованных мерах качества данных. Чтобы сделать оценки качества данных и отчеты о качестве данных (в виде метаданных или самостоятельного отчета по оценке качества) из различных источников сопоставимыми, должны использоваться по возможности стандартизированные меры качества дан­ ных, описанные в приложении D .

8.2 Стандартизированные меры качества данных

Перечень стандартизированных мер качества данных приведен в приложении D. Каждая мера качества данных этого списка содержит все необходимые компоненты, указанные в разделе 8. Для каждого элемента качества данных предусмотрено применение нескольких мер. Какие из них исполь­ зовать, зависит от типа данных и их предполагаемого назначения. Меры из этого перечня должны быть использованы в рамках реализации данного стандарта .

Любой реестр, установленный для управления стандартизированными мерами качества данных, приведен в [5] .

8.3 Создание определяемых пользователем мер качества данных

Вследствие природы качества и пространственных данных перечень стандартизированных мер качества данных не может быть полным. Возможны случаи, когда пользователь настоящего стандарта вынужден разрабатывать другие меры качества данных. По возможности эти меры должны быть опре­ делены с помощью базовых мер качества данных, описанных в приложении G, а сама мера — в соот­ ветствии со структурой, приведенной в разделе 8 .

8.4 Каталог мер качества данных

Для более полного описания мер, указанных в отчете по оценке качества данных, каталоги мер качества данных могут быть предоставлены совместно с метаданными или в онлайн-режиме .

Каталог может содержать набор мер, применяемых в одном или нескольких отчетах со всеми не­ обходимыми компонентами для мер качества данных, указанных в настоящем стандарте .

Каталог (как и реестр) позволяет пользователю описывать меру и хранить информацию для того, чтобы иметь возможность ссылаться на него при каждой необходимости, вместо повторного описания меры в отчете по качеству данных .

Приложение Н описывает структуру каталога мер. В [4] представлен XML-механизм для ассоции­ рования каталога с набором метаданных .

8.5 Список компонентов

Каждая мера качества данных описывается следующими компонентами:

- идентификатор меры (8.6.1);

- название (8.6.2);

- краткое название (8.6.3);

- название элемента (8.6.4);

- базовая мера (8.6.5);

- определение (8.6.6);

- описание (8.6.7);

- параметр (8.6.8);

- тип значения (8.6.9);

- структура значения (8.6.10);

- ссылка на источник (8.6.11);

- пример (8.6.12) .

На рисунке 11 представлены компоненты меры качества данных .

8.6 Подробное описание компонентов 8.6.1 Идентификатор меры (measure identifier) Идентификатор — это значение, уникально идентифицирующее меру в пространстве имен .

П р и м е ч а н и е — Данный идентификатор устанавливает ссылки на меру качества данных в элементах качества данных (см. 7.4.2) .

8.6.2 Название (name) Название — это название меры .

П р и м е ч а н и е — Если мера уже имеет общепринятое название, то должно использоваться это название .

Если же такого названия не существует, то следует выбрать такое название, которое отражает характер этой меры .

8.6.3 Условное название (alias) Условное название — это другое отличительное наименование для той же меры качества данных .

Им может быть иное общепринятое наименование либо аббревиатура или же краткое имя. Возможно использование более одного условного названия .

8.6.4 Название элемента (element name) Название элемента — это название элемента качества данных (см. 7.3 и 7.5), к которым применя­ ется некая мера. Возможно использование более одного имени элемента .

8.6.5 Базовая мера (basic measure) Если какая-либо мера основана на одной из базовых мер, то она должна быть описана его име­ нем, определением и типом значения. Базовые меры идентифицируются по своим именам .

Множество мер основано на подсчете ошибочных элементов. Существуют также некоторые меры, связанные с неопределенностью числовых значений. Для того чтобы избежать повторений, наиболее ГОСТ Р 57773—2017 распространенные методы построения расчетных мер, а также общие статистические показатели для одно- и двумерных случайных величин должны быть установлены в виде базовых мер .

При необходимости создания новых мер необходимо также использовать базовые меры. Напри­ мер, для выдачи информации по незамкнутой мозаичной поверхности или других мер в зависимости от приложения .

П р и м е ч а н и е — В приложении G приведены базовые меры .

8.6.6 Определение (definition) Определение является фундаментальным понятием меры .

П р и м е ч а н и е — Если мера является производной от базовой меры, то такое определение основывается на определении базовой меры и специфицируется для этой меры .

8.6.7 Описание (description) Описание — это описание меры, включающее методы подсчета с учетом всех формул и/или ил­ люстрации, необходимые для получения результата применения этой меры .

Если мера использует концепцию ошибок, то должно быть указано, каким образом элемент клас­ сифицируется как некорректный. В этом случае качество может быть описано только как корректное или некорректное .

8.6.8 Параметр (parameter) Параметр — это вспомогательная переменная, используемая мерой. Она должна включать в себя имя, определение и тип значения. Может использоваться более одного параметра .

П р и м е ч а н и е — Пример параметра см. в таблице D.66 приложения D .

8.6.9 Тип значения (value type) Тип значения — это тип данных, используемый для представления результата меры. Должны ис­ пользоваться типы данных, определенные в [3] .

8.6.10 Структура значения (value structure) Результат может состоять из множества значений. В таких случаях результат должен быть струк­ турирован с использованием структуры значения, как указано в С.3.3 приложения С .

8.6.11 Ссылка на источник (source reference) Ссылка на источник — это ссылка на документацию с описанием меры .

Когда мера, для которой предоставляется дополнительная информация из внешнего источника, добавляется в перечень стандартизированных мер, то здесь может быть указана ссылка на этот ис­ точник .

8.6.12 Пример (example) Пр и м ер — это пример применения меры или результата, полученного при использовании этой меры. Может быть приведено более одного примера .

9 Оценка качества данных (data quality evaluation)

9.1 Процесс оценки качества данных 9.1.1 Введение Процессы оценки качества используются на различных фазах жизненного цикла продукта, при этом в каждой фазе их задачи различаются. Здесь рассматриваются следующие фазы жизненного цик­ ла: спецификация, производство, поставка, использование и обновление .

Процесс оценки качества данных представляет собой последовательность этапов для получения результата качества данных .

9.1.2 Последовательность выполнения процесса Процесс оценки качества представляет собой последовательность шагов, выполняемых для полу­ чения результата оценки качества. Рисунок 12 иллюстрирует возможную последовательность действий для оценки качества данных. См. также приложение Е, в котором дано описание концепции оценки и составления отчетности по качеству данных .

Когда оцениваемые пространственные данные неоднородны и разные части имеют разное каче­ ство, то тесты должны быть выполнены соответственно для различных частей .

ГОСТ Р 57773— 2017

–  –  –

Оценка метакачества может осуществляться после получения итога оценки качества. Последова­ тельность, описанная выше, также применима к оценке метакачества с учетом следующих этапов про­ цесса: указать элемент метакачества и оценку качества, для которых оценивается метакачество, затем указать меру и метод оценки и определить итог оценки метакачества .

ГОСТ Р 57773— 2017

9.2 М етоды оценки качества д а н н ы х (data q u a lity evalua tion m ethods) 9.2.1 Классиф икац ия м етодов оценки качества д а н н ы х Процедура оценки качества данных включает один или более методов оценки качества данных .

Методы оценки качества данных можно разделить на два основных класса: прямая (direct) оценка и косвенная (indirect) оценка. Методы прямой оценки определяют качество данных путем сравнения данных с внутренней и/или внешней информацией. Методы косвенной оценки выводят или оценива­ ют качество данных, используя информацию о данных, такую как происхождение. Применение ме­ тодов прямой оценки предпочтительнее косвенной оценки. Методы прямой оценки, в свою очередь, классифицируются по источнику информации, необходимой для выполнения оценки внутренней или внешней .

На рисунке 13 представлены классы описываемых методов оценки .

П р и м е ч а н и е — Происхождение описано в ГОСТ Р 57668 .

Рисунок 13 — Методы оценки качества данных

9.2.2 Прямая оценка (d ire ct evaluation) Метод прямой оценки — это метод оценки качества набора данных, основанный на проверке эле­ ментов в наборе данных .

Методы прямой оценки могут быть классифицированы на внутренние и внешние. Внутренняя прямая (internal direct) оценка качества данных использует только те данные, которые содержатся в оцениваемом наборе данных. Внешняя прямая (external direct) оценка качества требует применения эталонных данных, внешних по отношению к тестируемому набору данных .

П р и м е ч а н и е — Эталонные данные — это данные, принятые как представляющие предметную область .

Как для внешних, так и для внутренних методов оценки может использоваться один из следующих методов проверки:

- полный контроль (full inspection);

- выборочный контроль (sampling) .

При полном контроле тестируется каждый элемент в генеральной совокупности, определенной областью качества данных .

П р и м е ч а н и е — Полный контроль больше всего подходит для небольших генеральных совокупностей или для тестов, которые могут быть выполнены в автоматическом режиме .

ГОСТ Р 57773—2017 Выборочный контроль выполняется для проверки поднаборов пространственных данных, задан­ ных областью качества данных .

П р и м е ч а н и е — Примеры методов выборочной оценки даны в приложении F .

9.2.3 Косвенная оценка (indirect evaluation) Метод косвенной оценки — это метод оценки качества набора данны х на основе внеш них знаний или накопленного опыта работы с инф ормационным продуктом и может быть субъективным .

Эти внешние знания могут включать (но не ограничиваться ими) неколичественную инф ормацию по качеству, такую как использование, происхождение и назначение (см. ГО С Т Р 57668) или другую отчетную инф ормацию о качестве набора данны х или данных, использованных для набора данных .

Качество данны х может быть оценено, например, на основе знаний об источнике, инструментах и ме­ тодах, использованных для сбора данны х и оцененных по отношению к процедурам и специф икациям, разработанным для этого продукта. Косвенная оценка качества данны х также может быть основана только на опыте. Если указывается, что выполнена косвенная оценка, то должно быть указано также, как эта оценка была осуществлена .

В некоторых случаях может быть затруднительно или даже невозможно описать косвенно оценен­ ное качество данны х в виде количественного результата. В таких случаях качество данны х может быть описано в текстовой форме с использованием описательного результата (см. 7 А Л Л ) .

9.3 Обобщение и преобразование (aggregation and derivation) Дополнительные результаты можно получить посредством обобщ ения или преобразования су­ щ ествующ их результатов без проведения новой оценки качества данных .

О бобщ ение объединяет результаты качества из проведенны х оценок качества данных, осно­ ванны х на различны х элементах качества д а н н ы х или различны х областях определения качества данных .

Дополнительные результаты также могут быть выведены из сущ ествующ их результатов, напри­ мер, когда результат соответствия получен путем сравнения количественного результата с уровнем соответствия. Это полезно, например, если результат выражен не уровнем соответствия .

Примечания 1 Обобщение может быть применено для обобщения результатов различных элементов качества с целью описания их соответствия спецификации информационного продукта .

2 Подробнее об обобщении см. в приложении J. Как излагать информацию по обобщению, описано в 10.2.1 и приложении Е .

3 Как излагать информацию по преобразованию, описано в 10.2.2 и приложении Е .

П р и м е р — Если уровень достоверности результата равен 95% и уровень достоверности уров­ ня соответствия 99 %, то результат может быть пересчитан, чтобы иметь такой же уровень до­ стоверности уровня соответствия .

10 Отчетность о качестве данных (data quality reporting)

10.1 Общие положения Качество данны х должно быть представлено в виде метаданных в соответствии с разделом 7, раз­ делом 10, приложением С, а также ГО СТ Р 57668 и ГО СТ Р 57656 .

С целью предоставления более подробной информации, помимо метаданных, может быть до­ полнительно создан самостоятельный отчет по оценке качества. Его структура определяется в сво­ бодной форме. Однако самостоятельный отчет по оценке качества не должен подменять метаданные .

Метаданные должны содержать ссылку на самостоятельный отчет по оценке качества, если таковой имеется (см. рисунок 14) .

–  –  –

10.2 Ч астны е случаи 10.2.1 О тчетность по обоб щ ен ию (обобщ енны е результаты ) При обобщении результатов должен предоставляться самостоятельный отчет о качестве (standalone quality report) для дополнения информации, представленной в метаданных. В рамках этого самостоя­ тельного отчета о качестве должна быть представлена детальная информация по исходному результату с мерой (мерами) и процедурой (процедурами) оценки, обобщенному результату и методу обобщения .

В метаданных:

- когда несколько показателей качества одного элемента качества объединяются в один пока­ затель этого элемента, то этот показатель должен быть представлен в метаданных в виде результата этого элемента качества данных. Примеры представлены в Е.4.1.2 и Е.4.1.3 приложения Е .

- когда несколько показателей качества различных элементов объединяются в один показатель, то это должно быть отражено в метаданных в виде результата элемента применения (DQ_UsabilityElement) .

Пример представлен в Е.4.1.4 приложения Е .

В обоих случаях в метаданных должна даваться по крайней мере ссылка на первоначальный ре­ зультат проверки качества данных, также может быть представлена информация о мере обобщения и методе обобщения .

10.2.2 О тчетность по пр ео бр азо ва нию (пр о и зво д н ы е результаты ) Когда только производные результаты представляются в метаданных, то необходимо сгенериро­ вать самостоятельный отчет по оценке качества, чтобы предоставить исходные результаты по качеству данных, из которых был получен производный результат. В метаданные должна быть включена ссылка на самостоятельный отчет по оценке качества и исходный результат качества данных .

П р и м е р — Результат соответствия часто является производным из количественного ре­ зультата. Если в метаданных указывается только результат соответствия, то тогда количествен­ ные результаты должны быть представлены в самостоятельном отчете по оценке качества .

10.2.3 С сы лка на результат пр ове р ки качества и с х о д н ы х д а н н ы х Когда производный или обобщенный результат(ы) представляются в метаданных, то ссылка на пер­ воначальный результат проверки качества данных может быть дана с использованием двух атрибутов:

- атрибут derivedElement ссылается на элемент качества [и его результат(ы)], описанные в мета­ данных;

- атрибут standaloneQualityReportDetails ссылается на часть самостоятельного отчета о качестве, где описан исходный результат(ы) .

ГОСТ Р 57773— 2017

–  –  –

А.1 Наименование проверки: Процесс оценки качества

a) Цель проверки: убедиться в правильности процесса оценки качества данных .

b) Метод проверки: проверить, включает ли процесс оценки качества все пункты, указанные в 9.1.3.

Что предполагает:

1) определение положений спецификации на информационный продукт или требований пользователя, имеющих отношение к качеству данных, и их использование для идентификации применимых элементов качества данных и их соответствующей области. Сравнение применяемых элементов качества данных с оцениваемыми элементами качества данных для удостоверения в том, что все соответствующие элементы качества данных были идентифицированы и оценены по соответствующей области определения;

2) проверку того, что мера качества данных, применяемая для каждой оценки качества, уместна в соответ­ ствии с положениями спецификации на информационный продукт или требованиями пользователя;

3) проверка того, что процедура оценки качества, примененная для каждой оценки качества данных, умест­ на в соответствии с положениями спецификации информационного продукта или требованиями пользователя .

c) Ссылка: 9.1 .

d) Тип проверки: предварительная .

А.2 Наименование проверки: Метаданные о качестве данных

a) Цель проверки: убедиться в том, что метаданные о качестве данных моделируются в соответствии с мо­ делями UML и словарем данных .

b) Метод проверки: проверить, что метаданные содержат соответствующие компоненты качества данных и следуют правилам для каждого компонента .

c) Ссылка: раздел 7, раздел 10 и приложение С .

d) Тип проверки: предварительная .

А.З Наименование проверки: Соответствие метаданных

a) Цель проверки: убедиться в том, что метаданные о качестве данных представлены в соответствии с ГОСТ Р 57668 и ГОСТ Р 57656 .

b) Метод проверки: проверить тесты, представленные в ГОСТ Р 57668, в А.2.1, А.2.2, А.2.3, А.2.4, А.2.5 при­ ложения А .

c) Ссылка: ГОСТ Р 57668, в А.2.1, А.2.2, А.2.3, А.2.4, А.2.5 приложения А .

d) Тип проверки: предварительная .

А.4 Наименование проверки: Независимый отчет по оценке качества

a) Цель проверки: убедиться в том, что самостоятельный отчет по оценке качества включает в себя разделы по всем соответствующим аспектам качества и что описание всех компонентов качества данных следует прави­ лам, определенным в настоящем стандарте .

b) Метод проверки: проверить, содержит ли самостоятельный отчет по оценке качества все соответствую­ щие компоненты .

c) Ссылка: раздел 7 и раздел 10 .

d) Тип проверки: предварительная .

А.5 Наименование проверки: Меры качества данных

a) Цель проверки: убедиться в том, что мера качества данных структурно и семантически точно определена .

b) Метод проверки: проверить, описаны ли использованные меры качества, как это указано в разделе 8, и смоделированы ли в соответствии с моделью UML и словарем данных .

c) Ссылка: раздел 8 и приложение С .

d) Тип проверки: предварительная .

ГО С Т Р 5 7 7 7 3 — 2017

–  –  –

В.1 Ко нц ептуа льны е о сн о в ы качества д а н н ы х Набор данных может быть создан для конкретного приложения или для нескольких возможных приложений .

Качество набора данных может быть определено только при наличии информации об оценке элементов качества данных и в некоторых случаях косвенно — на основе неколичественной качественной информации по использо­ ванию, происхождению и назначению (см. ГОСТ Р 57668). Элементы качества данных оценивают расхождение между набором данных и предметной областью (т. е. правильным набором данных, который соответствует специ­ фикации продукта). Неколичественная информация о качестве предоставляет общую информацию, из которой можно получить связанные с качеством знания .

Концепции оценки качества данных предоставляют важную основу для разработчиков, а также пользова­ телей данных. Разработчик данных получает средства для проверки того, насколько набор данных отражает его предметную область согласно спецификации продукта. Пользователи данных могут оценить качество набора данных для удостоверения в том, что набор данных удовлетворяет требованиям пользовательского применения (см. рисунок В.1) .

Заявленные результаты качества являются действительными в отношении спецификации информационного продукта или требований пользователей. Если они изменились, то оценка качества должна быть повторена в от­ ношении измененной спецификации или требований. Следует проявлять осторожность при сравнении результатов качества там, где предметная область отличается. Типичным примером этого является преобразование модели в инфраструктурах пространственных данных или при генерализации. Например, при изменении геометрии типа объекта также изменяются результаты позиционной точности .

–  –  –

ГОСТ Р 57773— 2017 В.2 Структура наборов данных и компонентов для описания качества Набор данных может принадлежать комплекту наборов данных, что означает, что все наборы данных ком­ плекта основаны на одной и той же спецификации информационного продукта. Качество всех наборов данных, принадлежащих одному комплекту набора данных, может быть одинаковым .

Набор данных может рассматриваться как содержащий большое, хотя и конечное, число поднаборов дан­ ных. Поднаборы данных, объединенные принадлежностью к одному и тому же типу объекта, атрибуту объекта или отношению, критерию сбора или к одной и той же географической и временной протяженности, часто имеют оди­ наковое качество. Поднабор данных минимально может состоять из экземпляра объекта, значения атрибута или вида отношения .

Концепция оценки качества данных позволяет каждому экземпляру объекта, значению атрибута и виду отношения объекта иметь собственное качество. Качество поднабора данных в наборе данных может не совпадать с качеством остальной части набора данных, к которому они принадлежат. Концепции оценки качества данных допускают выдачу информации о качестве набора данных и, кроме того, другой информации о качестве поднабора данных, идентифицируя эти группы как данные, которые определяются спецификой области опреде­ ления качества данных. Информация о качестве, представленная для нескольких областей определения качества данных, меньше, чем та, что выводится для набора данных, но представляет более полную и подробную картину качества, чем общее качество полного набора данных .

П р и м е ч а н и е — Для разработчика данных спецификация информационного продукта описывает пред­ метную область и содержит правила для построения набора данных. Для пользователя данных требования опи­ сывают предметную область, которая может совпадать или не совпадать с предметной областью набора данных .

Качество набора данных определяется тем, насколько хорошо он представляет предметную область. Качество одного и того же набора данных может отличаться в зависимости от предметной области, относительно которой он оценивается .

Качество набора данных описывается элементами качества данных и их дескрипторами. Некоторая инфор­ мация, относящаяся к качеству, также может быть получена с помощью неколичественных элементов использова­ ния, происхождения и назначения .

Метакачество обеспечивает информацию по качеству в отношении оценки качества .

Элементы качества данных позволяют оценить, насколько набор данных соответствует критериям, изло­ женным в спецификации информационного продукта, или требованиям пользователя. Элементы качества данных оценивают различными способами и на различных этапах жизненного цикла набора данных. Концепция оценки качества данных подразумевает, что не все элементы качества данных применимы ко всем типам наборов данных .

Помимо этого некоторые элементы качества данных являются применимыми к большим наборам данных, в то вре­ мя как другие больше применимы к подмножеству данных в более крупном наборе данных. Некоторые элементы качества данных применимы как для единичных экземпляров данных, так и для большего количества, а некоторые применимы только для множества экземпляров .

Настоящий стандарт определяет элементы качества данных в первую очередь как средства идентифика­ ции и выдачи различных видов информации о качестве, также он подразумевает, что элементы качества данных часто взаимосвязаны. Например, ошибка в координатах может повлечь за собой по меньшей мере два типа оши­ бок — позиционную и топологическую (см. приложение I). Значение элементов качества данных с точки зрения продукта и способа, которым обрабатываются элементы качества данных, находится в компетенции оценщика качества .

В.З Когда применять процедуры оценки качества Процедуры оценки качества могут применяться на различных этапах жизненного цикла продукта.

Оценка качества может быть применена на следующих стадиях жизненного цикла продукта:

- разработка спецификации информационного продукта или требований пользователя: при разработке спецификации или определении требований пользователя процедуры оценки качества могут быть использо­ ваны для установления уровней соответствия качества, которым должен отвечать конечный продукт. Специ­ фикация информационного продукта или требования пользователя могут включать уровни соответствия ка­ чества для данных и процедуры оценки качества, которые должны применяться в процессе производства и обновления;

- контроль качества при создании набора данных: На стадии производства разработчик может применять процедуры оценки качества, которые явно установлены или же не включены в спецификацию информационного продукта, как часть процесса по контролю качества. Описание процедур оценки качества, применяемых для кон­ троля качества продукции, рекомендуется представлять как метаданные происхождения, включая, в частности, оценку качества применяемых процедур, установленные уровни качества соответствия и результаты;

- проверка на соответствие спецификации информационного продукта: по завершении производства про­ дукта рекомендуется использовать процесс оценки качества для формирования и представления результатов качества данных. По этим результатам можно определить, насколько набор данных соответствует или не соот­ ветствует спецификации информационного продукта. Если набор данных проходит проверку (состоящую из серии процедур оценки качества), то его считают готовым к использованию. Результаты по операции проверки следует ГОСТ Р 57773— 2017 выдавать в соответствии с разделом 10. Пример описания оценки и выдачи информации о качестве данных см. в приложении Е. Итогом проверки будет принятие либо непринятие набора данных. Если набор данных будет отклонен, то после исправления данных необходимо будет провести новую проверку, и так до тех пор, пока про­ дукт не будет соответствовать спецификации информационного продукта;

- оценка соответствия набора данных требованиям пользователя: процедуры оценки качества могут быть использованы для удостоверения в том, что набор данных отвечает уровням соответствия качества, установлен­ ным требованиями пользователя. При анализе соответствия набора данных требованиям пользователя могут при­ меняться как косвенные, так и прямые методы;

- контроль качества при обновлении набора данных: процедуры оценки качества применяются к операциям обновления набора данных как для используемых элементов обновления, так и для сравнения качества набора данных до и после обновления .

В.4 Выдача информации о качестве В.4.1 Зачем выдавать информацию о качестве

Необходимость выдавать информацию о качестве данных существует по ряду причин, включая следующие:

- способствовать обнаружению и поддерживать использование набора данных;

- показывать соответствие спецификации информационного продукта или требованиям пользователя;

- как часть инициатив менеджмента поставщика;

- уменьшить поток суждений о качестве информации, полученной из набора данных;

- обеспечить рациональное (оптимальное) принятие решения, когда известно, что все данные содержат дефекты .

В.4.2 Когда выдавать информацию о качестве Наборы данных постоянно создают, обновляют и объединяют, в результате чего качество или компонент качества набора данных может изменяться.

На информацию о качестве набора данных могут повлиять три условия:

- когда некоторый объем данных удаляется из набора данных, изменяется или добавляется к набору данных;

- когда изменяется спецификация набора данных или устанавливаются требования нового пользователя к качеству данных;

- когда изменяется реальный мир .

Первое условие — изменение набора данных — может происходить довольно часто. Многие наборы дан­ ных не являются статическими. Происходят увеличение обмена информацией, использование наборов данных в различных целях и обусловленное этим обновление и уточнение наборов данных для удовлетворения различных целей. Если информация о качестве некоторого набора данных изменяется в результате его модификации, то ка­ чество этого набора данных должно быть заново оценено и уточнено .

При создании набора данных необходимо обеспечить полное представление обо всех применяемых эле­ ментах качества данных. Первоначально могут сообщаться сведения об использовании набора данных его раз­ работчиком (в предположении, что разработчик данных действительно использует такой набор данных). В даль­ нейшем пользователи данных должны предоставлять информацию об использовании набора данных, если оно отличается от его прямого предназначения. Благодаря таким сообщениям появится возможность постоянного обновления этого описательного элемента качества данных для отражения в нем непредвиденных вариантов использования .

Второе условие — изменение спецификации набора данных — чаще всего происходит перед созданием исходного набора данных и выпуском информации о качестве. Вполне вероятно, что по мере использования не­ которого набора данных его спецификация будет обновляться для того, чтобы будущие изменения этого набора данных лучше отвечали фактическим потребностям. При изменении спецификации информационного продукта изменяется также и качество текущего набора данных. Информация о качестве набора данных всегда должна от­ ражать текущий набор данных с учетом текущей спецификации информационного продукта .

Третье условие — изменение реального мира — происходит постоянно. Изменения могут быть вызваны природными явлениями, такими как движения земной коры или эрозия почвы, но чаще всего они являются ре­ зультатом деятельности человека .

Изменения, как правило, наступают очень быстро и внезапно. По этой при­ чине время сбора данных, также как и время оценки качества, играют важную роль при оценке качества набора данных. В некоторых случаях даже скорость изменения данных представляет интерес. А в некоторых случаях интерес может также представлять и частота изменений набора данных. Тем не менее настоящий стандарт признает, что выпуск новой информации о качестве данных при каждых изменениях реального мира не пред­ ставляется возможным .

В.4.3 Как следует выдавать информацию о качестве В.4.3.1 Иерархический принцип

Данный стандарт устанавливает принцип иерархического уровня:

Качество данных, определяемое на верхнем уровне (например, комплект наборов данных), применимо и на более низком уровне (например, набор данных), см. таблицу В.1. Если качество данных отличается на верхнем и нижнем уровнях, то необходимо получить дополнительную информацию на более низком уровне .

Г О С Т Р 5 7 7 7 3 — 2017 Таблица В.1 — Иерархические уровни

–  –  –

П р и м е ч а н и е — Информация о качестве экземпляра объекта, атрибута объекта или отношений между объектами может быть выдана как атрибут этого экземпляра согласно [1] .

В.4.3.2 Метаданные и самостоятельный отчет по оценке качества В.4.3.2.1 Общие положения Информацию о качестве можно выпускать в виде метаданных и автономного отчета о качестве.

Эти два механизма дополняют друг друга, позволяя выдавать информацию об оценке качества данных с различными уров­ нями детализации:

- метаданные направлены на предоставление краткой, синтетической и общеструктурированной информа­ ции для обеспечения операционной совместимости метаданных и использования веб-сервисов;

- самостоятельный отчет по оценке качества может быть использован для получения более подробной ин­ формации об оценке качества данных. Он должен прилагаться к набору данных или продукту для возможности непосредственного ознакомления с ним .

Например, в случае обобщения различных результатов качества самостоятельный отчет по оценке качества обеспечит полную информацию по исходным результатам (с применимыми процедурами оценки и мерами), ре­ зультату обобщения и методу обобщения, в то время как метаданные могут только описать результат обобщения со ссылкой на исходные результаты, описанные в самостоятельном отчете по оценке качества .

В.4.3.2.2 Выдача информации о качестве в виде метаданных Класс MD_Metadata, согласно ГОСТ Р 57668, обобщает ноль, одну или несколько единиц качества данных (экземпляры класса DQ_DataQuality, согласно настоящему стандарту) (см. рисунок В.2) .

Рисунок В.2 — Информация о качестве данных

В.4.3.2.3 Выдача информации о качестве в самостоятельном отчете Стандартизация терминологии элементов качества данных и структуры представления основной ин­ формации о качестве данных обеспечивают лучшее понимание и сравнение результатов оценки качества .

В самостоятельный отчет по оценке качества следует включать область применения для однозначного опре­ деления пространственно-временной протяженности оцениваемого набора данных .

Каждый отчет должен содержать достаточный объем информации для полного описания соответствующих аспектов качества данных и их результатов. Описание может быть представлено в форме ссылки на документы, такие как спецификация информационного продукта или каталог мер .

Полная структура такого самостоятельного отчета по оценке качества не была стандартизирована, чтобы каждая конкретная организация смогла адаптировать его для своих собственных нужд, методик и процедур оцен­ ки. Он может представлять собой свободный текст Однако информация о качестве должна быть представлена в краткой, понятной и легкодоступной форме. Пример самостоятельного отчета по оценке качества приведен в при­ ложении Е .

ГОСТ Р 57773—2017

–  –  –

С.1 Обзор словаря данных С.1.1 Введение Словарь данных описывает характеристики модели качества данных, определенной в разделах 7,8,9 и 10. Сло­ варь состоит из таблиц с графами и строками в иерархии для установления отношений и организации информации .

Затемненные строки таблицы представляют классы. Незатемненные строки таблицы представляют атрибу­ ты класса и ассоциации. Классы и атрибуты классов в таблицах словаря данных определяются шестью графами таблицы, описанной в С. 1.2—С. 1.7 .

С.1.2 Имя/ролевое имя Имя роли — это условное обозначение, относящееся к классу или атрибуту класса. Имена классов начина­ ются с прописной буквы. Пробелы не используются в имени класса. Вместо этого несколько слов соединяются, и каждое новое подслово начинается с заглавной буквы (например: XnnnYmmm). Имена классов уникальны в пределах всего словаря данных настоящего стандарта. Имена атрибутов класса уникальны в пределах класса, а не всего словаря данных настоящего стандарта. Имена атрибутов класса устанавливаются уникальными в преде­ лах приложения посредством сочетания имени класса и имени атрибута класса. Ролевые имена используются для идентификации абстрактных моделей ассоциаций и начинаются с префикса «Role пате», чтобы отличить их от других атрибутов класса. Имена и имена ролей могут быть на любом другом языке, отличающемся от используе­ мого в настоящем стандарте .

С.1.3 Определение Определение — это описание класса или атрибута класса .

С.1.4 Признак обязательности С.1.4.1 Общие положения Признак обязательности — это дескриптор, указывающий, подлежит ли класс или атрибут класса обязатель­ ному документированию или указывается (т. е. содержит значения) только иногда. Этот дескриптор может иметь следующие значения: О (обязательный), У (условный) или Н (необязательный) .

С. 1.4.2 Обязательный (О) Признак «О» означает, что класс или атрибут класса должны быть указаны .

С. 1.4.3 Условный (У) Признак «У» определяет управляемое электронное условие, при котором хотя бы один класс, атрибут класса или ассоциация являются обязательными.

Признак «У» используется в следующих трех ситуациях:

- представление выбора между двумя или несколькими параметрами. По крайней мере один из параметров является обязательным и должен быть задокументирован;

- документирование класса, атрибута класса или ассоциации, если другой класс был задокументирован;

- документирование атрибута класса или ассоциации, если конкретное значение другого атрибута класса уже задокументировано. Для облегчения чтения лкадьми конкретное значение используется в обычном тексте .

Однако для проверки условия в электронном интерфейсе пользователя должен использоваться код .

Если ответ на условие положительный, то класс, атрибуты класса или ассоциация должны быть обязательными .

С. 1.4.4 Необязательный (Н) Признак «Н» означает, что класс, атрибут класса или ассоциация метаданных являются необязательными и могут как присутствовать, так и отсутствовать. В настоящем стандарте для обеспечения интероперабельности между пользователями пространственных данных и производителями определены необязательные классы мета­ данных и необязательные атрибуты метаданных. Если необязательный класс не используется, то элементы, со­ держащиеся в этом классе (включая обязательные элементы), тоже не используются .

Необязательные классы могут иметь обязательные элементы; эти элементы становятся обязательными, только если необязательный класс используется .

С.1.5 Максимум вхождений (МВ) Признак максимума вхождений определяет максимально допустимое количество экземпляров класса, атри­ бута класса или ассоциации. Единичное вхождение показано как «1»; повторяющееся, без ограничений, вхожде­ ние обозначено «N». Допускается фиксированное число вхождений, отличающееся от одного, которое будет обо­ значаться соответствующим числом (т. е. «2», «3» и т. д.) .

С.1.6 Тип данных Тип данных определяет множество различных значений для представления атрибутов класса: например, integer, real, string, DateTime и Boolean. Атрибут типа данных также используется для определения классов, стерео­ типов и ассоциаций классов .

П р и м е ч а н и е — Типы данных определены в [3] .

ГО С Т Р 57773— 2017 С.1.7 Область допустим ы х значений (домен) Для класса (затемненные строки) домен указывает номера строк, относящихся к атрибутам классов и ассо­ циациям этого класса .

Для атрибута класса или ассоциации домен определяет допустимые значения или использование произ­ вольного текста. Понятие «произвольный текст» (free text) означает, что никаких ограничений на содержание этого поля не накладывается. Целочисленные коды должны применяться для представления значений доменов, содер­ жащих кодовые списки .

С.2 Словарь данны х для пакетов качества данны х С.2.1 Качество данны х С.2.1.1 Общие положения Глобальная модель UML для всего пакета качества данных представлена на рисунке 2. Модель UML при­ ведена на рисунках 3 и 15 .

–  –  –

С.2.1.4 Информация об оценке качества данных Модель UML представлена на рисунках 7 и 13 .

Таблица С.4 — Информация об оценке качества данных

–  –  –

ГО С Т Р 57773— 2017 С.2.1.5 Результат оценки качества данных Модель UML представлена на рисунке 8 .

Таблица С.5 — Результат оценки качества данных

–  –  –

С.2.1.6 Информация о самостоятельном отчете по оценке качества Модель UML представлена на рисунке 14 .

Таблица С.6 — Информация о самостоятельном отчете по качеству

–  –  –

С.2.2 Мера качества д а н н ы х С.2.2.1 Общее представление Модель 1)М1_мер представлена на рисунке 11 .

С.2.2.2 Меры качества данных Модель UML представлена на рисунке 11 .

Таблица С.7 — Меры качества данных

–  –  –

С.2.2.6 Указатель источника меры качества данных Модель UML представлена на рисунке 11 .

Таблица С.11 — Указание источника меры качества данных

–  –  –

С.З Списки значений С.3.1 Введение Классы со стереотипом « C o d e L is t» представлены ниже. Они не содержат графы «признак обязательно­ сти», «максимум вхождений», «тип данных» и «домен» .

С.3.2 Тип метода для оценки Т а б л и ц а С.12 — Тип метода для оценки

–  –  –

D.1 Введение В данном приложении устанавливается и определяется перечень стандартизированных мер качества дан­ ных. Настоящее приложение определяет меры качества данных. С целью получения четко определенной и срав­ нимой информации о качестве настоятельно рекомендуется проводить оценку и отчетность по качеству данных с использованием таких мер качества .

D.2 Полнота D.2.1 Присутствие Меры качества данных для присутствия элементов качества данных представлены в таблицах D.1— D.4 .

Таблица D.1 — Избыточный элемент

–  –  –

D.2.2 Отсутствие Меры качества данных для элемента качества данных «отсутствие» представлены в таблицах D.5— D.7 .

Таблица D.5 — Отсутствующий элемент

–  –  –

D.3 Логическая согласованность D.3.1 Концептуальная согласованность Меры качества данных для подэлемента качества данных «концептуальная согласованность» даны в табли­ цах D.8— D.13 .

Таблица D.8 — Несогласованность с концептуальной схемой

–  –  –

ГОСТ Р 57773— 2017 Т а б л и ц а D.11 — Число неверных перекрытий поверхностей

–  –  –

D.3.2 Доменная согласованность Меры качества данных для подэлемента качества данных «доменная согласованность» представлены в таблицах D.14— D.18 .

Таблица D.14 — Несогласованность области значений

–  –  –

D.3.3 Согласованность по формату Меры качества данных для подэлемента качества данных «согласованность по формату» даны в таблицах D.19— D.21 .

Таблица D.19 — Конфликты физической структуры

–  –  –

D.3.4 Топологическая согласованность Меры качества данных в таблицах D.22— D.28 предназначены для проверки топологической согласован­ ности геометрических представлений объектов. Они не могут служить в качестве мер согласованности заданных описаний топологии с использованием топологических объектов, определенных в [7] .

Таблица D.22 — Количество некорректных соединений точки и кривой

–  –  –

D.4 Позиционная точность D.4.1 Абсолютная или внешняя точность D.4.1.1 Основные меры для позиционной неопределенности Основные меры качества данных для позиционной неопределенности для элемента качества «абсолютная/ внешняя точность» даны в таблицах D.29— D.34 .

Т а б л и ц а D.29 — Среднее значение позиционной неопределенности

–  –  –

D.4.1.2 Вертикальная позиционная неопределенность Измерения высоты представляют собой позиционные наблкадения в одном измерении, а значит, высоту мож­ но рассматривать как одномерную случайную величину. Поэтому меры качества данных для позиционной неопре­ деленности основаны на базовой мере качества данных «одномерная случайная величина» .

Меры качества данных для вертикальной позиционной неопределенности подэлемента качества данных «абсолютная/внешняя точность» представлены в таблицах D.35— D.43 .

ГО С Т Р 57773— 2017 Таблица D.35 — Линейное вероятное отклонение

–  –  –

D.4.1.3 Горизонтальная позиционная неопределенность Горизонтальные координаты точки определяются 20-координатами. Неопределенность координаты любой точки можно описать с помощью базовых мер качества данных для двухмерной случайной величины, описанной в G.3.3. Меры качества данных для горизонтальной позиционной неопределенности элемента качества данных «абсолютная/внешняя точность» представлены в таблицах D.44— D.53 .

ГО СТ Р 57773— 2017 Таблица D.44 — Стандартное круговое отклонение

–  –  –

2 Краткое название Стандартная круговая ошибка, точечная ошибка по Гельмерту, CSE 2 Краткое название Стандарт круговой картографической точности (CMAS) D.4.1.4 Относительная или внутренняя точность Данный элемент качества предусматривает использование тех же мер качества данных, что и элемент «аб­ солютная или внешняя точность». Разница заключается лишь в методе оценки .

Относительная точность между объектами может быть выражена с помощью мер качества данных «отно­ сительная вертикальная ошибка» и «относительная горизонтальная ошибка», которые представлены в таблицах D.54 и D.55 .

Таблица D.54 — Относительная вертикальная ошибка

–  –  –

D.4.2 Точность позиционирования данных относительно координатной сетки Для описания сеточных данных могут использоваться те же меры качества, что и для горизонтальной позициональной неопределенности в соответствии с D.4.1.3. Для описания групповых значений в растрах может при­ меняться точность количественных атрибутов в соответствии с D.6.3 .

D.5 Точность временных измерений Временные измерения можно рассматривать как одномерные случайные величины. Использование базовых мер качества данных согласно G.3.2 приводит к мерам качества данных в соответствии с таблицами D.56— D.61 .

Таблица D.56 — Временная точность при 68,3-процентном уровне значимости

–  –  –

D.5.1 Временная согласованность В таблице D.62 дана одна мера качества данных для подэлемента качества «временная согласованность» .

Таблица D.62 — Хронологическая последовательность

–  –  –

D.5.2 Временное соответствие Для описания временного соответствия можно использовать те же меры качества данных, что и для допу­ стимых значений атрибутов (см. меры качества данных в таблицах D.14— D.18 подэлемента качества «доменнная согласованность») .

D.6 Тематическая точность D.6.1 Корректность классификации Отнесение элемента к определенному классу может быть правильным либо неправильным. В табли­ цах D.63— D.67 дано несколько мер качества данных в зависимости от классифицируемого элемента .

Таблица D.63 — Количество некорректно классифицированных объектов

–  –  –

D.6.2 Корректность неколичественных атрибутов Меры качества данных для подэлемента качества «корректность неколичественных атрибутов» даны в таб­ лицах D.68— D.70 .

Таблица D.68 — Число некорректных значений атрибутов

–  –  –

D.6.3 Точность количественных атрибутов Меры качества данных для подэлемента качества «точность количественных атрибутов» представлены в таблицах D.71— D.76 .

Таблица D.71 — Неопределенность значения атрибута при 68,3-процентном уровне значимости

–  –  –

D.7 Меры обобщения В спецификации информационного продукта устанавливают некоторые требования к продукту для его со­ ответствия данной спецификации. В таблицах D.77— D.81 для этого элемента приведены меры качества данных .

Т а б л и ц а D.77 — Соответствие спецификации информационного продукта

–  –  –

Е.1 Введение В данном приложении приведен основной пример оценки и выдачи информации о качестве данных .

В разделе D.5 приложения D приведены дополнительные примеры выдачи информации в виде метаданных иного характера, таких как описательный результат, метакачество и оценка выборки .

Е. 2 Описание набора данных Е.2.1 Спецификация информационного продукта Е.2.1.1 Общие положения Для оценки качества данных применяют меры качества .

Спецификация информационного продукта, приведенная ниже, описывает область применения. Специфика­ ция определяет те объекты, атрибуты и отношения, которые считаются важными и должны содержаться в наборе данных .

П р и м е ч а н и е — Полное описание спецификации информационного продукта см. ГОСТ Р 57657 .

Данный продукт включает транспортную сеть (пути и дороги), здания (жилые и промышленные) и деревья .

Е.2.1.2 Типы объектов Каждый тип объекта, с пустым или непустым набором атрибутов, указан в таблице Е.1. После каждого имени атрибута следует тип значения (строка или целочисленная переменная), а также область допустимых значений .

Т а б л и ц а Е.1— Типы объектов

–  –  –

Е.2.1.3 Правила

Типы объектов в таблице Е.1 должны придерживаться следующих правил:

- деревья высотой менее 1 м не должны учитываться;

- атрибут «Условие» дороги может не иметь значения («неопределенное значение»);

- атрибуты «Имя» и «Количество жильцов» в доме могут не иметь значения («неопределенное значение») .

Е.2.1.4 Требования к качеству Общее требование к качеству должно быть совместимым с требованиями к качеству данных, набор данных должен отвечать всем нижеописанным требованиям к качеству данных .

а) В наборе данных могут присутствовать только те типы объектов и атрибуты, которые определены в дан­ ной спецификации к информационному продукту .

Транспортная сеть:

б) Максимально два объекта могут быть пропущены для каждого типа объекта .

в) Максимум два объекта могут быть в избытке для каждого типа объекта .

г) Максимальное число экземпляров объектов, которые могут быть неправильно классифицированы в каче­ стве другого типа объекта транспортной сети, — два; в качестве других типов объектов — ноль .

ГОСТ Р 57773— 2017

Здания:

д) Максимально два объекта могут быть пропущены для каждого типа объекта .

е) Максимальное число экземпляров объектов, которые могут быть неправильно классифицированы в каче­ стве остальных типов объектов зданий, — два; в качестве других типов объектов — ноль .

Деревья:

ж) Максимально пропущено 10 % .

з) Максимально избыточны 10 % .

и) Максимальный процент деревьев, которые могут иметь неправильную высоту, — 20 % .

к) Процент экземпляров, которые могут быть неправильно классифицированы в качестве других типов объ­ ектов, — 0 .

Е.2.2 Представление реального мира, предметной области и набора данных

Отношение между тремя понятиями выглядит следующим образом:

- рисунок Е.1 представляет «реальный мир», который обычно содержит больше объектов, чем будет содер­ жаться в наборе данных;

- рисунок Е.2 представляет «предметную область», определенную спецификацией данных; это та часть ре­ ального мира, которая должна быть включена в набор данных, если набор данных создан полностью и точно;

- рисунок Е.З представляет набор данных как он есть .

На всех рисунках:

- цифра или буква, обозначающая диапазон цифр под символом дерева, — это высота дерева в метрах,

- цифра внутри символа дома — это количество жильцов дома;

- имена обитателей дома расположены рядом с символом дома .

Е.З Процесс оценки качества Е.3.1 Определение единиц(ы) качества данных Единица качества данных включает область определения и элемент(ы) качества.

В этом примере полнота и тематическая точность оцениваются на соответствие спецификации информационного продукта:

- первая единица качества включает концептуальную согласованность, полноту (присутствие и отсутствие) и точность тематической классификации, оценка которых проводится во всем наборе данных;

- две другие единицы качества включают обобщенную концептуальную согласованность, полноту (присут­ ствие или отсутствие) и точность тематической классификации по транспортным сетям и зданиям;

- одна единица качества включает точность количественного атрибута, оцениваемую по типу объекта (дерево);

- последняя единица качества включает элементы применимости (общее соответствие требованиям специ­ фикации информационного продукта), оцениваемые по всему набору данных .

Рекомендации по выбору подходящих элементов качества данных приведены в приложении I .

Е.3.2 Определение мер качества данных Меры, которые используются в этом примере, взяты из списка зарегистрированных мер из приложения D .

Для описания логической согласованности используют следующие меры:

- Мера 9, «соответствие концептуальной схемы» .

Для описания полноты:

- Мера 1, «избыточный элемент»;

- Мера 2, «число избыточных элементов»;

- Мера 3, «показатель избыточных элементов»;

ГОСТ Р 57773—2017

- Мера 5, «отсутствующий элемент»;

- Мера 6, «число отсутствующих элементов»;

- Мера 7, «показатель отсутствующих элементов» .

Для описания тематической точности используют:

- Мера 62, «матрица ошибок классификации» .

Для описания применимости используют:

- Мера 101, «принятая спецификация информационного продукта» .

Е.3.3 Определение процедур оценки качества данных В этом примере используется процедура прямой внешней оценки .

В данном примере осуществляется полная проверка .

П р и м е ч а н и е — Пример процедуры выборочного контроля дан в Е.5.4 .

Е.3.4 Определение оценки качества данных на выходе (Результат) Е.3.4.1 Выявление ошибок Сравнивая набор данных (рисунок Е.З) с предметной областью (рисунок Е.2), можно получить перечень оши­ бок в данном примере набора данных (рисунок Е.4) .

–  –  –

- Дом заменяет промышленное здание (№ 23) .

- Две тропы ошибочно обозначены в виде дороги (№ 17, № 26) .

- Отсутствует дом (№ 21) .

- Ошибка атрибута дорог. Две дороги имеют неправильное «состояние» (№ 29, № 28) .

- Два дерева высотой менее 1 м представлены в наборе данных (№ 6, № 8) .

- Отсутствует код класса атрибута высоты дерева. У дерева отсутствует код класса, в то время как в пред­ метной области стоит В (№ 22) .

- Атрибут высоты дерева неправильно классифицирован. У шести деревьев указан неправильный класс высоты .

- Ошибка атрибута наименования дома «family п а те » («фамилия»). Дома «van Н а т т е » (№ 7) и «Негде»

(№ 1) в предметной области не имеют имени в наборе данных. Дом под названием «Goscinny» в наборе данных (№ 12) не имеет наименования в предметной области .

- Ошибка атрибута наименования дома «family п а те » («фамилия»). Дома «Franquin» (№ 5) и «Pratt» (№ 15) в предметной области идут под именами «Franklin» и «Prat» соответственно в наборе данных .

- Ошибка атрибута числа жильцов. В одном доме отсутствует атрибут количества жильцов (№ 31), а в трех домах оно указано неверно (№ 4, № 14, № 30) .

- Ошибка типа «пропуск» промышленного здания. Одно промышленное здание отсутствует (№ 10) .

П р и м е ч а н и е — Классификация ошибок по отсутствию/присутствию, полноте и тематической точности выполнена субъективно .

Например, неправильная классификация дома в качестве промышленного здания также может рассматри­ ваться как ошибка отсутствия одного элемента и присутствие другого .

Е.3.4.2 Логическая согласованность В наборе данных присутствуют только те типы объектов и атрибуты, которые определены в спецификации к информационному продукту .

Результат соответствия концептуальной согласованности см. в таблице Е.2 .

Таблица Е.2 — Результат соответствия логической согласованности

–  –  –

Е.3.4.3 Полнота Е.3.4.3.1 Общие положения В этом примере полнота классифицируется в соответствии с классом объекта. Типы мер проверены на при­ сутствие и отсутствие. Результаты представлены в таблицах Е.З— Е.5 .

Е.3.4.3.2 Количественный результат Таблица Е.З изображает способ классификации полноты посредством количественных значений .

Таблица Е.З — Полнота в соответствии с классом объекта

–  –  –

а Процент присутствия = количество присутствующих элементов/количество элементов в предметной области • 100 .

ь Процент отсутствия (пропусков) = количество отсутствующих элементов/количество элементов в пред­ метной области • 100 .

ГОСТ Р 57773— 2017 Е.3.4.3.3 Производный результат соответствия В таблице Е.4 представлены результаты соответствия, выведенные из количественных результатов .

Таблица Е.4 — Соответствие полноты

–  –  –

Е.3.4.3.4 Обобщенный результат соответствия Результаты соответствия в отношении транспортных сетей (троп и дорог) и зданий (промышленных и жилых) объединены в таблице Е.5 с использованием следующего правила: если один из исходных результатов «непри­ годен», то обобщенный результат будет «непригоден» (однозначная оценка пригодности/непригодности представ­ лена в приложении J) .

Таблица Е.5 — Обобщенное соответствие полноты

–  –  –

Е.3.4.4.2 Количественный результат Одним из способов отображения ошибок, связанных с тематической точностью, является использование меры «матрица неправильной классификации» .

В таблице Е.6 представлена матрица неправильной классификации, показывающая ошибки по классам объ­ ектов. Она показывает, насколько верно классифицируются экземпляры в наборе данных. Различные проценты должны всегда относиться к генеральной совокупности в наборе данных .

П р и м е ч а н и е — Матрица неправильной классификации представляет собой квадратную матрицу, где (/,_/') элемент соответствует количеству экземпляров, отнесенных к классу j, когда на самом деле они принадлежат классу /' .

Т а б л и ц а Е.6 — Матрица неправильной классификации объектов

–  –  –

Расхождение между суммой и числом элементов в предметной области и наборе данных связано с отсут­ ствием и избытком элементов .

Е.3.4.4.3 Производный результат соответствия В таблице Е.7 представлены результаты соответствия, полученные из количественных результатов .

Таблица Е.7 — Соответствие тематической точности

–  –  –

Е.3.4.4.4 Агрегированный результат соответствия Результаты соответствия в отношении транспортных сетей (троп и дорог) и зданий (промышленных и жилых) объединены в таблице Е.8 на основе следующего метода: если один из исходных результатов имеет значение соГОСТ Р 57773—2017 ответствия «непригоден», то обобщенный результат будет «непригоден» (однозначная оценка пригодности/непригодности представлена в приложении J) .

Т а б л и ц а Е.8 — Обобщенное соответствие правильности классификации

–  –  –

Е.3.4.5 Тематическая точность — точность количественных атрибутов Е.3.4.5.1 Общие положения В этом примере проверяется точность количественных атрибутов. В таблице Е.9 учитываются только те объекты, которые имеют общего предка в том же типе объекта («класс»). Результаты представлены в таблицах Е.9 и Е.10 .

Е.3.4.5.2 Количественный результат Атрибут «высота деревьев» представлен в таблице Е.9 .

Т а б л и ц а Е.9 — Матрица неверной классификации атрибута высоты объектов «высота деревьев»

–  –  –

У одного дерева отсутствует код класса, и, следовательно, оно не учитывается в матрице ошибок классифи­ кации. Данная ошибка может происходить из-за ошибки доменной согласованности .

Е.3.4.5.3 Производный результат соответствия В таблице Е.10 представлен результат соответствия, выведенный из количественных результатов .

Т а б л и ц а Е.10 — Соответствие тематической точности

–  –  –

Е.3.4.6 Применимость — обобщенное соответствие спецификации информационного продукта В таблице Е.11 все результаты соответствия зданий, транспортных сетей и деревьев объединены вместе в соответствии с концептуальной схемой, чтобы обеспечить соответствие спецификации информационного про­ дукта после зарегистрированной меры «принятая спецификация информационного продукта», идентификатор 101 (см. таблицу D.77) .

ГОСТ Р 57773—2017 Т а б л и ц а Е.11 — Применимость — соответствие спецификации продукта

–  –  –

Е.4 Выдача информации о качестве данных Е.4.1 Выдача информации в виде метаданных Е.4.1.1 Общие положения В разделах Е.4.1.2— Е.4.1.4 приведены примеры того, как выдавать информацию о качестве в виде мета­ данных согласно настоящему стандарту (раздел 10 и приложение С) и ИСО 19115-1:2013. Так, один экземпляр MD_Metadata включает один или более экземпляров DQ_DataQuality .

В данных примерах некоторые экземпляры классов (DQ_Quality и DQ_Elements) получили идентификатор (Ю) в соответствии с принципами XML. Эти идентификаторы используются при ссылке к таким экземплярам в других классах .

Е.4.1.2 Создание отчета о присутствии В таблице Е.12 показан пример выдачи информации о количественных результатах, производном результате соответствия и агрегированном результате соответствия для типов объектов транспортной сети .

Механизм вывода этих результатов похож на тот, что применяется для других типов объектов из набора данных .

Т а б л и ц а Е.12 — Создание отчета о присутствии в виде метаданных

–  –  –

Е.4.1.3 Создание отчета о правильности классификации В таблице Е.13 приведен пример выдачи информации о производных результатах соответствия и обобщен­ ных результатов соответствия для типа объекта здания .

Механизм вывода этих результатов похож на тот, что применяется для других типов объектов набора данных .

Т а б л и ц а Е.13 — Создание отчета о правильности классификации в виде метаданных

–  –  –

Е.4.1.4 Создание отчета о соответствии спецификации информационного продукта с использованием эле­ мента применимости В таблице Е.14 приведен пример вывода информации о соответствии спецификации информацион­ ного продукта путем обобщения результатов для различных потребностей. Используемый элемент качества — применимость .

Т а б л и ц а Е.14 — Создание отчета о применимости в виде метаданных

–  –  –

Е.4.2 Создание самостоятельного отчета о качестве Структура самостоятельного отчета о качестве имеет свободную форму. В Е.2 и Е.З даны примеры само­ стоятельного отчета о качестве .

Е.5 Дополнительные примеры Е.5.1 Общие положения Некоторые понятия не были описаны в предыдущем примере. В разделах Е.5.2— Е.5.4 даны дополнитель­ ные примеры вывода информации об описательном результате, метакачестве и процедурах выборочной оценки .

Некоторые понятия не были описаны в примерах Е.4 .

Е.5.2 Выдача информации об описательных результатах в виде метаданных Иногда невозможно представить оценку элемента качества данных в количественном виде. В таких слу­ чаях используется описательный результат. Пример описательных результатов в виде метаданных приведен в таблице Е.15 .

Таблица Е.15 — Создание отчета об описательных результатах в виде метаданных

–  –  –

Е.5.3 Создание отчета о метакачестве в виде метаданных При оценке абсолютной позиционной точности в топологическом исследовании на месте археологических раскопок результат точности составляет 5 м .

Определение качества оценки затем проводится с помощью элемента доверительного метакачества, для которого применяется мера «Фактор безопасности» .

В таблице Е.16 представлена выдача информации о метакачестве в виде метаданных .

Таблица Е.16 — Создание огчета о метакачестве в виде метаданных

–  –  –

evaluation: DQ_Fulllnspection valuellnit: UnitOfMeasure Е.5.4 Как выдавать информацию о процедуре выборочного контроля За основу примера взята топографическая БД (ТБД) европейского Национального управления земельной съемки .

Уровень соответствия качества установлен в спецификации к информационному продукту .

В данном примере тип объекта «дорога» оценивается посредством выборочной оценки .

Процедура выборки проходит с использованием принципов [14], как описано в таблице Е.17 .

Т а б л и ц а Е.17 — Процедура выборочного контроля

–  –  –

Контроль элементов в единицах выборки Контроль каждого элемента в единицах выборки Если требования к качеству объекта — 1 несоответствие на 100 единиц (AQL = 1), то все собранные объ­ екты проверяются из источника данных. Проверка выборочным контролем производится при AQL в диапазоне от 4 или 15 .

Контролируемая партия для тестирования должна состоять из наборов данных, которые созданы по воз­ можности в одно время и с использованием одинаковых методов. Из партии единицы выборки, состоящей из N-количества квадратов размером 1 x 1 км2, выбираются таким образом, чтобы число объектов в выборке было достаточным для AQL = 4. В таблице Е.18 показан пример того, как выдавать информацию о процедуре выбороч­ ного контроля в виде метаданных .

ГОСТ Р 57773—2017 Т а б л и ц а Е.18 — Выдача информации о процедуре выборочного контроля в виде метаданных

–  –  –

report: DQ_Commission measure: DQ_MeasureReference nameOfMeasure: Characterstring Количество избыточных элементов Методы выборочной оценки F.1 Введение Данное приложение содержит рекомендации по определению выборки и разработке методов выборочного контроля. Для формирования выборки при оценке соответствия спецификации информационного продукта могут применяться стандарты ГОСТ Р ИСО 2859, ГОСТ Р ИСО 3951-1. Эти стандарты изначально были разработаны для непространственного использования. В настоящем приложении описывается, как применять методы выборочного контроля стандартов серии ГОСТ Р ИСО 2859 и ГОСТ Р ИСО 3951-1, а также другие методы пространственной вы­ борки для пространственных данных .

F.2 Партия и элемент Партия и элемент являются важными понятиями в методе выборочного контроля согласно серии ГОСТ Р ИСО 2859 и ГОСТ Р ИСО 3951-1. Партия — это минимальная единица продукции, для которой может быть оценено качество. Элемент — это минимальная единица, которая должна быть определена разработчиком данных в соот­ ветствии со спецификацией информационного продукта .

F.3 Объем выборки Объем совокупности, а следовательно, и объем выборки могут оцениваться в зависимости от различных базисов к элементам. Определение объема выборки требует точного выявления элементов. Примеры различных базисов даны в таблице Е. 1 .

На рисунке Е.1 показана разница между проекциями. Вся фигура представляет данные в области определения качества данных. Фигура изображает возможную площадь выборки из приблизительно 15 % общей площади области определения качества данных, только около 10 % от длины кривой в области определения выборки и 0 % вершин .

Чтобы избежать проблем с выборкой, представленных на рисунке F.1, необходимо определить объем и рас­ положение выборки с использованием комбинации различных критериев, при этом улучшается репрезентатив­ ность выборки .

П р и м е р — Выборка включает 10 % площади, охваченной набором данных, и содержит не менее 5 % общей длины дорог в наборе данных .

Т а б л и ц а F.1 — Различные базисы для определения совокупности

–  –  –

F.4 Стратегии создания выборки F4.1 Введение В данном разделе приводятся рекомендации для определения выборок и выборочных методов с учетом конкретных аспектов пространственных данных. Стратегии выборочного построения, описанные в настоящем при­ ложении, представлены в графической форме на рисунке F.2.

Различают два аспекта стратегии создания выборки:

определение элементов для выборки (область или объект) и способ, с помощью которого происходит отбор эле­ ментов (случайный или преднамеренный) .

Компоненты выборочной стратегии

–  –  –

F.4.2 Вероятностная и детерминированная выборка F.4.2.1 Различия Вероятностная выборка применяет теорию выборочного метода и включает случайный выбор элементов вы­ борки. Существенной характеристикой вероятностной выборки является то, что каждый компонент совокупности, из которой формируется выборка, имеет известную вероятность выбора. При случайной выборке можно делать статистические выводы о выборочной совокупности. Составление преднамеренной выборки сопряжено с отбором выборок на основе экспертных знаний или профессиональной оценки .

F.4.2.2 Простая случайная выборка Простая случайная выборка основана на вероятности и включает в себя составление выборки в случайном порядке. Конкретная выборка (например, объекты, положение, время) осуществляется с помощью случайных чи­ сел для отбора элементов, при этом любой выбор равновероятен. Простая случайная выборка применяется, когда генеральная совокупность является довольно однородной относительно характеристик отбираемых образцов, т. е .

не содержит больших пропусков и скоплений. Данный метод не может привести к репрезентативному охвату об­ ласти, т. е. существует вероятность, что полученная выборка будет содержать только часть области .

F.4.2.3 Стратифицированная случайная выборка Стратифицированная выборка требует, чтобы генеральная совокупность была разделена на непересекающиеся слои или подсовокупности, которые являются более однородными по элементам выборки в одном слое, чем в разных слоях. Данная стратегия выборки перспективна для получения большей точности в определении средней и дисперсии, чем не стратифицированная для той же совокупности .

F.4.2.4 Полуслучайная выборка Полуслучайная или систематическая выборка подразумевает случайный отбор исходных элементов выбор­ ки (например, положение, время, объект) и правила для отбора всех остальных элементов. Примером полуслучайной или систематической выборки служит решетчатая выборка, где начальное положение сетки определяется случайным образом, а образцы берутся через равные промежутки (ячейки сетки) пространственной области. Си­ стематическая решетчатая выборка используется для поиска кластеров и вывода средних значений, процентов или других параметров и подходит для оценки пространственных тенденций или закономерностей. Данный метод предоставляет практичный и легкий способ обеспечения покрытия области .

F.4.3 Выборка на основе объектов и выборка на основе их пространственного расположения F.4.3.1 Формирование выборки на основе объектов (непространственная выборка) Особенностью данной выборки является отбор элементов выборки на основе непространственных атри­ бутов объектов, а не на их пространственном расположении. Выбор объектов в пределах области определения качества данных может производиться в случайном порядке при одинаковых условиях создания данных для всей области определения качества данных. В некоторых случаях в результате простой случайной выборки можно не ГОСТ Р 57773— 2017 получить удовлетворительной выборки в силу того, что однородность может быть выявлена только для подна­ боров, и тогда потребуется равномерное распределение выборок; т. е. пропуски и скопления встречаются в вы­ бираемых характеристиках. В этом случае стратифицированная или полуслучайная выборки могут дать лучшие результаты .

П р и м е ч а н и е — Если формирование выборки осуществляется путем случайного выбора объектов, то существует риск получения выборки, сосредоточенной на малой площади (которая может быть неприемлема) .

Полуслучайная выборка может использоваться, чтобы гарантировать контроль различных критериев по объ­ ему выборки и/или расположению, ограниченных необходимостью сократить затраты на проведение контроля .

П р и м е р — Энергетической компании необходимо оценить правильност ь атрибутов, опреде­ ляем ы х для объектов различны х типов. Были рассмот рены два метода: случайный и полуслучайный отбор (произвольный выбор объектов одного типа, а затем сбор объектов различны х типов в сосед­ стве с первым до заполнения выборки каждого типа), которые способствовали снижению затрат на конт роль в процессе эксплуатации .

F.4.3.2 Формирование выборки на основе пространственного распределения (пространственная выборка) В рамках данной выборки отбор единиц выборки основан на пространственном распределении. Элементами выборки могут выступать существующие географические единицы (например, политические или статистические) или другие объекты или компоненты объектов предметной области, для которых проводится контроль. Данный тип формирования выборки может использоваться в качестве первого этапа выборки с последующим использованием метода формирования выборки на основе объектов в пределах каждой подобласти .

П р и м е р — Случайный выбор UTM области координатной сетки 1 х 1 км для того, чтобы оце­ нит ь атрибуты объектов, содержащихся в этой области .

Рисунок F.3 иллюстрирует результат определения областей, которые будут представлены для проверки, полу­ ченных путем случайной генерации координат центральной точки квадратов равной площади (неперекрывающиеся) .

Рисунок F.3 — Пример выборки на основе пространственного распределения

Когда особое значение имеет покрытие всей площади, то местоположение выборки следует определять в соответствии с регулярной или полурегулярной сеткой. Рисунок F.4 иллюстрирует пример полуслучайной (система­ тической) выборки с выборочными объектами, распределенными вдоль регулярной сетки для оценки позиционной точности набора данных .

–  –  –

Пространственное позиционирование с различным объемом в различных областях набора данных может быть необходимо в полуслучайной выборке, если распределение объектов неоднородно. При использовании сетки с постоянным размером ячейки необходимо правило для включения или исключения клеток, которые не представ­ ляют интереса .

F.5 Вероятностная выборка F.5.1 Общее представление

При применении выборки необходимо учитывать следующее:

а) области, охватываемые географическим набором данных, могут образовывать непрерывное простран­ ство. При разделении набора данных на партии особое внимание должно быть уделено присутствию или отсут­ ствию элементов, проходящих через границы партии;

б) ряд факторов, включая качество исходных данных и мастерство операторов, могут повлиять на качество пространственных данных. Разработчикам данных необходимо проявлять осторожность при определении партии для получения однородности в контексте обеспечения качества .

F.5.2 Существующий стандарт выборочного контроля F.5.2.1 Общие положения Исходя из особенностей разработки и в соответствии со спецификацией информационного продукта для проведения выборочного контроля должны использоваться соответствующие существующие стандарты. Напри­ мер, ГОСТ Р ИСО 2859-1 применим в первую очередь для контроля непрерывной серии партий. Для индивидуаль­ ных партий подходит ГОСТ Р 50779.72, а для процедур выборочного контроля независимо от партий применяется ГОСТ Р ИСО 2859-3. ГОСТ Р ИСО 3951-1 применяется при контроле по количественным переменным для опреде­ ления процента несоответствующих элементов продукции .

Уровень соответствия качества набора данных указывается как AQL в соответствии с ГОСТ Р ИСО 3951-1 .

Для определения соответствия каждого элемента должны быть определены допуски спецификации при при­ менении ГОСТ Р ИСО серии 2859 и ГОСТ Р 50779.72. При применении ГОСТ Р ИСО 3951-1 статистические показа­ тели качества следует указывать на основе спецификации информационного продукта .

F.5.2.2 Полезные таблицы на основе этих стандартов — объем выборки и пределы отбраковки F.5.2.2.1 Общие положения При выборочном контроле оцениваемый отсутствующий показатель нельзя непосредственно сравнить с AQL. Таблицы Е.2 и F.4 определяют основные указания по объему выборки в зависимости от объема набора дан­ ных, а также связанного предела отбраковки .

F.5.2.2.2 Оценка соответствующих/несоответствующих элементов с учетом выборки В таблице Е.2 ниже представлен рекомендуемый объем выборки в соответствии с генеральной совокупно­ стью и связанный предел отбраковки для оценки соответствующих/несоответствующих элементов, например для оценки полноты. Она основана на гипергеометрическом распределении (ссылка [20]). Предполагается, что откло­ нения соответствуют этому распределению .

Как пользоваться таблицей:

а) выбрать объем совокупности элемента для проверки;

б) выбрать объем выборки (п) из таблицы;

в) произвести оценку и рассчитать количество «ошибочных элементов»;

г) вся совокупность бракуется, если количество ошибок равно или превышает предел отбраковки для фак­ тического п и р0 (AQL) .

Т а б л и ц а F.2 — Статистические показатели соответствия/несоответствия элементов при 95-процентном уровне значимости

–  –  –

Примечания 1 Если объем выборки выше, чем минимальный объем, приведенный в таблице, то предел отбраковки сле­ дует рассчитывать индивидуально. Данная проверка справедлива для ситуаций, когда оценка качества основана на оценке пригодности/непригодности элементов .

2 Существуют другие диапазоны статических значений, помимо представленных в таблице Е.2 .

Пример Проверка отсутствующих домов (полнота/отсутствие) в определенной области .

— Первая область выборки выбрана и в этой области проверен каждый дом на предмет его присутствия или отсутствия в наборе данных. Далее оценивается (подсчитывается) число отсутствующих домов и их общее коли­ чество. Вопрос в следующем: значительно ли полученный результат отличается от предела приемлемого качества (AQL)? Если да, то набор данных бракуется. Если нет, то набор данных принимается .

Набор данных для проверки состоит из 2440 зданий .

Объем выборки (из таблицы Е.2) - л = 125. Контроль по полю показывает, что пропущены 2 здания, выдавая примерный процент отсутствия: 2/(125 + 2) • 100 % = 1,6 % .

AQL (из спецификации информационного продукта для набора данных): р0 = 0,5 % .

1,6 % больше чем 0,5 %, но есть ли вероятность отбраковки набора данных? В случае применения выборки полученный показатель отсутствия нельзя непосредственно сравнивать с AQL. Для этого необходима односторон­ няя проверка гипотез, и в этом помогает таблица F.2 .

Предел отбраковки (Л/ = 125, р0 = 0,5 %) равен 3. В результате полевого контроля обнаружены 2 пропущенных элемента .

Заключение: так как 2 меньше, чем 3 (предел отбраковки), набор данных не может быть отклонен и принимается .

Е5.2.2.3 Стандартное отклонение В таблице Е4 представлен рекомендуемый объем выборки в соответствии с объемом совокупности, а также связанный предел отбраковки при измерении стандартного отклонения .

Данный статистический метод применяется для определения того, превышено ли стандартное отклонение для выборки AQL. Приведенная ниже таблица Е4 основана на нормальном распределении и предполагает нор­ мальное распределение отклонений .

Символы и формулы к таблице Е4 представлены в таблице ЕЗ .

–  –  –

Набор данных не отвечает требованиям (т. е. может быть отклонен при значимости 95 %), если стандартное отклонение, разделенное на F-значение (взято из таблицы F.4), выше, чем AQL .

Т а б л и ц а F.4 — Статистические показатели проверки стандартного отклонения. Уровень значимости 95 %

–  –  –

10 1,37 15 1,30 20 1,26 25 1,23 35 1,20 50 1,16 75 1,13 10 001 35 000 1,12 150 1,09 200 1,08 200 1,08

–  –  –

В наборе данных из 450 крышек люков измеряются 25 (объем выборки п = 25). Приблизительное стандарт­ ное отклонение 21 см, приемлемый уровень качества (AQL) = 19 см .

Нижний предел доверительного интервала = 21 см /1,23 (из таблицы F.4) = 17,1 см. AQL(19 см) находится в пределах доверительного интервала стандартного отклонения .

Вывод: стандартное отклонение по контролю не является значительно выше, чем AQL, и набор данных не может быть отбракован .

F.5.3 Процесс составления выборки F.5.3.1 Определение элементов Элементы необходимо определять в соответствии со спецификацией информационного продукта или требо­ ваний. Если несоответствующие элементы статистически согласованы, то они обрабатываются как один элемент .

F.5.3.2 Определение областей определения качества контролируемого набора данных Если область определения качества данных не является однородной, то их следует разделить на однород­ ные поднаборы. Эти однородные поднаборы следует рассматривать как отдельные области определения качества данных .

Однородность может быть выведена там, где выполняются следующие условия:

- исходные данные продукции имеют почти одинаковое качество;

- системы производства данных (оборудование, программное обеспечение, квалификация оператора) прак­ тически не отличаются;

- другие факторы, которые могут повлиять на вероятность появления несоответствий, такие как сложность и плотность объектов, практически не отличаются .

F.5.3.3 Разделение области определения качества данных на партии Генерирование партий осуществляется путем деления областей определения качества данных. При силь­ ной положительной пространственной автокорреляции возникновения несоответствий предпочтительнее исполь­ зовать меньший объем партии .

F5.3.4 Разделение партий на единицы выборки Единицей выборки может быть существующий географический район или другое разделение предметной об­ ласти, для которой проводится проверка. Когда единицей выборки служит географическая область, то необходимо применять правила для частичного включения единиц продукции в единицу выборки .

ГОСТ Р 57773—2017 F.5.3.5 Отбор единиц выборки с помощью простой случайной выборки для проверки Общее число элементов, которые относятся к выбранным единицам выборки, следует устанавливать в соот­ ветствии с актуальными международными стандартами .

П р и м е ч а н и е — Если партия является статистически гетерогенной, то применение простой случайной выборки с тем же уровнем выборки недопустимо. ИСО серии 2859 дополнительно предусматривают использова­ ние стратифицированной выборки .

F.5.3.6 Контроль выбранных единиц выборки Все элементы, которые принадлежат отобранным единицам выборки, подвергаются проверке. Элементы в наборе данных сравниваются с предметной областью в соответствии с выбранной мерой качества .

ГОСТ Р 57773— 2017

–  –  –

G.1 Цель базовых мер качества данных Понятие базовой меры качества данных вводится в настоящем стандарте с целью предотвращения повтор­ ного определения одного и того же понятия. Существуют меры качества данных, которые имеют определенную схожесть. Например, счетные меры качества данных работают по принципу подсчета ошибок. Число ошибок может использоваться для создания различного рода мер качества данных. Концепция построения этих мер качества данных направлена на обобщение базовых мер качества данных, которые используются для создания мер каче­ ства данных, разделяющих эту общность .

Можно выделить меры подсчета и неопределенности качества данных. Поэтому в данном приложении при­ ведены две принципиальные категории базовых мер качества данных. Счетные меры качества данных основаны на концепции подсчета ошибок или правильных элементов. Меры неопределенности в обеспечении качества дан­ ных основаны на концепции моделирования неопределенности измерений с помощью статистических методов .

Измеряемая величина может лежать в разных размерностях. В зависимости от размерности измеряемой величины применяются различные типы базовых мер качества данных для создания мер качества данных .

G.2 Базовые меры качества данных, связанные с подсчетом Базовые меры качества данных, основанные на различных методах подсчета ошибок или количества пра­ вильных значений, приведены в таблице G.1 .

Таблица G.1 — Базовые меры качества данных для измерения качества данных, связанного с подсчетом

–  –  –

Примечания 1 Показатель ошибок может быть представлен в процентах или как отношение. Единица значения в ко­ личественном результате (см. 7.5.4.2) может быть использована для указания того, в каком виде представлен результат в процентах или как отношение .

2 Показатель правильных элементов может быть представлен в процентах или как отношение. Единица значения в количествненном результате (см. 7.5.4.2) может быть использована для указания того, в каком виде представлен результат в процентах или как отношение .

П р и м е ч а н и е — Количество элементов определяется по числу элементов в предметной области набора данных, заданных областью определения качества данных .

–  –  –

ГОСТ Р 57773—2017 G.3 Базовые меры качества данных, связанные с неопределенностью G.3.1 Общие положения Числовые значения, получаемые в результате измерения, можно производить только до определенной точ­ ности. Принимая измеряемую величину в виде случайной величины, данную неопределенность можно измерить количественно. Для определения базовых мер качества данных, связанных с неопределенностью, используют раз­ личные способы описания неопределенности посредством статистических методов .

Статистические методы, используемые для определения мер качества данных, связанных с неопределенно­ стью, основаны на следующих предположениях:

- неопределенность является однородной для всех наблюдаемых значений;

- наблюдаемые значения не являются коррелированными;

- наблюдаемые значения имеют нормальное распределение .

G.3.2 Одномерная случайная величина Z Для измеряемой величины невозможно определить истинное значение. Но можно найти вероятность истин­ ного значения в пределах определенного интервала. Этот интервал называется доверительным интервалом. Он представлен вероятностью Р истинного значения, находящегося между нижним и верхним пределами. Величину Р также называют уровнем значимости

–  –  –

ГОСТ Р 57773— 2017 Т а б л и ц а G.3 — Связь между квантилями t-распределения Стьюдента и уровнем значимости для различных коэффициентов избыточности г

–  –  –

Т а б л и ц а G.4 — Базовые меры качества данных для различных вероятностей Родномерной величины, где стан­ дартное отклонение определяется на основе избыточных измерений

–  –  –

Базовые меры качества данных для неопределенности одномерных величин приведены в таблицах G.2 и G.4. Они направлены на измерение неопределенности с указанием верхней и нижней границы доверительного интервала. Разница заключается в том, как получено стандартное отклонение. Если оно известно априори, то при­ меняется таблица G.2. Если стандартное отклонение определяется избыточными измерениями, то применяется таблица G 4 в сочетании с таблицей G.3 .

G.3.3 Двумерная случайная величинах, Y Помимо одномерной случайной величины Z существует двумерная величина, которая всегда определяется двумя значениями. Результат представляется парой X, У. Как и в случае одномерной случайной величины, она ис­ пользует те же предположения .

Результаты наблюдений — xmj и ymj. Эквивалентностью доверительного интервала в одном измерении яв­ ляется доверительная область, которая обычно описывается как окружность вокруг лучшей оценки для истин­ ного значения. Вероятность нахождения истинного значения в этой области вычисляется посредством интегри­ рования области по двумерной функции плотности нормального распределения. Окружность характеризуется его радиусом. Этот радиус, R, используется в качестве меры точности двумерных случайных величин (см. также таблицу G.5)

–  –  –

В некоторых особых случаях радиус может быть рассчитан в зависимости от стандартных отклонений ах и су ГОСТ Р 57773— 2017 Т а б л и ц а G.5 — Отношение между вероятностью Р и соответствующим радиусом окружности

–  –  –

G.3.4 Трехмерная случайная величинах, Y Z, Одномерная случайная величина Z может быть расширена до трехмерной, где результат всегда наблюдает­ ся тремя значениями. Результат представляется X, У, Z. В ее основе лежат те же предположения, что и в случае одномерной случайной величины .

Результаты наблюдений — xmj, ymj и zmj. Эквивалентность доверительного интервала в одном измерении является доверительным объемом, который обычно описывается как сфера вокруг лучшей оценки для истинного значения. Вероятность нахождения истинного значения в этом объеме рассчитывается по интегрированию объема над трехмерной функцией плотности нормального распределения. Объем сферы характеризуется его радиусом .

Этот радиус используется в качестве меры точности трехмерных случайных величин (см. таблицу G.6) .

Т а б л и ц а G.6 — Отношение между вероятностью Р и соответствующим радиусом сферы

–  –  –

Н.1 Введение В данном приложении дано описание хранения мер качества данных, базовых мер и параметров в реестре или каталоге .

Н.2 Хранение мер качества данны х Н.2.1 Общие положения Полное описание мер качества данных, базовых мер качества данных и параметров могут храниться в рее­ стре либо в каталоге. Эти две структуры совместимы и дополняют друг друга. Реестр носит глобальный характер (например, реестр для всех применяемых мер в структуре), каталог же представляет набор информации, отно­ сящейся к одному конкретному варианту использования (например, каталог комплекса мер, используемых для оценки качества данных одного конкретного набора данных) .

Рисунок Н.1 — Внесенные в реестр элементы, каталоги и меры качества данных

Н.2.2 Каталог мер качества данны х

Меры, базовые меры, указатели источника и параметры могут быть представлены в каталоге мер:

DQM_MeasureCatalogue, выведенного из класса CT_Catalogue согласно [4] .

DQM_MeasureCatalogue должен объединять все нужные экземпляры DQM_Measure, DQM_BasicMeasure, DQM_SourceReference и DQM_Parameter, как показано на рисунке Н.1 .

Н.2.3 Реестр мер качества данны х Для управления мерами качества данных можно создать реестр мер качества данных. В этом случае ре­ естр мер качества данных должен соответствовать спецификации реестра, приведенного в [5], который описывает структуру и атрибуты внесенных в реестр элементов .

ГО СТ Р 57773— 2017 На рисунке Н.2 представлена структура класса RE_Registeredltem в сравнении с классами DQM_Measure, DQM BasicMeasure и DQM Parameter .

–  –  –

+ m easureldentifier :MD_Identifier + name :CharacterString + alias :CharacterString [0..*] + elementName :TypeNam e [1..*] + definition :CharacterString + description :DQM_Description [0..1] + valueType :TypeName + valueStructure :DQM_ValueStructure [0..1] + example :DQM_Description [0..*]

–  –  –

+ name :CharacterString + definition :CharacterString + description :DQM.Description [0..1] + valueType :TypeName + valueStructure :DQM.ValueStructure [0..1] Рисунок H.2 — Структурное сходство между внесенными в реестр элементами и мерами качества данных Некоторые дескрипторы мер качества данных, базовых мер и параметров (как определено в разделе 8) могут быть повторно использованы в качестве атрибутов внесенных в реестр мер, базовых мер и параметров (см. рису­ нок Н.1 и таблицу Н.1) из RE.Registeredltem, определенного в [5]. Иные дескрипторы внесенных в реестр элемен­ тов следует представлять в соответствии с [5] .

Таблица Н.1 — Меры, базовые меры и атрибуты параметров, соответствующие атрибуту элемента

–  –  –

DQM_RegisteredDataQualityMeasure. status Статус item в пределах реестра DQM_RegisteredDataQualityMeasure.name «Количество некорректных перекрытий поверхности»

DQM_RegisteredDataQualityMeasure. definition «Общее количество ошибочных перекрытий в данных»

–  –  –

DQM_RegisteredDataQualityMeasure.alternativeExpres- «перекрывающиеся поверхности»

sions DQM_RegisteredDataQualityMeasure. specified Item. «и»

itemldAtSource DQM_RegisteredDataQualityMeasure.specifiedltem. CI_Citation sourceCitation Руководство по использованию элементов качества И Обзор В некоторых случаях для одного конкретного требования к качеству может быть несколько возможных эле­ ментов качества, а в оценке качества обнаружена одна ошибка. Данное приложение содержит рекомендации по выбору элемента качества .

П р и м е ч а н и е — Элементы качества описаны в 7.3 .

I.2 Категории элементов качества данных 1.2.1 Общее представление

В разделе 7.3 определено шесть различных категорий элементов качества:

- полнота (7.3.2);

- логическая согласованность (7.3.3);

- позиционная точность (7.3.4);

- тематическая точность (7.3.5);

- временная точность (7.3.6);

- элемент применимости (7.3.7) .

Элемент применимости используется для оценки качества в соответствии с потребностями пользователя, которые не могут быть охвачены остальными пятью категориями качества данных. Его также можно применять для предоставления результата агрегации, где обобщаются результаты из нескольких категорий качества дан­ ных (например, общее соответствие одной спецификации). Иные варианты применения в данном приложении не рассматриваются .

Из оставшихся пяти только логическая согласованность может быть оценена в полной мере без знания на­ земных данных. Установленные требования и оценка логической согласованности регулируют «внутренние отно­ шения» в данных и контролируют соответствие данных правилам, установленным в спецификациях .

Три категории полноты, позиционной и тематической точности используются для описания того, насколько точно набор данных отображает предметную область .

Последняя категория (временная точность) состоит из комбинаций элементов качества данных, которые частично зависят от логических правил (в сравнении с логической согласованностью), и частично нуждается в данных наземного наблюдения (такж е как категории полноты и точности) .

1.2.2 Другие варианты Все принятые элементы качества данных могут быть оценены, и результаты оценки не устареют по истече­ нии времени. Два возможных (но не принятых) вида «Up-to-dateness» (актуальность) и «Timeless» (качество вне времени) описывают, насколько данные точно отвечают текущей реальной ситуации в мире .

При измерении актуальности (насколько набор данных отвечает современному реальному миру) резуль­ тат будет действителен только короткое время. По истечении, например года, результат возможной хранимой меры актуальности будет неверным, т. е. будет отражать ситуацию в мире годовой давности, нежели текущее положение .

1.2.3 Последовательность при оценке качества данных При оценке пространственных данных одна-единственная ошибка может повлиять на несколько элементов качества данных. Для вывода измерения в процентных показателях (например, процентные показатели аспектов полноты) важное значение представляет использование надлежащих знаменателей, которые описывают гене­ ральную совокупность (см. рисунок И ) .

Оценка качества данных проводится в следующем порядке:

а) логическая согласованность/согласованность по формату: самое первое, что оценивается, — это читае­ мость (или интерпретируемость) данных с целью определения возможности их декодирования/чтения/понимания .

Следует выводить информацию о неинтерпретируемых данных и игнорировать их при дальнейшей оценке. Резуль­ тат согласованности по формату должен содержать информацию о том, какая часть данных не читается;

б) логическая согласованность: определить, применяются ли правила, установленные для набора данных .

Части набора данных, не соответствующие правилам, должны игнорироваться при дальнейшей оценке;

в) полнота: следующий этап оценки — аспект существования объекта, охватываемый полнотой. Для ее оценки сравниваются объекты в фактическом наборе данных и данных наземного наблюдения, выводится инфор­ мация об отсутствии и присутствии;

г) точность (позиционные, тематические и временные аспекты): последний этап оценки включает аспек­ ты точности, которые измеряют отклонения между фактическими свойствами и свойствами объекта наземного наблюдения .

Эти измерения могут быть основаны только на тех фрагментах набора данных, которые представлены как в фактическом наборе данных, так и в предметной области .

ГОСТ Р 57773—2017

Рисунок И — Порядок при оценке качества данных

I.3 Отношения между элементами качества данных 1.3.1 Общие положения Многие элементы качества данных связаны между собой. В некоторых случаях это может привести к неопре­ деленности относительно вывода информации о выявленных отклонениях/ошибок в данных. В данном разделе рассматриваются отношения между элементами качества данных .

1.3.2 Элементы качества данных, связанные с отсутствующими значениями атрибутов По крайней мере три различных значения следует рассматривать как идентификатор «недоступности значе­ ния». Их способ применения может влиять на элементы качества данных, выбранные для представления инфор­ мации об отсутствующем значении. Эти три значения имеют различную семантику:

- Пустое значение. В этом случае атрибут не имеет никакого значения .

- Неприемлемое значение означает, что для этого конкретного объекта атрибут неверен, т. е. не имеет ника­ кого значения .

Пример 1 Дата смерти живых людей .

— Неизвестное значение. В этом случае атрибут присутствует, т. е. значение должно быть, но оно неизвестно .

ГОСТ Р 57773— 2017 Информацию об обязательных атрибутах с пустыми значениями следует выдавать в виде последователь­ ности логических ошибок. При оценке атрибутивной полноты не следует учитывать неприменимые обязательные атрибуты. Информацию о количестве неизвестных событий следует представлять в виде атрибутивной полноты .

Способом увеличения атрибутивной полноты является добавление искусственных значений к набору дан­ ных. Благодаря чему набор данных улучшится сточки зрения согласованности атрибутов, но при этом уменьшится атрибутивная точность .

П р и м е р 2 — Набор данных содержит 50 экземпляров объекта типа дерево. 45 из них имеют хранящееся значение атрибута HeightOfTree. Точность этого атрибута (45 экземпляров) равняется ± 1 м (стандартное отклонение) и полнота атрибута 45/50, т. е. 90 %. Если однако эти отсутствую­ щие HeightOfTree-значения дали неправильные (фиктивные) значения, например 10 м, то атрибутивная полнота увеличится (100 %), а атрибутивная точность, вероятно, уменьшится .

1.3.3 Отношения между различными аспектами точности Отклонения фактических данных от предметной области могут быть измерены с помощью позиционной (вре­ менной) и атрибутивной (тематической) точности. Примерами альтернативных способов выражения отклонения являются:

- Атрибут в противоположность пространству: для атрибутов, где географическое распределение известно, отклонение может быть выражено тематическим или позиционным компонентами. Значение высоты контурной ли­ нии может рассматриваться как атрибут контурной линии. Отклонение текущего положения от истинного местопо­ ложения может быть измерено атрибутивным компонентом («полметра слишком высоко») или пространственным компонентом («контур линии имеет смещение 10 м в северном направлении») .

- Пространство в противоположность времени: если движение объекта известно, то разница между изме­ ренным и реальным положением может быть выражена временным или позиционного компонентом: например, позиционная ошибка для движущегося по дороге автомобиля может быть выражена как «местоположение было верно 20 с назад» или «местоположение в настоящее время отличается на 400 м» .

- Атрибут в противоположность времени: «Цена ($/м2) конкретной посылки ошибочна на $20» или «эта цена была верной 10 лет назад» .

1.3.4 Зависимость между полнотой и точностью Оценка полноты обычно основана на сравнении набора данных и предметной области .

Критическая операция реализует связь между объектами в наборе данных и предметной областью. Уникаль­ ный идентификатор, как правило, формируется на основе их взаимосвязи .

При обработке объектов без такой идентификации элементов необходимо применять методы, основанные на близости атрибутов и их значений.

При компоновке пространственных объектов следует учитывать два аспекта:

а) тематическую близость (обычно выражается в виде типа объекта);

б) географическую близость объектов .

Когда два объекта (один в наборе данных, а другой в наземных наблюдениях) приняты в качестве пред­ ставления одного и того же реального явления, то отклонения между ними обрабатываются в виде точности. Если пара объектов взята для представления различных явлений, то информация об отклонении между ними выдается с использованием полноты (отсутствие и/или присутствие). Например, при оценке полноты и точности для 1 типа объекта (см. рисунок I.2) проблем с позицией А, В, С и D не возникает. При этом классификация идентична (тема­ тическое отклонение равно нулю) и географические отклонения фактического и реального положения находятся в пределах допустимого уровня. Объекты связаны между собой, а отклонения описываются посредством позици­ онной точности. В положении Е два экземпляра имеют различную тематическую классификацию, но расположены очень близко друг к другу. Необходимо принять решение о том, находится ли разница в классификации в пределах допустимого уровня для соединения. Если да, то два экземпляра будут способствовать точности оценки (позици­ онной и/или тематической), если нет, то дело в полноте (одна точка отсутствует и одна в избытке). В позиции F

–  –  –

и G, два экземпляра имеют одинаковую классификацию, но отличаются положением. Если это географическое отклонение находится в пределах допустимого уровня для соединения, то отклонение будет способствовать по­ зиционной точности (вероятно, отклоняющееся значение), если нет, то дело в полноте (отсутствие и присутствие) .

I.4 Элементы качества данных — пример использования 1.4.1 Полнота 1.4.1.1 Общие положения Для описания наличия и отсутствия объектов можно использовать элементы качества данных «отсутствие»

и «присутствие». Полноту следует в основном применять на уровне типа объекта, который указывает на то, что объекты из предметной области обнаружены или не обнаружены в наборе данных .

Полнота может также иметь значение для свойств объекта («полнота атрибута» и «полнота отношений») .

Перед использованием полноты в данных целях следует помнить о логической согласованности/концептуальной согласованности .

1.4.1.2 Присутствие — избыточность данных в наборе данных Может применяться на уровне экземпляра объекта. Означает, что данные находятся в «избытке», если это целый экземпляр объекта. Если в экземпляре объекта или атрибуте экземпляра объекта есть необязательные данные, то о присутствии речь не идет .

Данное определение включает в себя экземпляры объектов, которые присутствуют в наборе данных, но ко­ торые не входят в область применения (согласно спецификации) .

Правило для приведенных ниже примеров определяется так: «В набор данных должны включаться только те объекты, которые присутствуют в предметной области» .

П р и м е р 1 — Наличие данных из «Шотландия» подобно тем, что исключены из области опреде­ ления набора данных («Англия»), П р и м е р 2 — Только здания с площадью больше 5 м2 должны быть включены в набор данных .

Информация о наличии зданий до 5 м2 представляется в виде избыточности .

1.4.1.3 Отсутствие — данные отсутствуют в наборе данных Так же как и присутствие, может применяться на уровне экземпляра объекта. На практике это означает от­ сутствие экземпляров объектов, включение которых указано в спецификации .

Отсутствие следует в основном использовать, когда «целый элемент», например экземпляр объекта отсут­ ствует. Если обязательная часть элемента, например обязательный атрибут экземпляра объекта отсутствует, то информацию следует выдавать в виде ошибки концептуальной согласованности .

Правило для приведенного ниже примера определяется следующим образом: «Вся жилая недвижимость Англии и Уэльса должна быть включена в набор данных» .

П р и м е р — Отсутствие жилой недвижимости Англии или Уэльса в наборе данных .

I.4.2 Логическая согласованность 1.4.2.1 Общие положения Степень соответствия логическим правилам структуры данных, распределения и отношений (структура дан­ ных может быть концептуальной, логической или физической) может быть описана посредством следующих эле­ ментов качества данных .

1.4.2.2 Концептуальная согласованность — соответствие правилам концептуальной схемы Как правило, приложения имеют концептуальную схему, описывающую требования к структуре данных. Эта концептуальная схема может включать в себя:

- имена всех классов (типов объектов, типов данных и т. д.);

- имена атрибутов для всех классов, а также ограничения множественности;

- домены для всех атрибутов;

- отношения между классами;

- топологические отношения между типами объектов, например отношение между некоей областью и границей;

- отношения между атрибутами типа объекта для различных типов объектов, например отношение между значением высоты над уровнем моря от контурной линии и от дороги в географической точке пересечения для двух экземпляров объекта .

Концептуальная последовательность может охватывать все эти аспекты качества данных .

Другие подэлементы логической согласованности (доменная согласованность, топологическая согласован­ ность) также могут рассматриваться для некоторых аспектов, перечисленных выше, если концептуальная согла­ сованность используется только для обеспечения корректных свойств объекта для каждого экземпляра объекта .

1.4.2.3 Доменная согласованность — соответствие значений атрибутов области допустимых значений Для описания области допустимых значений, как правило, используется концептуальная схема приложения, при этом информация о ней выдается как часть концептуальной или доменной согласованности. Если в концепГОСТ Р 57773—2017 туальной схеме не существуют или не действуют доменные характеристики, то тогда можно использовать только под элемент качества доменная согласованность .

П р и м е р 1 — Организация определяет правильную область значений для каждого поля в тер­ минах длины, типа данных и содержания.

Доменная согласованность используется для обеспечения соблюдения этих условий со следующими исключениями:

- если поле содержит данные о местоположении (т. е. восточное и северное), то рассматривается как по­ зиционная точность;

- если поле содержит данные о дате/времени, то рассматривается как временное качество;

- если поле содержит первичный ключ, в этом случае рассматривается в рамках логической согласованности .

Правило для приведенного ниже примера определяется следующим образом: поле LANGUAGE должно со­ держать «ENG» или «СУМ» .

П р и м е р 2 — Пример ошибки доменной согласованности: «COR» .

1.4.2.4 Согласованность по формату — степень соответствия накопленных данных физической структуре набора данных Согласованность по формату следует в основном применять в качестве первой проверки оценки качества для удостоверения того, что набор данных сформирован в правильном формате в соответствии со спецификацией (продукта) .

Если установлены определенные правила для определения формата определенных атрибутов, например для сгенерированных идентификаторов, то согласованность по формату также может иметь отношение к отдель­ ным значениям атрибута. Если атрибуты значения проверяются в сравнении со списком допустимых значений (домен), то следует использовать доменную согласованность .

П р и м е р 1 — Спецификация информационного продукта определяет GML как формат распро­ странения. Если набор данных не является GML-файлом, то эту информацию об ошибке следует вы­ давать в виде ошибки согласованности по формату. Если один элемент в GML-файле отображается «в неправильном формате», например текст вместо числа, то информацию следует выдавать в виде ошибки концептуальной согласованности или ошибки доменной согласованности .

П р и м е р 2 — В пределах организации данная классификация используется для описания прове­ рок, которые обеспечивают соответствие правил спецификации информационного продукта и вклю­ чает в себя:

- наличие, достоверность и уникальность значений первичного ключа. Пример правила: каждый экземпляр объекта должен иметь уникальный идентификатор. Пример ошибки согласованности по формату — «NULL»;

- внешние ключи, которые соотносят идентификатор для другого экземпляра объекта, не при­ сутствуют в наборе данных. Пример правила — поле PARENTJJPRN должно содержать идентифика­ тор, связанный с существующим экземпляром объекта UPRN .

1.4.2.5 Топологическая согласованность — корректность явно закодированных топологических характери­ стик набора данных Топологические характеристики набора данных описывают геометрические отношения между элементами набора данных, которые не изменяются в результате трансформаций по методу «резинового листа». Предпола­ гается, что основные части топологических ограничений описываются в концептуальной схеме, при этом инфор­ мация может выводиться в виде концептуальной или топологической согласованности. Только топологическая согласованность может применяться в случае, если соответствующие топологические требования не являются частью концептуальной схемы .

П р и м е р 1 — Для набора данных с типами объектов, определенных по береговой линии водных объектов (такие типы объектов, как побережье, гавань, эллинг), а также с типами объектов водое­ мов (озера, моря и т. д.). Топологические отношения между типами объектов четко определены в кон­ цептуальной схеме, и для выдачи информации о том, что геометрия прибрежных линий (одномерная) совпадает с геометрией водоемов (двумерная) используется подэлемент качества концептуальная согласованность .

П р и м е р 2 — В сетевом наборе данных с неопределенными требованиями в концептуальной схеме для «чистой сети» информацию о «загрязненных частях» («недоход», «переход», перекрытие, самопересечение и т. д.) следует представлять как ошибки топологической согласованности .

I.4.3 Точность позиционирования Точность положения объектов по отношению к Земле может быть описана с использованием элементов ка­ чества данных этого раздела .

Измерение позиционной точности посредством наземного наблюдения подразумевает создание «согласо­ ванных пар» с одним экземпляром объекта из набора данных и соответствующим в контрольном (наземное наблюГОСТ Р 57773—2017 дение) наборе данных. Если объекты имеют уникальные идентификаторы (например, для кадастровых участков), то это соответствие может быть установлено с помощью идентификаторов, при этом грубые ошибки, смещения, стандартное отклонение могут быть оценены и отражены в виде позиционной точности .

При отсутствии доступных идентификаторов соответствие следует устанавливать на основе позиции. Дол­ жен быть определен «предел расстояния для соответствия», который облегчает вычисление грубых ошибок.

Дан­ ный «предел расстояния для соответствия» должен быть задокументирован в отчете в следующих случаях:

- экземпляры объектов в наборе данных без соответствующих экземпляров объектов контрольного набора данных должны быть указаны как избыточные в отношении элемента полноты;

- экземпляры объектов в контрольном наборе данных, не имеющие соответствующих экземпляров объектов в наборе данных, должны быть указаны в отчете как отсутствующие в отношении элемента полноты .

I.4.4 Временная точность 1.4.4.1 Общие положения Точность временных атрибутов и временных отношений объектов может быть описана с помощью следую­ щих параметров качества данных .

1.4.4.2 Точность измерения времени — соответствие заявленных измерений времени значениям, принятым или считающимся правильными .

П р и м е р — В пределах определенной организации точность измерения времени применяется для удостоверения в том, что:

- значение не противоречит конкретному условию в поле (дополнительным условиям, обуслов­ ленным характером данных дата/время) .

Пример правила — поле STARTDATE не может содержать значение в будущем .

1.4.4.3 Временная согласованность — правильность порядка событий Правила, описывающие аспект «правильность порядка последовательности событий», могут являться ча­ стью концептуальной схемы. Информация выдается в виде временной или концептуальной согласованности, если правила являются частью концептуальной схемы .

П р и м е р — В рамках определенной организации временная последовательность использует­ ся для:

- подтверждения соответствия между значениями даты/времени, связанных с жизненным ци­ клом объекта реального мира;

- обеспечения согласованности значений даты/времени, используемых при управлении экземпля­ рами объекта в наборе данных .

Пример правила — END DATE должна быть такой же или быть более поздней, чем START DATE .

Пример ошибки временной согласованности— START DATE = “2010-02-02”, END_DATE = “2000-01-01” .

1.4.4.4 Временная достоверность — достоверность данных по отношению ко времени Правила, описывающие аспект «достоверность данных по отношению ко времени», могут являться частью концептуальной схемы .

Информация выдается как временная достоверность либо как концептуальная согласованность, если пра­ вила являются частью концептуальной схемы .

П р и м е р — В рамках определенной организации точность измерения времени используется для:

- удостоверения в том, что содержимое поля даты или времени находится в правильном форма­ те и использует календарь, определенный в спецификации .

Пример правила — значение даты должно быть указано в формате [15] — “ВВГГ-ММ-ДД” .

Пример ошибки временной достоверности — “01.01.2010” или “2010-51-15” .

1.4.5 Тематическая точность 1.4.5.1 Общие положения Точность количественных атрибутов и правильность неколичественных атрибутов и классификаций объек­ тов и их отношений могут быть описаны с помощью следующих элементов качества данных .

1.4.5.2 Правильность классификации — соответствие классификации объектов или их атрибутов предмет­ ной области (т. е. реальной местности или эталонному набору данных) П р и м е р — Данная характеристика используется строго в рамках одной организации. Класси­ фикации, которые не определены в спецификации набора данных, не рассматриваются в качестве пра­ вильности классификации (а только как доменная согласованность) .

1.5 Рассмотрение особых случаев 1.5.1 Отношение между неправильной классификацией и полнотой на уровне типа объекта На уровне типа объекта полнота и тематическая точность/правильность классификации тесно связаны друг с другом. Действительно при неправильной классификации одного экземпляра объекта (отнесении его к другому ГОСТ Р 57773—2017 типу объекта) ошибка классификации возникнет в оценке полноты для обоих типов объектов (одна — присутствия и одна — отсутствия) .

Поэтому рекомендуется при оценке полноты на уровне объекта знать, что некоторая ошибка в присутствии или отсутствии может быть результатом неправильной классификации. При представлении информации о пра­ вильности классификации информация об ошибке будет выдана дважды .

Чтобы избежать двойной выдачи сообщения об ошибках, можно вывести отчет о полноте в одном верхнем уровне (набор данных, группировка типов объектов и т. д.), а информацию о неправильной классификации — на уровне объектов .

В приложении Е приведен пример .

I.5.2 Элементы качества, связанные с уникальными идентификаторами Ниже представлены некоторые варианты использования, имеющие отношение к соответствующим элемен­ там качества данных, для описания проблем, связанных с уникальными идентификаторами (см. таблицу 1.1) .

Таблица 1 — Элементы качества, связанные с уникальными идентификаторами.1

–  –  –

J.1 Введение Оценка на основе одного элемента качества данных, как правило, недостаточно удовлетворяет запросам пользователя .

Разработчик данных обычно разрабатывает (в сотрудничестве с потенциальными пользователями продукта) спецификацию информационного продукта с учетом всех требований, установленных для данного продукта .

Для потенциального пользователя представит интерес заключение, в котором говорится о том, что продукт оценивается на основе спецификации. Таким заключением является обобщенный показатель качества данных, который может быть полезен в других ситуациях, а не только при отчете соответствия спецификации .

Качество набора данных может быть представлено одним или более обобщенным показателем качества данных (ADQR). ADQR включает результаты оценки качества данных на основе различных элементов качества данных или различных областей определения качества данных .

Примеры методов, которые используются для создания ADQR, приведены в J.2— J.4. Следует учитывать, что при таком способе оценки качества набор данных может получить общую положительную оценку, даже если один или более показателей качества данных не прошли проверку. Поэтому обобщение необходимо применять только при наличии веских причин. В любом случае смысл обобщающего оценки качества данных должен быть всегда четко определен .

Так как ADQR может вызвать затруднения при определении, то смысл обобщающей оценки качества данных следует определить еще до извлечения выводов на основе обобщенного показателя качества данных для обе­ спечения качества набора данных .

Описание обобщенного показателя качества дано в 10.2.1 .

J.2 Однозначная оценка пригодности/непригодности Каждому показателю качества данных, вовлеченному в вычисления, придается логическое значение, равное единице (1), если значение показателя соответствует требованиям, и нулю (0), если нет. Обобщенный показатель качества определяется уравнением

ADQR = v 1 • v2 • v3 •... • vn,

где n — число групп определения качества данных .

Если ADQR = 1, то общее качество набора данных считается полностью соответствующим требовани­ ям, а значит, пригодно. Если ADQR = 0, то качество считается не соответствующим требованиям, а значит, непригодно. Данный метод не обеспечивает результат, который показывает местоположение или величину несоответствия .

J.3 Взвешенная оценка пригодности/непригодности Каждому показателю качества данных, вовлеченному в вычисление, придается логическое значение, равное единице (1), если значение показателя соответствует требованиям, и нулю (0), если нет. Кроме того, на основании значимости показателя для оценки качества в целом каждому из них присваивается весовое значение в интервале от 0 и 1 включительно. Сумма всех весов должна равняться 1. Выбор весов является субъективным решением, принимаемым разработчиком данных или пользователем данных. Причину своего решения разработчику данных следует указывать в виде части результата. Обобщенное качество определяется уравнением

ADQR = v 1 • w 1 + v2 • w2 + v3 • w3 +... + vn • wn,

где n — число групп определения качества данных .

Данный метод обеспечивает получение значения величины, показывающей, насколько набор данных близок к полному соответствию. Метод не обеспечивает получение количественного значения величины, указывающее, где имеет место соответствие или несоответствие .

П р и м е р — Таблица ошибок (см. таблицу J.1) показывает количество обнаруженных ошибок и их классифицирование в соответствии со стандартной процедурой, используемой для баз данных дорог .

В этом конкретном примере каждому т ипу ошибки присвоены весовые значения. Сумма весов равна 100 %. Полученное взвешенное значение представляет качество набора данных .

ГО С Т Р 5 77 73 — 2017 Таблица J.1 — Пример вычисления обобщ енных показателей оценки качества

–  –  –

Примечания 1 Элемент определяется в виде сегмента дороги, ограниченного точками пересечения с другими дорога­ ми или границами элемента выборки .

2 Обобщение информации по оценке качества данных, особенно при использовании весов, не имеет большого значения для конечных пользователей и может привести к неправильным выводам в зависимости от того, какие весы применял разработчик данных .

J.4 Оценка данны х на основе максимальны х/минимальны х значений показателя качества данны х Каждому показателю качества данных придается значение, основанное на значимости данного показателя для предназначения продукта. Основанием для подобного решения разработчика данных должны являться ре­ зультаты оценки качества отдельных групп данных.

Обобщенный показатель качества определяется одним из двух уравнений:

AD Q R = M AX (vh in = 1... п) или AD Q R = MIN (vh in = 1... п),

где п — число определений качества данных .

Данный метод обеспечивает получение значения величины, указывающей, насколько набор данных близок к полному соответствию, но только в терминах определения качества набора данных на основе максимума или ми­ нимума. Также метод задает количественное значение, указывающее, где имеет место наибольшее соответствие или несоответствие, когда заданное определение качества данных выдается вместе с ADQR. Однако данный тип ADQR не сообщ ает о ситуации с другими показателями качества данных .

ГОСТ Р 57773— 2017

–  –  –

С ведения о соответствии ссы лочны х н ац ио н ал ь ны х станд ар тов м еж д ународ ны м станд артам, использованны м в качестве ссы л очны х в прим ененном м еж д ународ ном стандарте

–  –  –

П р и м е ч а н и е — В настоящей таблице использовано следующее условное обозначение степени соот­ ветствия стандартов:

- MOD — модифицированные стандарты .

ГОСТ Р 57773— 2017 УДК 622.1:528:002:006.354 ОКС 35.240.70 Ключевые слова: оценка качества данных, элементы качества данных, меры качества, пространствен­ ные данные, метаданные, качество данных, поставка данных, формат данных БЗ 11—2017/37

–  –  –






Похожие работы:

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ ГОСТР НАЦИОНАЛЬНЫЙ 57534СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ Лыжи беговые ВИНТЫ ДЛЯ ЛЫЖНЫХ КРЕПЛЕНИЙ Методы испытаний (ISO 7795:2011, NEQ) Издание официальное Москва С та м д ар ти н ф о рм стоимость сертификации...»

«ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ СТЭНЛИ ОКП 421281 ДАТЧИКИ ДАВЛЕНИЯ ГИДРОСТАТИЧЕСКОГО КОРУНД-ДИГ-001М (ГИДРОСТАТИЧЕСКИЕ УРОВНЕМЕРЫ) ДАННЫЙ ДОКУМЕНТ ЯВЛЯЕТСЯ ЧАСТЬЮ РУКОВОДСТВА ПО ЭКСПЛУАТАЦИИ НА ДАТЧИКИ ДАВЛЕНИЯ МАЛОГАБАРИТНЫЕ КОРУНД, ОТНОСЯЩЕЙСЯ К ПОГРУЖНЫМ ДАТЧИКАМ ДАВЛЕНИЯ КОРУНД-...»

«ГОСТ Р 5 1 6 8 7 -2 0 0 0 Г О СУ ДАР СТВЕННЫЙ СТАНДАРТ Р ОС С И Й С К О Й Ф Е Д Е Р А Ц ИИ П РИ Б О РЫ СТОЛОВЫ Е И П РИН АДЛЕЖ Н ОСТИ КУХОННЫ Е И З К О Р Р О З И О Н Н О С Т О Й К О Й С ТА Л И Общие технические условия Издание офици...»

«Издание неофициальное ГОСТ Р ИСО 9934-1–2011 (издание неофициальное См. стр. 2) Предисловие Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. N...»

«Инструкция по монтажу и обслуживанию чугунного котла PROTHERM 60(50, 40, 30, 20) KLO ВЕРСИЯ "МЕДВЕДЬ" Сертификат соответствия № PОСС SK.МГ01.B00633 PROTHERM, s.r.o. 909 01 Скалица, ул.пплк. Плюштя 45 тел.: (0801) 6966 101, 6966 102 факс : (...»

«Информационная экономика: мировые тенденции и специфика развития в Республике Беларусь П. Лемещенко, Е. Шумских 1 (Сб-к: Научные труды Донецкого национального технического университета. Серия эконом. – Донецк, 2014, 3 1, с. 154-163). В статье анализируются результаты и потенц...»

«СССР РУК В Д Щ Й ТЕХНИЧЕСКИЙ М ООЯ И АТЕРИАЛ РЕКО ЕН АЦ И П ВЫ МДИ О БОРУ КОНСТРУКТИВНЫ СХЕМ Х П Ч ЬН Х СО РУ Е И ПРИ ИХ УСИ ЕН И И РИ АЛ Ы О ЖН Й ЛИ РЕКОНСТРУКЦИИ РТМ 31.3008-75 Ленинград, Л Н И, 1975г, МИП расчет вет...»

«PRO INSTALLATION 2008 Настоящий OEHLBACH® каталог действителен с 1 Март 2008. Каталог содержит информацию о рекомендованных розничных ценах в евро включая налог на добавленную стоимость. OEHLBACH® KABEL GMBH это зарегистр...»

«ПРОЕКТНАЯ ДЕКЛАРАЦИЯ ЗАО "Стройпрогресс Инвест" Строительство комплекса жилых домов по адресу: Калининградская область, Городской округ "город Калининград", ул.Ст.сержанта Карташева. третий этап стуоительства жилой дом ЛЬ 4 по Г П Размещена на сайте www.kaliningradstrovinvest.ru ]еральнй^й )|й|ре^ор АО "...»

«МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ (МГС) INTERSTATE COUNCIL FOR STANDARDIZATION, METROLOGY AND CERTIFICATION (ISC) ГОСТ МЕЖГОСУДАРСТВЕННЫЙ ISO 2244— СТАНДАРТ УПАКОВКА. ТАРА ТРАНСПОРТНАЯ НАПОЛНЕНН...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "ДОНСКОЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ" ОТКРЫВАЕМ ЕВРОПУ DISCOVERING EUROPE Материалы Всероссийской научно-практической конференции мо...»

«ДОКТОР Д У ГЛ АС Н. ГРЭМ ОРИ Е Н ТА Л И Я Москва Автор заявляет о своих правах на интеллектуальную собственность в полной мере, разрешённой законом. Ни одну часть этой книги нельзя воспроизводить или передавать в любой форме и любыми средствами, электронными или механическими, включая фотокопирование, аудиои видеозапись...»

«Электронный журнал "Труды МАИ". Выпуск № 46 www.mai.ru/science/trudy/ УДК 621.822. Экспериментальное исследование работы подшипников скольжения с жидкостной смазкой в нештатных режимах Ю. А. Равикович, Ю. И. Ермилов, Д.П. Холобцев, К. В. Ардатов, А. А.Напалков, Д. П.Шах Аннотация Проведено экспериментальное исследов...»

«ЗАО СВЯЗЬ ИНЖИНИРИНГ ИСТОЧНИКИ БЕСПЕРЕБОЙНОГО ПИТАНИЯ ИБП8-2,0/48(60,24)У-4.N Руководство по эксплуатации ДЕШК.436747.006 РЭ3 Редакция от 09-06-12 ДЕШК.436747.006 РЭ3 СОДЕРЖАНИЕ 1 ВВЕДЕНИЕ 2 УКАЗАНИЯ МЕР БЕЗОПАСНОСТИ 3 ОПИСАНИЕ УСТРОЙСТВА 3.1 Назначение и условия эксплуатации 3.2 Обозначение и общий вид устройств 3.3 Комплект пост...»

«Александров Вадим Геннадьевич ВЛИЯНИЕ "ТЁПЛОГО ПРЕССОВАНИЯ" И СТЕПЕНИ ЛЕГИРОВАНИЯ НА СТРУКТУРУ И СВОЙСТВА ИЗДЕЛИЙ ИЗ МЕТАЛЛИЧЕСКИХ ПОРОШКОВ 05.16.06 – Порошковая металлургия и композиционные материалы АВТОРЕФЕРАТ диссертации на соискание учёной степени...»

«ПОЛЬЗОВАТЕЛЬСКОЕ СОГЛАШЕНИЕ сервиса "Точка старта"1. ОБЩИЕ ПОЛОЖЕНИЯ 1.1. Общество с ограниченной ответственностью "Бухгалтерские и банковские технологии" (ИНН 7726365491), далее по тексту ООО "ББС", предлага...»

«Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования Пермский национальный исследовательский политехнический университет Гуманитарный факультет Кафедра иностранных языков,...»

«Федеральное агентство по образованию ГОУ ВПО "Уральский государственный технический университет УПИ" Т.В. Мальцева ДИАГРАММА "ЖЕЛЕЗО – УГЛЕРОД" Учебное электронное текстовое издание Подготовлено кафедрой "Металловедение". Научный редактор проф., д-р техн. н...»

«НОУ ВПО "УНИВЕРСИТЕТ УПРАВЛЕНИЯ "ТИСБИ" Набережночелнинский филиал, УТВЕРЖДАЮ Цектор НОУ ВПО "Университет управления "ТИСБИ" Н.М.Прусс ОТЧЕТ О РЕЗУЛЬТАТАХ САМООБСЛЕДОВАНИЯ НАБЕРЕЖНОЧЕЛНИНСКОГО ФИЛИАЛА НЕГОСУДАРСТВЕННОГО ОБРАЗОВАТ...»

«РОССИЙСКИЙ МОРСКОЙ РЕГИСТР СУДОХОДСТВА Электронный аналог печатного издания, утвержденного 19.04.17 Корр. РУКОВОДСТВО ПО ТЕХНИЧЕСКОМУ НАБЛЮДЕНИЮ ЗА ПРОЕКТИРОВАНИЕМ И ПОСТРОЙКОЙ ВСПОМОГАТЕЛЬНЫХ СУДОВ ВОЕННО-МОРСКОГО ФЛОТА РОССИЙСКОЙ ФЕДЕРАЦИИ НД № 2-030101-032 Санкт-...»

«Бюджет г. Барановичи для граждан на 2018 год Оглавление Вступление.. 3 Общая информация.. 4 Бюджетная система республики Беларусь. 8 Бюджет 2018 года.. 9 Бюджет г. Барановичи на 2018 год. 12 Общегосударственная деятельность.. 14 Национальная экономика.. 15 Жилищно-коммунальные услуги и жилищное строите...»




 
2019 www.mash.dobrota.biz - «Бесплатная электронная библиотека - онлайн публикации»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.