Перейти к содержанию

Внутренний глоссарий

Метамодель предметной области#

Определения#

Gateway (Шлюз)#

Веб-сервис, предназначенный для приема и передачи данных в платформу.

Бизнес-сущность#

Ключевой объект предметной области (например, "Договор", "Клиент"), описываемый дата-продуктом.

Версия контракта#

Версия соответствует времени последнего изменения контракта в GitLab. Она синхронизирована с версиями релизов артефактов, сгенерированных на основе этого контракта. Подробнее в документации.

Владелец данных#

Сотрудник организации, отвечающий за управление жизненным циклом и качеством данных. Владеет дата-продуктами.

Дата-контракт#

Стандартизированная форма оферты управления ЖЦ данных, определяющая формат данных, отправляемых издателями в платформу, связи с другими контрактами, политики управления и обеспечения безопасности данных.

Дата-продукт#

Автономный набор данных, готовый к потреблению, включающий структурированную метаинформацию для интеграции и интероперабельности.

Дата-стюард#

Сотрудник платформы, распоряжающийся доверенными ему данными и ответственный за:

  • Классификацию данных
  • Разработку политик работы с данными
  • Взаимодействие с владельцами и потребителями данных для повышения качества данных
  • Формирование единой корпоративной модели данных организации

Домен данных (Бизнес-домен)#

Логическая группа потоков данных, объединенных в рамках одной команды или бизнес-направления.

Издатель#

Команда, владеющая и управляющая одним или несколькими потоками данных в рамках своих бизнес-доменов.

Каталог данных#

Централизованный реестр потоков данных, построенный на метаданных. Позволяет: - Искать и каталогизировать данные - Управлять доступом и изменениями - Отслеживать эволюцию структуры данных

Корпоративная модель данных#

Стандартизированная модель данных предприятия, включающая бизнес-сущности и их связи.

Линедж (Data Lineage)#

Процесс отслеживания происхождения, преобразований и перемещения данных в системе.

Модель данных#

Машинно-читаемое представление дата-контракта в конкретной технологической среде. Может включать: - Avro Schema - Spark DDL - Go-структуры - Другие форматы

Платформа данных#

Инфраструктурно-программный комплекс для сбора, хранения, обработки и использования больших данных, разрабатываемый отделом Data Office

Поток данных (Поток)#

Непрерывный процесс передачи событий в платформу данных.

Потребитель#

Пользователь (система или сотрудник), потребляющий дата-продукт для анализа, отчетности или интеграции.

Продукт#

Бизнес-продукт или сервис компании, принадлежащий бизнес-подразделению.

Событие#

Минимальная единица данных, представляющая ценность для аналитики или бизнес-расчетов. Возникает в результате деятельности компании.

Сообщение#

Набор событий, упакованных в буфер и сериализованных в формате Avro OCF для передачи в платформу.

Спецификация контракта#

Стандарт, регламентирующий: - Структуру контракта - Лексику и семантику языка описания - Правила валидации

Версия спецификации указывается в поле specification контракта. Машиночитаемая версия хранится вместе с тулингом и соответствует версии его релизов. Подробнее в спецификации.

Тулинг#

Набор инструментов для работы с контрактами. Ключевые возможности для издателя включают:

  • Линтер для валидации
  • Генератор Avro Schema
  • Генераторы заготовок контрактов из различных форматов