Внутренний глоссарий
Метамодель предметной области#
Определения#
Gateway (Шлюз)#
Веб-сервис, предназначенный для приема и передачи данных в платформу.
Бизнес-сущность#
Ключевой объект предметной области (например, "Договор", "Клиент"), описываемый дата-продуктом.
Версия контракта#
Версия соответствует времени последнего изменения контракта в GitLab. Она синхронизирована с версиями релизов артефактов, сгенерированных на основе этого контракта. Подробнее в документации.
Владелец данных#
Сотрудник организации, отвечающий за управление жизненным циклом и качеством данных. Владеет дата-продуктами.
Дата-контракт#
Стандартизированная форма оферты управления ЖЦ данных, определяющая формат данных, отправляемых издателями в платформу, связи с другими контрактами, политики управления и обеспечения безопасности данных.
Дата-продукт#
Автономный набор данных, готовый к потреблению, включающий структурированную метаинформацию для интеграции и интероперабельности.
Дата-стюард#
Сотрудник платформы, распоряжающийся доверенными ему данными и ответственный за:
- Классификацию данных
- Разработку политик работы с данными
- Взаимодействие с владельцами и потребителями данных для повышения качества данных
- Формирование единой корпоративной модели данных организации
Домен данных (Бизнес-домен)#
Логическая группа потоков данных, объединенных в рамках одной команды или бизнес-направления.
Издатель#
Команда, владеющая и управляющая одним или несколькими потоками данных в рамках своих бизнес-доменов.
Каталог данных#
Централизованный реестр потоков данных, построенный на метаданных. Позволяет: - Искать и каталогизировать данные - Управлять доступом и изменениями - Отслеживать эволюцию структуры данных
Корпоративная модель данных#
Стандартизированная модель данных предприятия, включающая бизнес-сущности и их связи.
Линедж (Data Lineage)#
Процесс отслеживания происхождения, преобразований и перемещения данных в системе.
Модель данных#
Машинно-читаемое представление дата-контракта в конкретной технологической среде. Может включать: - Avro Schema - Spark DDL - Go-структуры - Другие форматы
Платформа данных#
Инфраструктурно-программный комплекс для сбора, хранения, обработки и использования больших данных, разрабатываемый отделом Data Office
Поток данных (Поток)#
Непрерывный процесс передачи событий в платформу данных.
Потребитель#
Пользователь (система или сотрудник), потребляющий дата-продукт для анализа, отчетности или интеграции.
Продукт#
Бизнес-продукт или сервис компании, принадлежащий бизнес-подразделению.
Событие#
Минимальная единица данных, представляющая ценность для аналитики или бизнес-расчетов. Возникает в результате деятельности компании.
Сообщение#
Набор событий, упакованных в буфер и сериализованных в формате Avro OCF для передачи в платформу.
Спецификация контракта#
Стандарт, регламентирующий: - Структуру контракта - Лексику и семантику языка описания - Правила валидации
Версия спецификации указывается в поле specification контракта. Машиночитаемая версия хранится вместе с тулингом и соответствует версии его релизов. Подробнее в спецификации.
Тулинг#
Набор инструментов для работы с контрактами. Ключевые возможности для издателя включают:
- Линтер для валидации
- Генератор Avro Schema
- Генераторы заготовок контрактов из различных форматов