Быстрый старт¶
Добро пожаловать! Эта секция поможет вам начать работу с Data Contracts Platform в зависимости от вашей роли.
Выберите свой путь¶
-
Я Producer (издатель данных)
Хочу отправлять данные в платформу
-
Я Consumer (потребитель данных)
Хочу читать данные из платформы
-
Я Data Engineer
Настраиваю Iceberg, партиции, оптимизацию
-
Установка платформы
Разворачиваю инфраструктуру с нуля
Что вам понадобится?¶
Для Producers¶
- Доступ к GitLab репозиторию контрактов
- Python 3.11+ (для локальной валидации)
- mTLS сертификат (выдаёт Data Platform team)
- Базовое понимание Apache Avro
Для Consumers¶
- Доступ к Kafka кластеру
- Доступ к Data Catalog (опционально)
- Понимание контракта данных
- Настроенный Kafka consumer
Для Data Engineers¶
- Доступ к Iceberg каталогу (Gravitino)
- Знание Apache Iceberg + Parquet
- Доступ к S3/HDFS хранилищу
- SQL для Trino/Spark
15-минутный туториал¶
Хотите быстро попробовать? Следуйте этому туториалу:
1. Клонируйте репозиторий¶
2. Установите зависимости¶
3. Создайте контракт¶
4. Отредактируйте contract.yaml¶
metadata:
name: "my_entity"
namespace: "my_domain"
owner:
team: "my-team"
email: "my-team@company.ru"
5. Проверьте контракт¶
6. Создайте MR¶
git checkout -b feat/add-my-entity-contract
git add .
git commit -m "feat: add my_entity contract"
git push -u origin feat/add-my-entity-contract
7. Дождитесь approval и merge¶
CI/CD автоматически: - ✅ Проверит синтаксис - ✅ Обнаружит breaking changes - ✅ Предложит версию - ✅ Задеплоит в Schema Registry
Следующие шаги¶
Углубленное изучение¶
Нужна помощь?¶
- 📧 Email: hello@kruma.io
- 💬 Slack: #data-contracts
- 📚 Troubleshooting