Заметки из production

Технические статьи команды iTeam: лучшие практики, архитектурные разборы, ретроспективы инцидентов.

Полный гайд по внедрению SLI/SLO/error budgets — от выбора метрик до политик rollout-блокировки.

Замеры скорости провижионинга, поведения при scaling-down, цены и сложности миграции.

Как организовать репозитории, sync waves, secret management и rollback на больших инсталляциях.

Архитектура с Feast + Redis + BigQuery, проверка консистентности и обработка сбоев.

Разбираем плюсы, минусы и сценарии использования двух подходов к организации Terraform-проектов.

Полная конфигурация Vault DB engine с примерами для приложения, K8s и legacy сервисов.

Опыт замены Datadog Agent на vendor-neutral OTel-стек: экономия 4.2 млн ₽/год при тех же возможностях.

Karpenter + spot consolidation + PDB strategy. Реальные цифры и кейс из ритейла.

Разбор реального инцидента 2024 года: 14 минут downtime из-за неаккуратной конфигурации probe.

Подписаться на технический дайджест

Раз в две недели — лучшее из мира DevOps/MLOps. Без воды, без рекламы, без кликбейта.