Имена клиентов под NDA — публикуем архитектуру, цифры и уроки. Ниже — характерные проекты последних трёх лет.
Монолит на PHP + MySQL обрабатывал 240 RPS на 95-м перцентиле, при пиках падал в 502. Регуляторные требования ЦБ заставляли перейти на отказоустойчивую архитектуру в течение года.
Платформа выдержала чёрную пятницу 2025 без единой деградации. Compliance-аудит пройден с первого раза. Заказчик увеличил retainer на ещё 12 месяцев.
ML-команда обучала модели в Jupyter, выкатывала вручную через scp + перезапуск контейнеров. Откат проблемной модели занимал часы и требовал участия 3-х человек.
Команда стала катить новую версию модели в среднем 2 раза в неделю вместо раза в месяц. Бизнес-метрика основного recsys (CTR) выросла на 14% за квартал.
Падение eu-west-1 в феврале 2024 года стоило заказчику 2 часа downtime и около 14 млн ₽ упущенной выручки. Появилось требование active-active в 3 регионах с RTO < 1 минуты.
Реальный failover произошёл в августе 2024 года при падении eu-west-1 — пользователи не заметили. Compute стоимость снизилась на 73% за счёт спотов.
Команда получала ~340 алертов в неделю через PagerDuty. 78% — false positive. Текучка SRE — 2 человека за полгода.
Алерты сократились до ~22 в неделю, из них 95% — actionable. On-call перестал быть «мучением» — никто не уволился за следующие 6 месяцев.
Платформа на Node.js с одним инстансом Redis падала на 50k параллельных подключений. Сентябрьский пик (старт учебного года) — −400 000 ₽/час из-за оттока учеников.
Платформа без проблем выдержала сентябрьский пик 800k активных учеников. Стоимость на одного активного пользователя снизилась на 41%.
Заказчик имел 220 виртуалок на VMware vSphere, лицензии заканчивались, обновлений и поддержки больше нет. Жёсткие требования по гостайне для части workloads.
Платформа сертифицирована, передана команде заказчика. Стоимость владения за 5 лет на 64% ниже, чем продление VMware-лицензий.
Опишите задачу в письме — пришлём оценку реализуемости и сроков в течение 1 рабочего дня.
Доступ к проектам и дашбордам