На главную

Есть деградация одной системы.

Uptime за 90 дней — 99.62%. Обновляется каждые 60 секунд.

Сервисы

  • API

    Все системы работают
  • AB.AI Model (inference)

    Все системы работают
  • Дашборд

    Все системы работают
  • Биометрия (Face ID)

    Все системы работают
  • ЭДО + ЭЦП НКАLayer

    Замедленный отклик НКАLayer · мониторим

    Замедление
  • Push-уведомления

    Все системы работают

90 дней

Каждый день — отдельный столбец. Серое — ОК, жёлтое — деградация, красное — простой.

Инциденты

С post-mortem. Учимся на каждой ошибке публично.

  1. Degraded

    Замедление ответов AB.AI Model на 24 минуты

    Скачок нагрузки на GPU-кластер в Алматинском дата-центре. Latency вырос с <200мс до 1.4с. Автомасштабирование сработало с задержкой 14 мин.

    Что сделали: Увеличили резерв instances. Tune autoscaler thresholds.

  2. Down

    Сбой авторизации (Supabase)

    Региональный сбой Supabase Cloud в Европе. AB.AI Auth не отвечал 8 минут — пользователи не могли войти. Активные сессии работали без перебоев.

    Что сделали: Мигрировали Auth на резервный регион. Добавили failover на Astana ДЦ — Q3 2026.

Получать уведомления об инцидентах