Справочник

Пример SJM — деградация цифрового канала

Учебная SJM-карта для incident-review деградации цифрового канала: наблюдаемый опыт, recovery, defect/RCA/regression слой и вопросы разбора.

Создано 2 июн. 2026 г. Обновлено 5 июн. 2026 г. 3 мин чтения 7 входящих 9 исходящих

Учебная карта для incident-review: приложение или веб-канал частично работает, но критичный сценарий завершается ошибкой или зависшим статусом.

Назначение и границы

Старт: клиент выполняет критичное действие в цифровом канале.
Завершение: сервис восстановлен, клиент понимает статус операции и доступный fallback.
За рамками: конкретная инфраструктура, если она не подтверждена evidence.

Incident-review

Этап	Наблюдаемый опыт клиента	Что проверить внутри сервиса	Recovery	Метрики	Tooling
1. Действие	Клиент отправляет запрос	Канал, интеграции, внешние зависимости	Не создавать дубль при повторе	Error rate, latency	мониторинг, trace, source of truth
2. Ошибка	Клиент получает ошибку или долгий spinner	Классификация ошибки, correlation ID, мониторинг	Понятное сообщение и безопасный retry	Доля ошибок, тайм-ауты	error catalog, alert rules
3. Переход	Клиент ищет другой канал	Передаётся ли контекст в поддержку	Fallback без повторного объяснения	Доля переходов, повторные обращения	CRM, система обращений, база знаний
4. Восстановление	Клиент проверяет итог	Сверка фактического статуса	Уведомление и corrective action	Время восстановления, reopen rate	incident record, change request

Monitoring и change management

Incident-review должен завершаться не только восстановлением, но и обновлением сервисной модели:

добавить или уточнить monitoring-signal;
обновить error catalog и клиентское сообщение;
проверить, нужен ли новый fallback;
обновить базу знаний первой линии;
добавить regression check для критичного сценария;
создать change request, если причина системная;
обновить SJM, если фактический путь отличается от ожидаемого.

Defect / RCA / regression слой

Слой	Что делать после деградации
Defect report	описать симптом, ожидаемый результат, фактический результат, условия, trace id, impact и workaround
RCA	отделить клиентский симптом от первопричины: канал, интеграция, очередь, данные, retry, мониторинг, требование
Regression	добавить проверку, которая воспроизводит критичный отказ или защищает исправленную ветку
Automation	настроить synthetic check, alert, SLA timer check или log query там, где ручная проверка запоздает
SJM update	обновить фактический путь клиента, fallback, KB и escalation path

Вопросы для разбора

Как отличить неуспешный запрос от запроса с неизвестным результатом?
Где находится источник истины по статусу?
Не создаёт ли retry дубль операции?
Есть ли доступный fallback для клиента?
Какие third-party dependencies участвовали в деградации?
Требуется ли обновить SJM после инцидента?
Есть ли alert, который сработал раньше клиентских обращений?
Как поддержка связывает обращение клиента с инцидентом?
Нужен ли новый regression test или synthetic monitoring?

Связанные материалы

Живой сад

Этот текст можно улучшать вместе

Нашёл опечатку?

Выдели фрагмент в заметке и нажми «Сообщить» — откроется короткая форма с контекстом.

Хочешь обсудить?

Ниже можно оставить комментарий через Telegram, когда заметка связана с публикацией канала.

Telegram-комментарии

Добавь `telegramPostId` в публичную заметку, чтобы здесь появился виджет обсуждения.

Эта заметка ведёт к

SJM — governance и lifecycle карты

SJM — Европейский союз

SJM — accessibility и inclusive design

Инциденты операционной надежности

Поддержка сопровождение и инструменты сервиса

Тестирование и качество сервисов

Управление рисками сервисных изменений

Дефекты сервиса и RCA

Автоматизация проверок сервиса

Ссылаются на эту заметку

BPMN — деградация цифрового канала

BPMN — problem management

Service Journey Mapping — индекс

SJM — accessibility и inclusive design

SJM — Европейский союз

SJM в банковских процессах

Управление сервисной моделью — индекс

Сервис-модель и SJM 33 из 47