Марат Киньябулатов. Посреди пепелища: пост-мортемы как инструмент непрерывного улучшения
Как выглядит типичный день девопса? С утра, (а лучше перед тем как собрались идти домой), тушим пожары и отдыхаем в перерывах, посреди инфраструктурных руин. Среди такого бешеного графика тяжело найти время для ретроспектив, а без работы над ошибками всё будет еще хуже.
Пост-мортем как инструмент (и процедура) инспекции и адаптации помогает командам предотвращать инциденты в будущем, наглядно показывать менеджменту предпринятые шаги, создает атмосферу безопасности, давая сотрудникам простор улучшать процессы.
Итак, у вас случился (очередной) инфраструктурный (и не только) фейл!
— Какие предпосылки должны быть к проведению пост-мортемов?
— Как будет выглядеть последовательность действий во время митинга?
— Чего ни в коем случае нельзя допускать!
— И что же такое MTTR, MTTD и другие метрики, на которых надо заострять внимание!
Доклад покроет эти темы, опишет где хранить сами пост-мортемы, и на какие тренды в последующих инцидентах надо бы заострить внимание.