Григорий Кошелев. Нельзя просто так взять и отправить все логи в Elastic


Рассмотрим особенности использования REST API Elastic:

Как повысить утилизацию ресурсов кластера Elastic, что и как влияет на производительность
Особенности хранения логов в Elastic

Детальный разбор высоконагруженного пайплайна с логами поможет лучше понять, как устроен кластер Elastic. А практические советы по индексации больших объёмов данных — не наступать на грабли.

Алексей Колесников. Нет сервера, нет проблем. Как мы делали DataScience на AWS Lambda


AWS Lambda от Amazon достаточно новая, но интересная и перспективная технология, впервые увидевшая свет чуть менее 5 лет назад. В своем докладе я расскажу как мы разрабатывали с нуля и докатили до прода в достаточно короткие сроки систему на базе AWS Lambda.

Основная задача системы — запуск ML моделей для генерации предсказаний по заданным гипотезам. Однако архитектура получилась достаточно гибкая и позволяет расширять набор моделей практически «на лету».
Я расскажу о некоторых особенностях работы с AWS Lambda, а также немного ближе познакомлю с облачными сервисами Amazon (SQS, SNS, EC2, S3, etc.)

Юрий Кербицков. Enterprise Object Storage


Эта история о том, как мы храним документы. О том, как мы прошли путь от кастомного файлового хранилища до объектного хранилища. О том, на какие грабли и вилы мы наступили и какое светлое будущее с объектным хранилищем мы видим и ждём.

А приправлена эта история аспектами эволюции нашей технологической архитектуры, включающей такие технологии как OpenShift, GlusterFS, NFS и другие.

Виктор Еремченко. Отказоустойчивый кластер PostgreSQL Patroni


Я расскажу, как мы комплексно подошли к проблеме отказоустойчивости PostgreSQL, какие варианты мы рассматривали и как остановились на Patroni.

Доклад содержит этапы тестирования этого решения, как мы обеспечили быстрое внедрение на production и с какими проблемами мы столкнулись и как их решали.

Алексей Плетнев. Инструменты для управления рисками при использовании open source в своих проектах


В современном мире разработки ПО сложно представить проект, в состав которого не входили бы компоненты с открытым исходным кодом или open source.

К сожалению, используя их, разработчики мало задумываются о том, что вместе с полезным функционалом они привносят в свой проект все риски и уязвимости, которыми наделены эти компоненты.

Между тем, существует класс инструментов, позволяющих осуществлять управление рисками при использовании компонентов с открытым исходным кодом. С этими инструментами Алексей и хотел бы познакомить слушателей

Кирилл Казарин. Наш опыт работы с Terraform


На докладе разберем что такое Terraform и его возможности, область применения этого инструмента в нашей инфраструктуре, а также какие приемы и практики мы для себя сформулировали в ходе двухлетней эксплуатации

5

Георгий Грибков. Облегчаем процесс разработки с помощью статического анализа кода: наш опыт


Статический анализ кода является очень полезным DevOps-средством, помогающим программистам при разработке крупных (и не только) проектов.

К сожалению, с ним знакомы далеко не все программисты, а те, кто знаком — часто вспоминают их как «старые добрые lintеры».

В своем докладе я покажу, на что на самом деле способен современный статический анализ, а также расскажу о опыте внедрения анализатора в процесс разработки Unreal Engine 4.

Доклад будет полезен программистам всех уровней, руководителям, а также DevOps-специалистам, желающим повысить качество их проектов.

Марат Киньябулатов. Посреди пепелища: пост-мортемы как инструмент непрерывного улучшения


Как выглядит типичный день девопса? С утра, (а лучше перед тем как собрались идти домой), тушим пожары и отдыхаем в перерывах, посреди инфраструктурных руин. Среди такого бешеного графика тяжело найти время для ретроспектив, а без работы над ошибками всё будет еще хуже.

Пост-мортем как инструмент (и процедура) инспекции и адаптации помогает командам предотвращать инциденты в будущем, наглядно показывать менеджменту предпринятые шаги, создает атмосферу безопасности, давая сотрудникам простор улучшать процессы.

Итак, у вас случился (очередной) инфраструктурный (и не только) фейл!

— Какие предпосылки должны быть к проведению пост-мортемов?

— Как будет выглядеть последовательность действий во время митинга?

— Чего ни в коем случае нельзя допускать!

— И что же такое MTTR, MTTD и другие метрики, на которых надо заострять внимание!

Доклад покроет эти темы, опишет где хранить сами пост-мортемы, и на какие тренды в последующих инцидентах надо бы заострить внимание.