

Этот курс предназначен для специалистов, которые стремятся освоить управление и мониторинг надежной работы сервисов. Вы научитесь работать с инструментами Prometheus и Grafana, а также разбираться в системе и анализировать созданные графики.
Head of SRE Process в Dodo Engineering
Записи выступлений: доклад на HighLoad++
Начинал карьеру как разработчик .NET и Node.js. В последние два года занимался внедрением культуры SRE в Dodo Engineering и в настоящее время является техническим лидером команды SRE. Спикер таких конференций, как HighLoad, DevOps Live, DevOops и Podlodka Crew.
Курс будет полезен следующим категориям специалистов:
Для успешного освоения курса рекомендуется иметь следующие навыки:
В этом модуле вы познакомитесь с основными подходами к мониторингу, такими как Blackbox и Whitebox. Также будут рассмотрены ключевые метрики: 4 golden signals, RED и USE, которые помогают эффективно отслеживать состояние системы.
Здесь вы научитесь устанавливать и настраивать инструменты мониторинга: Grafana, Prometheus и Alertmanager, которые являются основой для создания эффективных систем мониторинга и оповещений.
Этот модуль даст вам понимание модели данных Prometheus, типов метрик, которые он использует, и особенностей мониторинга задержки (latency) для обеспечения надежности системы.
В данном разделе курса вы освоите язык запросов PromQL, который используется для работы с данными в Prometheus, и научитесь строить сложные запросы для получения необходимых метрик.
Вы создадите свой первый дашборд в Grafana, научившись визуализировать данные и метрики, полученные из Prometheus, чтобы легче отслеживать и анализировать состояние системы.
В этом модуле вы получите полезные советы и рекомендации по работе с Grafana, которые помогут вам более эффективно настроить дашборды и улучшить визуализацию данных.
Вы научитесь различать подходы к оповещениям в Grafana и Prometheus и поймете, какие инструменты лучше подходят для конкретных задач в зависимости от особенностей вашей системы.
Этот модуль посвящен тестированию систем оповещений, где вы узнаете, как проверять настройки и убедиться в правильности работы механизмов оповещений в вашем мониторинге.
Для прохождения курса не требуется специальной подготовки, но будет полезен опыт работы с Docker и понимание основ разработки и системного администрирования.
Нет, курс предназначен как для новичков, так и для опытных специалистов. Мы начнём с основ и постепенно перейдём к более сложным темам.
На курсе будут использоваться Prometheus, Grafana, Alertmanager и другие инструменты для мониторинга и настройки оповещений.
Учебный процесс включает теоретические лекции, практические задания и реальные примеры из индустрии, которые помогут вам применить полученные знания на практике.
Skillbox
4.61