zhub.link is one of the many independent Mastodon servers you can use to participate in the fediverse.

Administered by:

Server stats:

28
active users

#prometheus

0 posts0 participants0 posts today
Habr 25+<p>Почему observability — это не только Grafana и Prometheus</p><p>Вы видите красивые графики в Grafana, алерты настроены, метрики собираются — значит, все под контролем? На самом деле, нет. Когда в продакшене что-то пойдет не так, Prometheus покажет скачок latency, но не объяснит, почему это произошло. Логи могут не содержать нужных данных. Трейсов нет. Итог — часы расследования, хаотичные гипотезы, поиски иголки в стоге сена. Observability — одно из тех модных слов, которые часто понимают неправильно. Для многих оно сводится к связке Grafana + Prometheus, не более. Однако в реальных системах наблюдаемость (observaбыстроbility) — это больше, чем просто красивые дашборды с метриками. В этой статье разберемся, почему классический стек не покрывает все задачи, какие альтернативы есть на рынке и как построить современный observability-стек.</p><p><a href="https://habr.com/ru/companies/selectel/articles/885890/?utm_source=habrahabr&amp;utm_medium=rss&amp;utm_campaign=885890" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/selectel</span><span class="invisible">/articles/885890/?utm_source=habrahabr&amp;utm_medium=rss&amp;utm_campaign=885890</span></a></p><p><a href="https://zhub.link/tags/selectel" class="mention hashtag" rel="tag">#<span>selectel</span></a> <a href="https://zhub.link/tags/observability" class="mention hashtag" rel="tag">#<span>observability</span></a> <a href="https://zhub.link/tags/grafana" class="mention hashtag" rel="tag">#<span>grafana</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a></p>
Habr<p>Почему observability — это не только Grafana и Prometheus</p><p>Вы видите красивые графики в Grafana, алерты настроены, метрики собираются — значит, все под контролем? На самом деле, нет. Когда в продакшене что-то пойдет не так, Prometheus покажет скачок latency, но не объяснит, почему это произошло. Логи могут не содержать нужных данных. Трейсов нет. Итог — часы расследования, хаотичные гипотезы, поиски иголки в стоге сена. Observability — одно из тех модных слов, которые часто понимают неправильно. Для многих оно сводится к связке Grafana + Prometheus, не более. Однако в реальных системах наблюдаемость (observaбыстроbility) — это больше, чем просто красивые дашборды с метриками. В этой статье разберемся, почему классический стек не покрывает все задачи, какие альтернативы есть на рынке и как построить современный observability-стек.</p><p><a href="https://habr.com/ru/companies/selectel/articles/885890/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/selectel</span><span class="invisible">/articles/885890/</span></a></p><p><a href="https://zhub.link/tags/selectel" class="mention hashtag" rel="tag">#<span>selectel</span></a> <a href="https://zhub.link/tags/observability" class="mention hashtag" rel="tag">#<span>observability</span></a> <a href="https://zhub.link/tags/grafana" class="mention hashtag" rel="tag">#<span>grafana</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a></p>
Habr<p>Отключение http-метрик в ASP.NET Core</p><p>Выход ASP.NET Core 9 порадовал возможностью выборочно отключать http-метрики. В статье сценарии использования с примерами и детальный разбор того, как всё устроено под капотом. Хочу разобраться</p><p><a href="https://habr.com/ru/articles/880738/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/880738/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/c" class="mention hashtag" rel="tag">#<span>c</span></a># <a href="https://zhub.link/tags/net" class="mention hashtag" rel="tag">#<span>net</span></a> <a href="https://zhub.link/tags/net_9" class="mention hashtag" rel="tag">#<span>net_9</span></a> <a href="https://zhub.link/tags/aspnet" class="mention hashtag" rel="tag">#<span>aspnet</span></a> <a href="https://zhub.link/tags/aspnet_core" class="mention hashtag" rel="tag">#<span>aspnet_core</span></a> <a href="https://zhub.link/tags/aspnet_webapi" class="mention hashtag" rel="tag">#<span>aspnet_webapi</span></a> <a href="https://zhub.link/tags/webapi" class="mention hashtag" rel="tag">#<span>webapi</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA%D0%B8" class="mention hashtag" rel="tag">#<span>метрики</span></a> <a href="https://zhub.link/tags/metrics" class="mention hashtag" rel="tag">#<span>metrics</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a></p>
Habr<p>Observability vs Monitoring: почему в 2025 году это две стороны одной медали</p><p>Сегодня обсудим разницу между мониторингом и наблюдаемостью (observability), а также их значение для современных распределенных ИТ-систем. Если ваша инфраструктура поддерживает сложные сервисы или работает в условиях постоянно растущей нагрузки, вы, вероятно, уже задумывались о необходимости видеть полную картину происходящего в реальном времени. Мы расскажем, почему в 2025 году мониторинг и наблюдаемость стали двумя сторонами одной медали, и как эти подходы помогают предотвращать сбои, анализировать проблемы и повышать надежность систем.</p><p><a href="https://habr.com/ru/companies/monq/articles/878278/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/monq/art</span><span class="invisible">icles/878278/</span></a></p><p><a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#<span>мониторинг</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3_%D1%81%D0%B5%D1%80%D0%B2%D0%B5%D1%80%D0%B0" class="mention hashtag" rel="tag">#<span>мониторинг_сервера</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3_%D1%81%D0%B5%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>мониторинг_сети</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3_%D0%BB%D0%BE%D0%B3%D0%BE%D0%B2" class="mention hashtag" rel="tag">#<span>мониторинг_логов</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3_%D0%B6%D1%83%D1%80%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2" class="mention hashtag" rel="tag">#<span>мониторинг_журналов</span></a> <a href="https://zhub.link/tags/zabbix" class="mention hashtag" rel="tag">#<span>zabbix</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%B0%D0%B1%D0%BB%D1%8E%D0%B4%D0%B0%D0%B5%D0%BC%D0%BE%D1%81%D1%82%D1%8C" class="mention hashtag" rel="tag">#<span>наблюдаемость</span></a> <a href="https://zhub.link/tags/observability" class="mention hashtag" rel="tag">#<span>observability</span></a></p>
Heapy<p>Followed up with a <a href="https://mendeddrum.org/tags/prometheus" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>prometheus</span></a> alert for 6pm the night before with a handy reminder</p>
Heapy<p>Made my own WHEN IS BINS exporter, with blackjack and...</p><p><a href="https://mendeddrum.org/tags/python" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>python</span></a> <a href="https://mendeddrum.org/tags/prometheus" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>prometheus</span></a></p>
Habr<p>«База» по метрикам в Prometheus</p><p>Привет, Хабр! Меня зовут Глеб Типсин, я являюсь ведущим разработчиком продукта «Системы персонализации и геймификации» в SM Lab. В этой статье мы разберём, как устроены метрики в Prometheus, как происходит их сбор, а также что с ними можно делать. Кроме того, обсудим подходы в мониторинге, архитектуру Prometheus и её ограничения. Материал подойдёт тем, кто только знакомится с мониторингом и хочет освоить «базу», а также тем, кто уже работает с Prometheus , но хочет &quot;освежить&quot; свои знания и узнать что-то новое.</p><p><a href="https://habr.com/ru/companies/sportmaster_lab/articles/872204/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/sportmas</span><span class="invisible">ter_lab/articles/872204/</span></a></p><p><a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#<span>мониторинг</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3_%D0%BF%D1%80%D0%BE%D0%B8%D0%B7%D0%B2%D0%BE%D0%B4%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8" class="mention hashtag" rel="tag">#<span>мониторинг_производительности</span></a> <a href="https://zhub.link/tags/prometheus_grafana" class="mention hashtag" rel="tag">#<span>prometheus_grafana</span></a> <a href="https://zhub.link/tags/monitoring" class="mention hashtag" rel="tag">#<span>monitoring</span></a> <a href="https://zhub.link/tags/promql" class="mention hashtag" rel="tag">#<span>promql</span></a></p>
Habr<p>[Перевод] Метрики оценки LLM: полное руководство по оценке LLM</p><p>Независимо от того, улучшаете ли вы точность модели путем дообучения или улучшаете контекстную релевантность системы генерации с дополненной выборкой (RAG), понимание того, как разрабатывать и выбирать подходящий набор метрик оценки LLM для вашего варианта использования, является обязательным для построения надежного конвейера оценки LLM. В этой статье вы научитесь всему, что нужно знать о метриках оценки LLM, включая примеры кода. Мы рассмотрим следующие вопросы: Что такое метрики оценки LLM , как их можно использовать для оценки систем LLM , а также распространенные ошибки и что делает метрики отличными. Различные методы вычисления метрик оценки LLM и почему подход LLM-as-a-judge («LLM как судья») является наиболее эффективным. Как реализовать и выбрать подходящий набор метрик оценки LLM с использованием библиотеки DeepEval ( GitHub: DeepEval ).</p><p><a href="https://habr.com/ru/articles/873332/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/873332/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/llm" class="mention hashtag" rel="tag">#<span>llm</span></a> <a href="https://zhub.link/tags/rag" class="mention hashtag" rel="tag">#<span>rag</span></a> <a href="https://zhub.link/tags/BLEU" class="mention hashtag" rel="tag">#<span>BLEU</span></a> <a href="https://zhub.link/tags/ROUGE" class="mention hashtag" rel="tag">#<span>ROUGE</span></a> <a href="https://zhub.link/tags/METEOR" class="mention hashtag" rel="tag">#<span>METEOR</span></a> <a href="https://zhub.link/tags/GEval" class="mention hashtag" rel="tag">#<span>GEval</span></a> <a href="https://zhub.link/tags/Prometheus" class="mention hashtag" rel="tag">#<span>Prometheus</span></a> <a href="https://zhub.link/tags/GPT_OpenAI" class="mention hashtag" rel="tag">#<span>GPT_OpenAI</span></a> <a href="https://zhub.link/tags/bertscore" class="mention hashtag" rel="tag">#<span>bertscore</span></a> <a href="https://zhub.link/tags/moverscore" class="mention hashtag" rel="tag">#<span>moverscore</span></a></p>
Habr<p>Конфигурирование алертов prometheus или как мы настраивали алерты для бизнес-метрик</p><p>В статье расскажу, как настроить мониторинг Apache NiFi и алерты при переполнении очереди по достижении 8000 FlowFiles. Зачем вам читать эту статью? Переполнение очереди FlowFiles в Apache NiFi может привести к замедлению или остановке обработки данных, мониторинг позволит своевременно среагировать на проблемы с производительностью и выявить узкие места.</p><p><a href="https://habr.com/ru/articles/873082/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/873082/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/prometheus_monitoring" class="mention hashtag" rel="tag">#<span>prometheus_monitoring</span></a> <a href="https://zhub.link/tags/apache" class="mention hashtag" rel="tag">#<span>apache</span></a> <a href="https://zhub.link/tags/alert" class="mention hashtag" rel="tag">#<span>alert</span></a> <a href="https://zhub.link/tags/monitoring" class="mention hashtag" rel="tag">#<span>monitoring</span></a> <a href="https://zhub.link/tags/devops" class="mention hashtag" rel="tag">#<span>devops</span></a> <a href="https://zhub.link/tags/apache_nifi" class="mention hashtag" rel="tag">#<span>apache_nifi</span></a> <a href="https://zhub.link/tags/FlowFiles" class="mention hashtag" rel="tag">#<span>FlowFiles</span></a></p>
Habr<p>Автоматизация мониторинга в НЛМК: от агрегации данных и ML до инцидент-менеджмента</p><p>Привет, Хабр! Простая истина: когда какой-то элемент инфраструктуры или бизнес-сервис простаивает, то компания несёт потери. Чем понятнее текущее состояние ИТ, тем быстрее можно реагировать на возникающие проблемы и не допускать простоев. Для этого, конечно, нужен мониторинг. Рассказываем, какой концептуальный подход к мониторингу мы применяем в команде НЛМК ИТ и как идёт один из наших проектов по внедрению зонтичного мониторинга и автоматизации на базе российской платформы Monq. Читать всем, кто хочет агрегировать данные из различных инструментов мониторинга в одном месте и автоматизировать управление этими данными.</p><p><a href="https://habr.com/ru/companies/nlmk/articles/867800/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/nlmk/art</span><span class="invisible">icles/867800/</span></a></p><p><a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#<span>мониторинг</span></a> <a href="https://zhub.link/tags/monq" class="mention hashtag" rel="tag">#<span>monq</span></a> <a href="https://zhub.link/tags/zabbix" class="mention hashtag" rel="tag">#<span>zabbix</span></a> <a href="https://zhub.link/tags/grafana" class="mention hashtag" rel="tag">#<span>grafana</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/devops" class="mention hashtag" rel="tag">#<span>devops</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%BD%D1%86%D0%B8%D0%B4%D0%B5%D0%BD%D1%82%D0%BC%D0%B5%D0%BD%D0%B5%D0%B4%D0%B6%D0%BC%D0%B5%D0%BD%D1%82" class="mention hashtag" rel="tag">#<span>инцидентменеджмент</span></a> <a href="https://zhub.link/tags/%D1%81%D0%B8%D1%82%D1%83%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D1%86%D0%B5%D0%BD%D1%82%D1%80" class="mention hashtag" rel="tag">#<span>ситуационный_центр</span></a> <a href="https://zhub.link/tags/%D0%BD%D0%BB%D0%BC%D0%BA" class="mention hashtag" rel="tag">#<span>нлмк</span></a></p>
Habr<p>Как внедрить наблюдаемость в микросервисное приложение с помощью OpenTelemetry, Jaeger и Prometheus</p><p>Современные веб-приложения всё чаще строятся по микросервисной архитектуре. Это даёт гибкость, масштабируемость и изоляцию компонент, но одновременно усложняет отладку, мониторинг и понимание работы системы в целом. Что, если один из сервисов начинает работать медленнее? Как понять, где в цепочке запросов «узкое место»? Как быстро определить причину сбоя или деградации производительности? Здесь на сцену выходит концепция наблюдаемости (observability). Идея заключается в том, чтобы собрать метрики, логи и трассировки из всех компонентов системы, связать их воедино, и получить чёткую картину того, что происходит внутри распределённого приложения. Для этого существуют современные инструменты.</p><p><a href="https://habr.com/ru/articles/865288/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/865288/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/Prometheus" class="mention hashtag" rel="tag">#<span>Prometheus</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B8%D0%BA%D1%80%D0%BE%D1%81%D0%B5%D1%80%D0%B2%D0%B8%D1%81%D1%8B" class="mention hashtag" rel="tag">#<span>микросервисы</span></a> <a href="https://zhub.link/tags/Nodejs" class="mention hashtag" rel="tag">#<span>Nodejs</span></a> <a href="https://zhub.link/tags/DevOps" class="mention hashtag" rel="tag">#<span>DevOps</span></a> <a href="https://zhub.link/tags/%D1%82%D1%80%D0%B0%D1%81%D1%81%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B8" class="mention hashtag" rel="tag">#<span>трассировки</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA%D0%B8" class="mention hashtag" rel="tag">#<span>метрики</span></a> <a href="https://zhub.link/tags/%D1%82%D0%B5%D0%BB%D0%B5%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%8F" class="mention hashtag" rel="tag">#<span>телеметрия</span></a></p>
Habr<p>IMPulse — наш взгляд на менеджмент инцидентов</p><p>Если ваша компания всё ещё не использует средства для менеджмента инцидентов, а утопает в обычных алертах из Alertmanager&#39;а, эта статья для вас. Если ваша компания из-за санкций или соображений безопасности не может отправлять алерты в зарубежные системы менеджмента инцидентов, эта статья для вас. Если вы DevOps и уже изрядно намучились с поиском подобного решения (как я) - статья и для вас тоже. В статье мы презентуем наше open source решение для работы с алертами. Приглашаю всех заинтересованных под кат.</p><p><a href="https://habr.com/ru/articles/865208/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/865208/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/grafana_oncall" class="mention hashtag" rel="tag">#<span>grafana_oncall</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/alertmanager" class="mention hashtag" rel="tag">#<span>alertmanager</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#<span>мониторинг</span></a> <a href="https://zhub.link/tags/monitoring" class="mention hashtag" rel="tag">#<span>monitoring</span></a> <a href="https://zhub.link/tags/kiss" class="mention hashtag" rel="tag">#<span>kiss</span></a> <a href="https://zhub.link/tags/alert" class="mention hashtag" rel="tag">#<span>alert</span></a> <a href="https://zhub.link/tags/incident" class="mention hashtag" rel="tag">#<span>incident</span></a> <a href="https://zhub.link/tags/%D0%B8%D0%BD%D1%86%D0%B8%D0%B4%D0%B5%D0%BD%D1%82%D0%BC%D0%B5%D0%BD%D0%B5%D0%B4%D0%B6%D0%BC%D0%B5%D0%BD%D1%82" class="mention hashtag" rel="tag">#<span>инцидентменеджмент</span></a></p>
Habr<p>11 скриптов автоматизации для автоматизации конфигурации Prometheus</p><p>Работа с Prometheus полита потом и кровью ручной работы. У себя в телеграм-канале monitorim_it публикую много статей про мониторинг, но эти скрипты туда не помещаются, поэтому публикую их здесь. Открывая эту статью вы подтверждаете, что умело пользуетесь Prometheus и знаете как он работает.</p><p><a href="https://habr.com/ru/articles/863920/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/863920/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/monitoring" class="mention hashtag" rel="tag">#<span>monitoring</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%BE%D0%BD%D0%B8%D1%82%D0%BE%D1%80%D0%B8%D0%BD%D0%B3" class="mention hashtag" rel="tag">#<span>мониторинг</span></a> <a href="https://zhub.link/tags/%D0%B0%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F" class="mention hashtag" rel="tag">#<span>автоматизация</span></a></p>
Habr<p>Мониторинг ipsec strongSwan</p><p>Всем привет! Работая DevOps-инженером, я задумался о мониторинге IPsec-туннелей, которых у нас уже накопилось достаточно. Они в основном используются для связи между облаками, так как инфраструктура разнесена — например, dev и prod живут у разных облачных провайдеров. Также есть интеграции со сторонними организациями, кластеры Kubernetes в AWS, GCP и т.д. Основная цель — получать алерты о падении туннеля раньше, чем сработают алерты о недоступности сервисов. Это особенно важно, поскольку Prometheus у нас один, он живёт в одном из облаков, а prometheus-stack в Kubernetes-кластерах работают в режиме агентов. Первая проблема - выбор экспортера или разработка своего Изначально наткнулся на экспортер от dennisstritzke , но проект уже архивный, последний релиз датируется сентябрем 2021 года, в README автор рекомендует использовать более свежий и поддерживаемый экспортер . Однако он использует VICI , соответственно необходима миграция с более старого подхода конфигурирования с помощью ipsec.conf на swanctl.conf. В документации есть подробное описание , и даже ссылка на скрипт-конвертор . Но зачем ломать то, что уже работает, пусть даже и deprecated? В итоге написал свой python скрипт, который дергает ipsec status, парсит вывод и формирует необходимые мне метрики для Prometheus.</p><p><a href="https://habr.com/ru/articles/862506/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/862506/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/ipsec" class="mention hashtag" rel="tag">#<span>ipsec</span></a> <a href="https://zhub.link/tags/strongswan" class="mention hashtag" rel="tag">#<span>strongswan</span></a></p>
Habr<p>Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик</p><p>Привет, Хабр! Меня зовут Станислав Савостин, в СберТехе я занимаюсь системой мониторинга «Маяк». Это наш внутренний сервис, который основан на Prometheus, но включает много доработок и «тюнинга» под наши условия и стандарты работы. Основная задача мониторинга — быстро выявить проблему (до того, как что‑то упало) и отреагировать, чтобы пользователи не заметили. Из‑за высокого темпа уведомлений и реакций часто возникает риск пойти по неправильному сценарию. Например, перезагрузка брокера Kafka или Artemis занимает около 30 секунд, поэтому упустить такую ситуацию легко, хотя для нас это критически важная метрика. Ложная тревога или задержка передачи метрик — максимально неприятные события, так что мы постоянно дорабатываем систему и уже научились отслеживать перезагрузки сервисов. Я расскажу, как мы дорабатывали мониторинг, как реагируем на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!»</p><p><a href="https://habr.com/ru/companies/sberbank/articles/856074/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/sberbank</span><span class="invisible">/articles/856074/</span></a></p><p><a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/%D1%81%D0%B1%D0%BE%D1%80_%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA" class="mention hashtag" rel="tag">#<span>сбор_метрик</span></a></p>
Habr<p>[Перевод] Как мы переехали с StatsD на Prometheus всего за месяц</p><p>Недавно мы мигрировали все метрики нашей инфраструктуры со StatsD на Prometheus и очень довольны результатами. Миграция потребовала огромных усилий, и мы многому научились в процессе. Этот пост призван пролить свет на то, почему мы перешли на Prometheus, а также описать некоторые технические сложности, с которыми мы столкнулись. Метрики — настолько важный и повсеместный компонент в современных распределенных системах, что легко забыть, что популярные протоколы метрик с открытым исходным кодом начали появляться только в последнее десятилетие.</p><p><a href="https://habr.com/ru/articles/854666/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/854666/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/statsd" class="mention hashtag" rel="tag">#<span>statsd</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a></p>
Habr<p>Zabbix vs Prometheus. Что выбрать для гетерогенной инфраструктуры?</p><p>Разберемся в преимуществах и недостатках каждой системы, а также настроим мониторинг гетерогенной Linux-Windows инфраструктуры средствами централизованного управления. Давайте разбираться</p><p><a href="https://habr.com/ru/articles/852394/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/852394/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/monitoring" class="mention hashtag" rel="tag">#<span>monitoring</span></a> <a href="https://zhub.link/tags/zabbix" class="mention hashtag" rel="tag">#<span>zabbix</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/ansible" class="mention hashtag" rel="tag">#<span>ansible</span></a> <a href="https://zhub.link/tags/grafana" class="mention hashtag" rel="tag">#<span>grafana</span></a> <a href="https://zhub.link/tags/grafana%D0%B4%D0%B0%D1%88%D0%B1%D0%BE%D1%80%D0%B4" class="mention hashtag" rel="tag">#<span>grafanaдашборд</span></a></p>
Habr<p>[Перевод] Как снизить расходы на мониторинг: замена Prometheus на VictoriaMetrics</p><p>Мониторинг может оказаться дорогим делом из-за огромных объемов данных, которые необходимо обрабатывать. В этой статье вы узнаете о лучших способах хранения и обработки метрик мониторинга для снижения расходов и о том, как VictoriaMetrics может в этом помочь. (cм. вторую статью из этой серии — Как снизить расходы на мониторинг: более разумный подход к данным .)</p><p><a href="https://habr.com/ru/articles/850990/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/850990/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/victoriametrics" class="mention hashtag" rel="tag">#<span>victoriametrics</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a></p>
Habr<p>Про наглого клиента, или мониторинг borg backup в prometheus на коленке</p><p>Есть у меня один сервер в облаке hetzner, с него нужно было делать бекап на storage box, есть у хетцнера такое онлайн-хранилище. Storage box поддерживает соединение по 22 и 23 портам (это важно для дальнейшего повествования)</p><p><a href="https://habr.com/ru/articles/850422/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="">habr.com/ru/articles/850422/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/borg" class="mention hashtag" rel="tag">#<span>borg</span></a> <a href="https://zhub.link/tags/borgbackup" class="mention hashtag" rel="tag">#<span>borgbackup</span></a> <a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/bash" class="mention hashtag" rel="tag">#<span>bash</span></a> <a href="https://zhub.link/tags/backup" class="mention hashtag" rel="tag">#<span>backup</span></a> <a href="https://zhub.link/tags/hetzner" class="mention hashtag" rel="tag">#<span>hetzner</span></a> <a href="https://zhub.link/tags/ssh" class="mention hashtag" rel="tag">#<span>ssh</span></a></p>
Habr<p>Потребление ресурсов в Prometheus: кто виноват и что делать (обзор и видео доклада)</p><p>У Prometheus есть серьёзный недостаток — чрезмерное потребление ресурсов. Проблема может заключаться в недостаточном понимании инструмента и его неверном использовании. А Prometheus требует грамотного управления метриками и лейблами. В своем докладе технический директор Deckhouse Observability Platform Владимир Гурьянов выяснил, кто виноват в этом и что делать.</p><p><a href="https://habr.com/ru/companies/flant/articles/848968/" target="_blank" rel="nofollow noopener noreferrer" translate="no"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/flant/ar</span><span class="invisible">ticles/848968/</span></a></p><p><a href="https://zhub.link/tags/prometheus" class="mention hashtag" rel="tag">#<span>prometheus</span></a> <a href="https://zhub.link/tags/tsdb" class="mention hashtag" rel="tag">#<span>tsdb</span></a> <a href="https://zhub.link/tags/monitoring" class="mention hashtag" rel="tag">#<span>monitoring</span></a> <a href="https://zhub.link/tags/devops" class="mention hashtag" rel="tag">#<span>devops</span></a> <a href="https://zhub.link/tags/devopsconf" class="mention hashtag" rel="tag">#<span>devopsconf</span></a> <a href="https://zhub.link/tags/deckhouse" class="mention hashtag" rel="tag">#<span>deckhouse</span></a> <a href="https://zhub.link/tags/%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA%D0%B8" class="mention hashtag" rel="tag">#<span>метрики</span></a> <a href="https://zhub.link/tags/%D0%BF%D0%BE%D1%82%D1%80%D0%B5%D0%B1%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D1%80%D0%B5%D1%81%D1%83%D1%80%D1%81%D0%BE%D0%B2" class="mention hashtag" rel="tag">#<span>потребление_ресурсов</span></a> <a href="https://zhub.link/tags/lables" class="mention hashtag" rel="tag">#<span>lables</span></a> <a href="https://zhub.link/tags/mimirtool" class="mention hashtag" rel="tag">#<span>mimirtool</span></a></p>