СервисыТехнология

Datadog: краткий обзор платформы для мониторинга

Автор: PlaysDev
Опубликовано: 21.11.2023

Тенденция усложнения систем и приложений стимулирует внедрение более эффективных инструментов мониторинга. В этом контексте Datadog выделяется как мощный и универсальный инструмент.

В чем основные особенности Datadog и почему в мире опенсорса и бесплатного ПО выбирают именно этот платный SaaS мониторинг? Давайте разбираться.

Мы выделили следующие факторы:

  • цена,
  • масштабируемость,
  • UI и удобство использования,
  • функциональность,
  • возможность кастомизации,
  • прогнозируемое использование,
  • простота развертывания

Начнем с тех. возможностей Datadog, благодаря которым он остается в топе инструментов мониторинга уже не первый год, а также проведем небольшое сравнение со стеком Prometheus-Loki-Grafana.

Легок в первоначальной настройке (низкий порог входа)

Для мониторинга достаточно установить агента на хост и/или подключить библиотеку в приложении. Юзер-френдли интерфейс и дашборды с основными метриками сэкономят огромное количество времени на первоначальном этапе.

Более того, Datadog имеет упрощенную интеграцию с Microsoft Azure, что делает его еще более привлекательным, по сравнению, например, с Prometheus-Loki-Grafana, которые необходимо первоначально сконфигурировать для совместной работы, а также дополнительно подключать и конфигурировать экспортеры.

Позволяет создавать дашборды для приложений, сред и кастомных метрик в одной панели

Виджеты с возможностью перетаскивания дают возможность создать собственные представления без необходимости написания кода. Набор инструментов визуализации позволяет просматривать данные в различных форматах, а также создавать отчеты.

Основным преимуществом здесь является простота создания запросов, в отличие от Prometheus, в Datadog все быстро и легко настраивается через UI (зачастую датадог даже сам предлагает тебе потенциальные запросы, или метрики уже выдают тебе нужную вещь, как например cpu_usage метрика — она возвращает уже долю использованного CPU).

Мониторинг баз данных

Datadog Database Monitoring поддерживает self-hosted и облачные версии Postgres, MySQL, Oracle и SQL Server. Дашборд «Метрики запроса» показывает историческую производительность нормализованных запросов. Есть возможность визуализации тенденции производительности с помощью инфраструктуры или пользовательских тегов, таких как зона доступности центра обработки данных, а также оповещения в случае аномалий.

Также Datadog поддерживает такой функционал, как:

  • определение запросов, которые занимают больше всего времени,
  • отслеживание метрик уровня базы данных, не фиксируемые APM, например обновленные/возвращенные строки,
  • фильтрация и группировка запросов по произвольным параметрам, таким как команда, пользователь, кластер и хост
  • выявление необычно медленных, но редких запросов, не фиксируемые метриками,
  • присвоение выполнения конкретного запроса пользователю, приложению или узлу клиента.

Datadog позволяет мониторить облачные версии БД, чего не может PLG (приходится отдельно использовать такие сервисы, как AWS CloudWatch или Azure Monitor).

Serverless stack monitoring

Datadog предоставляет решения для мониторинга AWS Lambda, Azure App Service, Azure Container Apps, and Google Cloud Run с такими возможностями как:

  • Оповещения в режиме реального времени о показателях памяти, тайм-аута и параллелизма, чтобы избежать ухудшения качества обслуживания конечных пользователей,
  • отслеживание вызовов микросервисов для обеспечения сквозной видимости запросов клиентов,
  • визуализация распределенных микросервисов на карте сервисов и разбивка их по таким тегам, как функция, клиент, версия и т. д.,
  • прием и анализ 100 % следов, действующих за последние 15 минут,
  • изоляция отдельного запроса клиента и переход к связанным логам и показателям для получения полной истории,
  • мониторинг аномалий, выбросов и прогнозирования на основе машинного обучения

k8s мониторинг

Этот пункт нельзя не отметить, так как Datadog интегрирован с Kubernetes, Docker, сontainerd и Istio, что позволяет:

  • собирать метрики, события и логи из компонентов кластера, подов и других объектов Kubernetes,
  • собирать метрики на уровне контейнера для детальной разбивки ресурсов (на уровне docker и containerd),
  • автоматически отслеживать узлы кластеров Kubernetes с помощью агента Datadog,
  • отслеживать развертываемые вами технологии,
  • APM и распределенная трассировка обеспечивают понимание приложений, работающих в кластерах Kubernetes, на уровне транзакций.

Datadog обеспечивает мониторинг на различных уровнях инфраструктуры благодаря лишь установленному агенту, чем не может похвастаться PLG, которому необходимо развернуть хелм чарты, устанавливать kubernetes-event-exporter и все это надо еще сконфигурировать…

Datadog: краткий обзор платформы для мониторинга

Весь мониторинг в одном месте

Datadog предлагает надежные возможности мониторинга для отслеживания производительности различных компонентов в режиме реального времени: мониторинг состояния сервера, сетевой активности, времени ответа приложений и т. д.

Сбор логов: Datadog позволяет организациям централизовать и анализировать данные логов, помогая устранять неполадки и выявлять закономерности.

Мониторинг в реальном времени: обеспечивает мгновенные обновления производительности и состояния системы.

Мониторинг API: Datadog позволяет отслеживать API, чтобы гарантировать их доступность и оперативность.

Отслеживание времени отклика: позволяет оптимизировать работу пользователей.

Синтетический мониторинг

Синтетические тесты позволяют наблюдать за тем, как работают системы и приложения, используя моделируемые запросы и действия со всего мира.

Datadog отслеживает производительность веб-страниц и API от серверной части до внешней и на различных сетевых уровнях (HTTP, SSL, DNS, WebSocket, TCP, UDP, ICMP и gRPC) контролируемым и стабильным способом, предупреждая о неисправностях.

Вычисление SLO на ключевых конечных точках и пользовательских маршрутах упрощает соблюдение целевых показателей производительности приложений и, в конечном итоге, обеспечивает стабильное качество обслуживания клиентов. Синтетические тесты можно создавать в приложении Datadog, с помощью API или Terraform.

При внедрении Datadog также следует учесть некоторые его недостатки:

Сложный процесс приема, индексирования и хранения логов
Процесс анализа логов в Datadog гораздо сложнее, чем должен быть.

Вы можете отправлять логи в Datadog, но не можете их анализировать. Если вы хотите их проанализировать, вам необходимо их проиндексировать и сохранить. Существует даже отдельная структура ценообразования для приема и хранения.

Из-за сложности и весомых затрат, некоторые организации предпочитают не хранить столько логов, сколько им может понадобиться или хотелось бы. Это приводит к затруднениям при устранении неполадок и анализе первопричин, особенно в случае постоянных проблем, которые продолжаются после истечения срока хранения.

Чтобы индексировать и анализировать логи, необходимо их извлечь из облачного хранилища объектов (например, Amazon S3) и повторно их проанализировать. Этот процесс может занять несколько часов и требует, чтобы кто-то им управлял. Из-за постоянной нехватки специалистов и избытка работы для команд DevOps и служб обеспечения надежности сайтов многие организации не могут позволить себе справиться с таким уровнем сложности.

Дорогостоящий рабочий процесс анализа логов
Что касается логов, Datadog взимает 0,10 доллара США за прием данных и от 1,06 доллара США (3 дня) до 2,50 доллара США (30 дней) за хранение. Чтобы хранить логи дольше, необходимо связываться с Datadog и договариваться об индивидуальных ценах, которые могут быстро увеличиваться по мере масштабирования компании. Хотя Datadog полезен для мониторинга и обнаружения, когда дело доходит до анализа первопричин и устранения неполадок, эти затраты могут быстро выйти из-под контроля.

Проблемы масштабирования
Сокращение сроков хранения логов может стать существенным компромиссом и привести к потере видимости более сложных проблем — от затянувшихся проблем с производительностью приложений и инфраструктуры до сложных постоянных угроз безопасности. Многие стартапы, начинающие с Datadog, обнаруживают, что по мере масштабирования они в конечном итоге тратят абсурдные суммы на их сохранение. С масштабированием Datadog становится дороже и сложнее в использовании.

Datadog сделал себе имя как инструмент мониторинга стартапов благодаря быстрой и легкой настройке, но с увеличением проекта, его становится дороже и сложнее использовать, более того, дашборды-графики, которые подкупают своей первоначально легкой настройкой, в дальнейшем могут оказаться менее гибкими и менее кастомизированными.

Тем не менее, возможность мониторинга бессерверных приложений, k8s кластеров и БД, использование ИИ при анализе метрик и логов, делает Datadog несомненно одним из самых современных и востребованных приложений SaaS.

Вам также может понравиться

Технология
5 апреля, 2024
PlaysDev
Голосовой помощник: что это такое и как используется в бизнесе
Рассказываем про голосовых ассистентов. Зачем компании используют голосовой поиск в своих приложениях и умных устройствах? Популярность виртуальных ассистентов у пользователя и кейсы известных компаний.
Читать
Технология
29 февраля, 2024
PlaysDev
Google Gemma — новая нейросеть с открытым кодом
Обзор свежего релиза Google Gemma. Чем Gemma отличается от Gemini и в чем ее ключевые преимущества? Какие технологии использует Gemma и почему разработчикам стоит попробовать ее использовать?
Читать
Экспертиза
22 марта, 2024
PlaysDev
Книги для саморазвития — что почитать для развития личности и самодисциплины
Что почитать для саморазвития: подборка полезных книг, которые подойдут каждому. Книги в подборке помогут вам развить самодисциплину, расширить знания в области бизнеса и достичь новых высот в вашей профессиональной деятельности, при условии, что вы сами к этому стремитесь!
Читать
Экспертиза
22 октября, 2024
PlaysDev
Code Review: практическое руководство для инженеров и разработчиков
На что обращать внимание во время code review и зачем его проводить? Польза код-ревью для команды.
Читать
Индустрия
2 марта, 2023
PlaysDev
Аутстаффинг и Аутсорсинг в 2023: Обзор рынка, тенденции и ожидания
В этой статье мы рассмотрим, что такое ИТ-аутстаффинг и аутсорсинг что ждет эти направления в 2023 году.
Читать
СервисыТехнология
21 ноября, 2023
PlaysDev
Datadog: краткий обзор платформы для мониторинга
В этой статье мы рассмотрим платформу Datadog: её преимущества и недостатки, порог входа, виды и системы мониторинга и многое другое...
Читать
Экспертиза
6 октября, 2023
PlaysDev
Обзор трендов аутстаффинга/аутсорсинга за III квартал
В этой статье будет обзор трендов аутстаффинга и аутсорсинга за III квартал 2023 года. Рассмотрим, что ждет аутстаффинг и аутсорсинг. Почему компании выбирают такие модели сотрудничества.
Читать
Экспертиза
21 декабря, 2023
PlaysDev
Кто такой бизнес аналитик и как он помогает бизнесу?
Кто такой бизнес аналитик и чем он занимается в компании? Какую пользу он приносит компании? Читайте об этом в нашей статье.
Читать
Технология
3 июля, 2024
PlaysDev
Эволюция методологий разработки: от Waterfall к непрерывной доставке через DevOps
Рассматриваем DevOps методологию в развитии: какие есть подходы к разработке ПО и управлению проектами в ИТ?
Читать
Экспертиза
12 апреля, 2024
PlaysDev
Онбординг или адаптация сотрудников — что это такое, этапы и методы
Что такое онбординг? Как не потерять нового коллегу после адаптационного периода и помочь влиться в коллектив без потерь. Рассказываем про практику Google в области онбординга и другие современные способы удержать сотрудника.
Читать