СервисыТехнология

Datadog: краткий обзор платформы для мониторинга

Автор: PlaysDev
Опубликовано: 21.11.2023

Тенденция усложнения систем и приложений стимулирует внедрение более эффективных инструментов мониторинга. В этом контексте Datadog выделяется как мощный и универсальный инструмент.

В чем основные особенности Datadog и почему в мире опенсорса и бесплатного ПО выбирают именно этот платный SaaS мониторинг? Давайте разбираться.

Мы выделили следующие факторы:

  • цена,
  • масштабируемость,
  • UI и удобство использования,
  • функциональность,
  • возможность кастомизации,
  • прогнозируемое использование,
  • простота развертывания

Начнем с тех. возможностей Datadog, благодаря которым он остается в топе инструментов мониторинга уже не первый год, а также проведем небольшое сравнение со стеком Prometheus-Loki-Grafana.

Легок в первоначальной настройке (низкий порог входа)

Для мониторинга достаточно установить агента на хост и/или подключить библиотеку в приложении. Юзер-френдли интерфейс и дашборды с основными метриками сэкономят огромное количество времени на первоначальном этапе.

Более того, Datadog имеет упрощенную интеграцию с Microsoft Azure, что делает его еще более привлекательным, по сравнению, например, с Prometheus-Loki-Grafana, которые необходимо первоначально сконфигурировать для совместной работы, а также дополнительно подключать и конфигурировать экспортеры.

Позволяет создавать дашборды для приложений, сред и кастомных метрик в одной панели

Виджеты с возможностью перетаскивания дают возможность создать собственные представления без необходимости написания кода. Набор инструментов визуализации позволяет просматривать данные в различных форматах, а также создавать отчеты.

Основным преимуществом здесь является простота создания запросов, в отличие от Prometheus, в Datadog все быстро и легко настраивается через UI (зачастую датадог даже сам предлагает тебе потенциальные запросы, или метрики уже выдают тебе нужную вещь, как например cpu_usage метрика — она возвращает уже долю использованного CPU).

Мониторинг баз данных

Datadog Database Monitoring поддерживает self-hosted и облачные версии Postgres, MySQL, Oracle и SQL Server. Дашборд «Метрики запроса» показывает историческую производительность нормализованных запросов. Есть возможность визуализации тенденции производительности с помощью инфраструктуры или пользовательских тегов, таких как зона доступности центра обработки данных, а также оповещения в случае аномалий.

Также Datadog поддерживает такой функционал, как:

  • определение запросов, которые занимают больше всего времени,
  • отслеживание метрик уровня базы данных, не фиксируемые APM, например обновленные/возвращенные строки,
  • фильтрация и группировка запросов по произвольным параметрам, таким как команда, пользователь, кластер и хост
  • выявление необычно медленных, но редких запросов, не фиксируемые метриками,
  • присвоение выполнения конкретного запроса пользователю, приложению или узлу клиента.

Datadog позволяет мониторить облачные версии БД, чего не может PLG (приходится отдельно использовать такие сервисы, как AWS CloudWatch или Azure Monitor).

Serverless stack monitoring

Datadog предоставляет решения для мониторинга AWS Lambda, Azure App Service, Azure Container Apps, and Google Cloud Run с такими возможностями как:

  • Оповещения в режиме реального времени о показателях памяти, тайм-аута и параллелизма, чтобы избежать ухудшения качества обслуживания конечных пользователей,
  • отслеживание вызовов микросервисов для обеспечения сквозной видимости запросов клиентов,
  • визуализация распределенных микросервисов на карте сервисов и разбивка их по таким тегам, как функция, клиент, версия и т. д.,
  • прием и анализ 100 % следов, действующих за последние 15 минут,
  • изоляция отдельного запроса клиента и переход к связанным логам и показателям для получения полной истории,
  • мониторинг аномалий, выбросов и прогнозирования на основе машинного обучения

k8s мониторинг

Этот пункт нельзя не отметить, так как Datadog интегрирован с Kubernetes, Docker, сontainerd и Istio, что позволяет:

  • собирать метрики, события и логи из компонентов кластера, подов и других объектов Kubernetes,
  • собирать метрики на уровне контейнера для детальной разбивки ресурсов (на уровне docker и containerd),
  • автоматически отслеживать узлы кластеров Kubernetes с помощью агента Datadog,
  • отслеживать развертываемые вами технологии,
  • APM и распределенная трассировка обеспечивают понимание приложений, работающих в кластерах Kubernetes, на уровне транзакций.

Datadog обеспечивает мониторинг на различных уровнях инфраструктуры благодаря лишь установленному агенту, чем не может похвастаться PLG, которому необходимо развернуть хелм чарты, устанавливать kubernetes-event-exporter и все это надо еще сконфигурировать…

Datadog: краткий обзор платформы для мониторинга

Весь мониторинг в одном месте

Datadog предлагает надежные возможности мониторинга для отслеживания производительности различных компонентов в режиме реального времени: мониторинг состояния сервера, сетевой активности, времени ответа приложений и т. д.

Сбор логов: Datadog позволяет организациям централизовать и анализировать данные логов, помогая устранять неполадки и выявлять закономерности.

Мониторинг в реальном времени: обеспечивает мгновенные обновления производительности и состояния системы.

Мониторинг API: Datadog позволяет отслеживать API, чтобы гарантировать их доступность и оперативность.

Отслеживание времени отклика: позволяет оптимизировать работу пользователей.

Синтетический мониторинг

Синтетические тесты позволяют наблюдать за тем, как работают системы и приложения, используя моделируемые запросы и действия со всего мира.

Datadog отслеживает производительность веб-страниц и API от серверной части до внешней и на различных сетевых уровнях (HTTP, SSL, DNS, WebSocket, TCP, UDP, ICMP и gRPC) контролируемым и стабильным способом, предупреждая о неисправностях.

Вычисление SLO на ключевых конечных точках и пользовательских маршрутах упрощает соблюдение целевых показателей производительности приложений и, в конечном итоге, обеспечивает стабильное качество обслуживания клиентов. Синтетические тесты можно создавать в приложении Datadog, с помощью API или Terraform.

При внедрении Datadog также следует учесть некоторые его недостатки:

Сложный процесс приема, индексирования и хранения логов
Процесс анализа логов в Datadog гораздо сложнее, чем должен быть.

Вы можете отправлять логи в Datadog, но не можете их анализировать. Если вы хотите их проанализировать, вам необходимо их проиндексировать и сохранить. Существует даже отдельная структура ценообразования для приема и хранения.

Из-за сложности и весомых затрат, некоторые организации предпочитают не хранить столько логов, сколько им может понадобиться или хотелось бы. Это приводит к затруднениям при устранении неполадок и анализе первопричин, особенно в случае постоянных проблем, которые продолжаются после истечения срока хранения.

Чтобы индексировать и анализировать логи, необходимо их извлечь из облачного хранилища объектов (например, Amazon S3) и повторно их проанализировать. Этот процесс может занять несколько часов и требует, чтобы кто-то им управлял. Из-за постоянной нехватки специалистов и избытка работы для команд DevOps и служб обеспечения надежности сайтов многие организации не могут позволить себе справиться с таким уровнем сложности.

Дорогостоящий рабочий процесс анализа логов
Что касается логов, Datadog взимает 0,10 доллара США за прием данных и от 1,06 доллара США (3 дня) до 2,50 доллара США (30 дней) за хранение. Чтобы хранить логи дольше, необходимо связываться с Datadog и договариваться об индивидуальных ценах, которые могут быстро увеличиваться по мере масштабирования компании. Хотя Datadog полезен для мониторинга и обнаружения, когда дело доходит до анализа первопричин и устранения неполадок, эти затраты могут быстро выйти из-под контроля.

Проблемы масштабирования
Сокращение сроков хранения логов может стать существенным компромиссом и привести к потере видимости более сложных проблем — от затянувшихся проблем с производительностью приложений и инфраструктуры до сложных постоянных угроз безопасности. Многие стартапы, начинающие с Datadog, обнаруживают, что по мере масштабирования они в конечном итоге тратят абсурдные суммы на их сохранение. С масштабированием Datadog становится дороже и сложнее в использовании.

Datadog сделал себе имя как инструмент мониторинга стартапов благодаря быстрой и легкой настройке, но с увеличением проекта, его становится дороже и сложнее использовать, более того, дашборды-графики, которые подкупают своей первоначально легкой настройкой, в дальнейшем могут оказаться менее гибкими и менее кастомизированными.

Тем не менее, возможность мониторинга бессерверных приложений, k8s кластеров и БД, использование ИИ при анализе метрик и логов, делает Datadog несомненно одним из самых современных и востребованных приложений SaaS.

Вам также может понравиться

Экспертиза
28 марта, 2024
PlaysDev
IT Стажировка в 2024 году: зачем нужны и как на них попасть?
Рассказываем, что стажировка может дать молодому айти специалисту в 2024 году и как вести себя, чтобы успешно окончить стажировку.
Читать
Экспертиза
22 мая, 2024
PlaysDev
Аутстаффинг ИТ-специалистов: когда заказчику выгодно привлечь разработчиков извне?
Что такое аутстаффинг? Разбираемся, почему аутстаффинг это выгодно и рассказываем про основные модели аутстафф-сотрудничества. Когда бизнесу может потребоваться временный сотрудник?
Читать
Экспертиза
15 марта, 2024
PlaysDev
Менеджер проектов: 8 навыков ценного специалиста по управлению командой
Собрали краткий гайд по профессии Project Manager’а: кто это такой и какие обязанности выполняет, какими навыками должен обладать ценный сотрудник и как их развивать?
Читать
Индустрия
17 июля, 2024
PlaysDev
Как управлять проектом, если команда находится в разных часовых поясах?
С какими трудностями сталкиваются менеджеры международных команд? Рассказываем про особенности работы с командой в разных часовых поясах.
Читать
Технология
12 сентября, 2024
PlaysDev
Технологические Новинки 2024: Топ 5 интересных релизов
Новинки 2024: какие диджитал решения вы могли пропустить? Откройте статью чтобы узнать про Microsoft Places, NVIDIA Superchip и обновленного AI-помощника Copilot X на GitHub.
Читать
Экспертиза
18 сентября, 2024
PlaysDev
Как корпоративная культура помогает сотрудникам и руководителям достигать успеха
Все слышали о корпоративной культуре, но что это такое на практике? Что стоит за размытым понятием “культура”? Рассказали про основные инструменты для достижения заинтересованности и вовлеченности сотрудников.
Читать
Экспертиза
6 октября, 2023
PlaysDev
Обзор трендов аутстаффинга/аутсорсинга за III квартал
В этой статье будет обзор трендов аутстаффинга и аутсорсинга за III квартал 2023 года. Рассмотрим, что ждет аутстаффинг и аутсорсинг. Почему компании выбирают такие модели сотрудничества.
Читать
Технология
5 июня, 2024
PlaysDev
Тренды ИИ 2024: подробно про область применения
Почему бизнесы инвестируют в ИИ? Рассказываем, какие достижения удалось реализовать с помощью искусственных помощников. Оцениваем основные тренды использования ИИ по отраслям.
Читать
Экспертиза
26 июля, 2024
PlaysDev
Эмоциональный интеллект в IT: как он помогает в управлении командами
EQ: Про важность эмоционального интеллекта на работе и причины развивать его в компании. EQ vs. IQ – действительно ли это Интеллект?
Читать
Экспертиза
17 ноября, 2023
PlaysDev
Как пройти собеседование в ИТ компанию
Как успешно пройти собеседование в ИТ компанию. План прохождения собеседования. Составление CV. Структура CV. Что делать во время технического интервью.
Читать