Тенденция усложнения систем и приложений стимулирует внедрение более эффективных инструментов мониторинга. В этом контексте Datadog выделяется как мощный и универсальный инструмент.
В чем основные особенности Datadog и почему в мире опенсорса и бесплатного ПО выбирают именно этот платный SaaS мониторинг? Давайте разбираться.
Мы выделили следующие факторы:
Начнем с тех. возможностей Datadog, благодаря которым он остается в топе инструментов мониторинга уже не первый год, а также проведем небольшое сравнение со стеком Prometheus-Loki-Grafana.
Для мониторинга достаточно установить агента на хост и/или подключить библиотеку в приложении. Юзер-френдли интерфейс и дашборды с основными метриками сэкономят огромное количество времени на первоначальном этапе.
Более того, Datadog имеет упрощенную интеграцию с Microsoft Azure, что делает его еще более привлекательным, по сравнению, например, с Prometheus-Loki-Grafana, которые необходимо первоначально сконфигурировать для совместной работы, а также дополнительно подключать и конфигурировать экспортеры.
Виджеты с возможностью перетаскивания дают возможность создать собственные представления без необходимости написания кода. Набор инструментов визуализации позволяет просматривать данные в различных форматах, а также создавать отчеты.
Основным преимуществом здесь является простота создания запросов, в отличие от Prometheus, в Datadog все быстро и легко настраивается через UI (зачастую датадог даже сам предлагает тебе потенциальные запросы, или метрики уже выдают тебе нужную вещь, как например cpu_usage метрика — она возвращает уже долю использованного CPU).
Datadog Database Monitoring поддерживает self-hosted и облачные версии Postgres, MySQL, Oracle и SQL Server. Дашборд «Метрики запроса» показывает историческую производительность нормализованных запросов. Есть возможность визуализации тенденции производительности с помощью инфраструктуры или пользовательских тегов, таких как зона доступности центра обработки данных, а также оповещения в случае аномалий.
Также Datadog поддерживает такой функционал, как:
Datadog позволяет мониторить облачные версии БД, чего не может PLG (приходится отдельно использовать такие сервисы, как AWS CloudWatch или Azure Monitor).
Datadog предоставляет решения для мониторинга AWS Lambda, Azure App Service, Azure Container Apps, and Google Cloud Run с такими возможностями как:
Этот пункт нельзя не отметить, так как Datadog интегрирован с Kubernetes, Docker, сontainerd и Istio, что позволяет:
Datadog обеспечивает мониторинг на различных уровнях инфраструктуры благодаря лишь установленному агенту, чем не может похвастаться PLG, которому необходимо развернуть хелм чарты, устанавливать kubernetes-event-exporter и все это надо еще сконфигурировать…
Datadog предлагает надежные возможности мониторинга для отслеживания производительности различных компонентов в режиме реального времени: мониторинг состояния сервера, сетевой активности, времени ответа приложений и т. д.
Сбор логов: Datadog позволяет организациям централизовать и анализировать данные логов, помогая устранять неполадки и выявлять закономерности.
Мониторинг в реальном времени: обеспечивает мгновенные обновления производительности и состояния системы.
Мониторинг API: Datadog позволяет отслеживать API, чтобы гарантировать их доступность и оперативность.
Отслеживание времени отклика: позволяет оптимизировать работу пользователей.
Синтетические тесты позволяют наблюдать за тем, как работают системы и приложения, используя моделируемые запросы и действия со всего мира.
Datadog отслеживает производительность веб-страниц и API от серверной части до внешней и на различных сетевых уровнях (HTTP, SSL, DNS, WebSocket, TCP, UDP, ICMP и gRPC) контролируемым и стабильным способом, предупреждая о неисправностях.
Вычисление SLO на ключевых конечных точках и пользовательских маршрутах упрощает соблюдение целевых показателей производительности приложений и, в конечном итоге, обеспечивает стабильное качество обслуживания клиентов. Синтетические тесты можно создавать в приложении Datadog, с помощью API или Terraform.
Сложный процесс приема, индексирования и хранения логов
Процесс анализа логов в Datadog гораздо сложнее, чем должен быть.
Вы можете отправлять логи в Datadog, но не можете их анализировать. Если вы хотите их проанализировать, вам необходимо их проиндексировать и сохранить. Существует даже отдельная структура ценообразования для приема и хранения.
Из-за сложности и весомых затрат, некоторые организации предпочитают не хранить столько логов, сколько им может понадобиться или хотелось бы. Это приводит к затруднениям при устранении неполадок и анализе первопричин, особенно в случае постоянных проблем, которые продолжаются после истечения срока хранения.
Чтобы индексировать и анализировать логи, необходимо их извлечь из облачного хранилища объектов (например, Amazon S3) и повторно их проанализировать. Этот процесс может занять несколько часов и требует, чтобы кто-то им управлял. Из-за постоянной нехватки специалистов и избытка работы для команд DevOps и служб обеспечения надежности сайтов многие организации не могут позволить себе справиться с таким уровнем сложности.
Дорогостоящий рабочий процесс анализа логов
Что касается логов, Datadog взимает 0,10 доллара США за прием данных и от 1,06 доллара США (3 дня) до 2,50 доллара США (30 дней) за хранение. Чтобы хранить логи дольше, необходимо связываться с Datadog и договариваться об индивидуальных ценах, которые могут быстро увеличиваться по мере масштабирования компании. Хотя Datadog полезен для мониторинга и обнаружения, когда дело доходит до анализа первопричин и устранения неполадок, эти затраты могут быстро выйти из-под контроля.
Проблемы масштабирования
Сокращение сроков хранения логов может стать существенным компромиссом и привести к потере видимости более сложных проблем — от затянувшихся проблем с производительностью приложений и инфраструктуры до сложных постоянных угроз безопасности. Многие стартапы, начинающие с Datadog, обнаруживают, что по мере масштабирования они в конечном итоге тратят абсурдные суммы на их сохранение. С масштабированием Datadog становится дороже и сложнее в использовании.
Datadog сделал себе имя как инструмент мониторинга стартапов благодаря быстрой и легкой настройке, но с увеличением проекта, его становится дороже и сложнее использовать, более того, дашборды-графики, которые подкупают своей первоначально легкой настройкой, в дальнейшем могут оказаться менее гибкими и менее кастомизированными.
Тем не менее, возможность мониторинга бессерверных приложений, k8s кластеров и БД, использование ИИ при анализе метрик и логов, делает Datadog несомненно одним из самых современных и востребованных приложений SaaS.