云原生架构产生了更多的数据,增加了可观测性的成本。然而,有更好的方法来管理这些费用。
译自 Real Talk: Why Is Datadog So Expensive?,作者 Rachel Dines。
我最近在 X(前身为 Twitter)、Reddit 和 HackerNews 上看到了很多讨论 Datadog 高昂成本的帖子。这是一个热门话题,工程师们纷纷发布博客,讨论他们如何采取强力手段来降低指标。
但是,我们是怎么到这个地步的呢?为什么这些成本这么高?为什么公司为他们的可观测性支付的费用比生产基础设施还要高?有很多争论和指责锁定和企业贪婪的言论,这当然在一定程度上是有道理的。
更深层次的问题是:采用容器化基础设施和微服务应用的基本架构变化。如果我们不理解并解决这个问题,历史将重演。
好吧,这是事实,我在 Chronosphere 工作,这是一家与 Datadog 竞争的公司。我保证这篇文章不会向您推销我们的产品。Datadog 是一位强大的竞争对手,多年来我一直看着它建立了一个令人惊叹的业务。
我的前公司在 2015 年至 2018 年是 Datadog 的密切合作伙伴,我们看到了它的迅猛增长,我们迫切希望效仿。与此同时,我看到 Datadog 的客户对不断飙升和不可预测的成本感到越来越不满,然而他们觉得自己无法离开。
这也是我在 2021 年加入 Chronosphere 的原因之一,因为我看到了这一趋势的发展。在我加入这个领域之前,我进行了一些市场规模和分析,发现可观测性对基础设施支出的影响最大:在公共云上每花费1美元,你可能会在可观测性上花费0.25至0.35美元。这让我觉得这是一个值得颠覆的市场。
问题的根本原因很简单:可观测性数据(指标、日志、跟踪和事件)比这些工具预测的要多得多。因此,它们的架构不适应这个数据量,定价也不相应。我们最终产生如此多数据的原因有很多。
业务驱动因素:
技术驱动因素:
这种数据增长导致可观测性支出飙升。如果不改变定价模型或软件以适应数据增长,并继续基于传统的监控标准定价,云原生架构突然变得惊人昂贵。
我怀疑有两个原因:
如果您不想支付 Datadog 的费用,有几个选择。
一个有吸引力的替代方案是使用开源工具在内部运行自己的可观测性系统。好消息是,至少对于指标和追踪来说,开源工具取得了长足的进步,并正在形成行业公认的标准。Prometheus 和 OpenTelemetry 与各种时间序列数据库后端(Mimir、Thanos 或 M3)是替代 Datadog 的可行选择。
但需要注意的是,这通常不会在实际美元上为您节省资金。这只是将资本支出(CapEx)与运营支出(OpEx)进行交换。运行这些系统的人力和基础设施成本是相当可观的,如果尝试省略某些步骤,可能会后悔不已。
最近我和一位朋友交谈,他将公司从昂贵的商业SaaS解决方案迁移到了内部开源工具上。他承认,考虑到大约有 8% 的开发人员现在致力于运行这个系统,公司实际上并没有节省任何资金。
这并不是我向您推销我公司产品的地方。这是我要说的工具从一开始就以数据增长为基础的地方。解决方案的成本始终掌握在客户手中,因此不会有意外超支。
就像 Datadog、New Relic 和类似的工具取代了上一代的 Solarwinds、BMC 和 CA Technologies 一样,这一新一代的可观测性工具开始引起轰动。与这些供应商交流,了解他们是如何处理观察性数据过多的问题,而不是用更好的单位经济学来处理它。
Datadog 的高额账单和供应商锁定不知何故已成为一种必要的恶;您知道您需要可观测性,但对所有选项不太确定。尽管 Datadog 的计费方式和专有代码存在一些问题,但它已经存在了足够长的时间,看起来仍然是一个可行的选择。但事情并不一定要这样。
随着越来越多的可观测性公司进入这一领域,也出现了从一开始就致力于解决高基数数据增长问题的选项。这些选项为您提供了更灵活的基础设施、更多对数据的控制以及对每月账单更明晰的可见性,最终为可观测性团队打造了更具可持续性和成本效益的运营模型。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有