美股掘金 Facebook宕机背后的隐忧与机会
午夜时分,当公众还聚焦在债务上限和能源危机对美股的重挫,Facebook及旗下两大社交媒体Instagram和WhatsApp的网站和App集体宕机,内网崩溃,长达7个小时还未恢复,刷新了自 2008 年最长宕机时长。FB收跌4.89%,随着Instagram和WhatsApp等服务现在开始恢复上线,Facebook盘后涨0.7%。
此次大规模宕机事故,一方面凸显FB在全球通信和其他服务领域的垄断地位;另一方面反映网络安全形势非常严峻。专家估计,Facebook、Instagram、WhatsApp全球服务中断一小时将给全球经济造成 1.6 亿美元的损失,持续六小时意味着9.68亿美元的全球经济成本。
据悉,Facebook全球网络服务中断期间,在黑客论坛上有超过15亿Facebook用户的数据被出售。Facebook的CIO,Mike Schroepfer在Twitter发帖称「我们在经历网络问题」。官方声明:协调数据中心之间网络流量的主干路由器的配置变化导致了通信中断,由此对我们数据中心的通信方式产生了连带影响,使我们的服务陷入停顿。
数据在前端被出售是一方面,但为什么售出的数据,最终能够,导致后端的路由器错配,甚至内网崩溃,中间的传导值得细思——一定程度表明,作为防线的监控基础设施被突破,黑客的攻击具有复杂性、不可见性和监视盲点。目前Facebook的监控平台的供应商有待跟进,但无论是否采用该市场的王者,都说明网络安全作为国家战略地位的重要性不容忽视,这对近期被杀估值的相关个股也是有力支撑。
行业痛点
不断变化的客户期望要求组织优先考虑用户体验。数字交互成为企业与其客户、合作伙伴和雇员之间沟通的主要渠道。根据Forrester,客户体验更好会购买更多产品和服务,并进行推荐。结果是从减少的客户流失中保留更多的收入。
动态多云环境成为数字转换的必要条件。根据IDC,在使用云基础设施的全球企业中,97%的企业依赖于一个以上的云平台。此外,高德纳预测,到2025年,85%的企业将有云优先原则。动态多云环境的主要优点包括,更快的速度构建更好的应用程序,加快软件交付周期,提高业务效率,克服不兼容性问题的风险和潜在故障点的数量,扩展更多应用场景。
传统的监控方法的局限。在基于云的环境中应用存在明显不足,包括手动配置、减缓创新、监视盲点、部署不灵活等。
玩家介绍
APM软件为用户与应用程序间的交互提供了可见性。随着越来越多的组织转向数字渠道,增强可见性,APM软件对于IT运营适应业务的需求越来越重要。截至2024年,75%的组织将基础设施作为服务/平台作为服务(IaaS/PaaS)环境将通过云提供商的API使用度量标准。截至2025年,70%的新云本机应用程序监控将使用开源测试,而不是特定于供应商的代理,以提高互操作性。
当前行业渗透率不及10%,提升空间大。Gartner预计,2018年至2021年期间业务流程日益数字化,APM使用量将翻两番,达到所有业务应用程序的20%。2021年全球IT运营软件市场预计将达到350亿美元,预计2025年将以9.3%的复合年增长率增长至500亿美元。
赛道主要玩家包括:
APM魔法象限领导者
1. Dynatrace
Dynatrace平台主要专注于提供具有模块化功能的核心APM功能,用于IT基础设施监控(ITIM)、DEM、业务分析、AIOps、云自动化和应用程序安全。Dynatrace的路线图包括将其Davis AI引擎的分析功能扩展到新数据源,并进一步扩大其在AWS、Microsoft Azure和谷歌云平台(GCP)等云提供商市场的影响力。
(1)优势:
模块化平台:在集成平台中为不同细分市场提供模块化功能。
易于部署:单一代理允许客户以相对快速和自动化的方式持续发现和收集可观察性数据。
自动化平台:基于事件的自动化平台Keptn正帮助供应商推动与开源软件 (OSS) 项目的持续交付和闭环修复的集成和自动化。
(2)注意事项:
更高的定价:Dynatrace对非生产环境没有差异化定价,内存密集型环境的定价各不相同。
有待完善的平台:在可扩展性方面落后于其竞争对手。
扩展用例的意识:Dynatrace的上市战略和对新用例(例如应用程序安全和数字工作场所)的客户支持尚处于起步阶段,有待进一步发展。
2. Datadog
Datadog平台主要专注于APM、日志管理、DEM和相关监控产品的解决方案,所有这些都以SaaS部署的形式交付。业务地域多元化,客户范围从初创企业到大型企业。未来将增强其AIOps工具(Watchdog)、业务分析以及对其服务器和应用程序监控工具的进一步集成。
(1)优势:
产品开发能力强大:Datadog展示了将新产品推向市场并迅速被客户采用的持续能力。在过去几年中,Datadog已从基础设施监控工具转变为范围广泛的解决方案。
问题分类:Datadog收集、准备和呈现遥测数据,方法是将日志、指标和跟踪组合到一个单一的上下文中,减少事件响应时间周期,在根本上提高了员工操作流程的效率。
定价透明:Datadog长期以来一直在其网站上公布其整个产品组合的价格。Gartner认为这有助于建立业务案例和信任。
(2)注意事项:
部署:没有本地部署选项可用;客户必须使用SaaS版本,可能不适合需要FedRAMP中等或更高级别的政府机构,因为该供应商目前具有低影响认证。
大额交易的定价:较大的交易基于合同,前期承诺支出较多,可能影响供应链。
业务分析:Datadog在为商业分析师用户呈现上下文数据的能力方面不成熟。
3. Cisco (AppDynamics)
思科(AppDynamics)的APM平台主要专注于监控大型、分布式和复杂应用程序和基础设施环境的企业IT运营组织。业务主要集中在北美和西欧,其客户为垂直行业广泛的大中型企业。其APM路线图侧重于扩展对Kubernetes、Open Telemetry和Amazon Web Services (AWS)之外的云提供商的支持,以及对监控平台即服务 (PaaS)和数据库即服务 (DBaaS)的支持。Cisco (AppDynamics)还继续对数据收集代理技术进行现代化改造,并与其在2020年收购的DEM解决方案Thousand Eyes相集成。
(1)优势:
商业分析:商业分析 (Business IQ)和用户旅程地图(Experience Journey Map)仍然是其产品差异化的因素。
区域扩张:平台在印度和巴西等主要新兴市场以SaaS形式提供,并继续扩展到欧洲、中东和非洲 (EMEA)。新的FedRAMP认证,吸引到更多监管主体。
广泛的监控产品组合:基础设施软件产品组合广泛,包括网络、基础设施和工作负载监控。
(2)注意事项:
日志管理能力有待完善:日志分析数据存储在单独的专用数据库中,需要手动设置,且相对于竞争对手而言,跨域分析能力有限。
千眼是一个单独的产品:思科(AppDynamics)和千眼产品有重叠的DEM功能,特别是在用于Web应用程序的STM中,而本地集成路径不明确。
定价模型变化的影响:平台正引入基于CPU内核而不是代理数量的新定价模型,客户在了解新定价、进行比较和未来项目成本时可能会经历一段中断期。
4. New Relic
其产品专注于APM、基础设施、真实用户监控和合成功能。客户为大中型企业。New Relic 的路线图侧重于改进数据探索和关联,通过通用用户体验简化检测过程,以及改进开发人员协作工具。公司还将继续通过更深入的ITSM集成来增强其AIOps产品,并专注于与AWS 的合作伙伴关系。
(1)优势:
可扩展的SaaS平台:NewRelic的SaaS选项已成功支持大型部署,每分钟分析数百万个指标和拍字节的遥测数据。
更低的数据摄取成本:与提供类似功能的top供应商相比,New Relic新定价模型的数据摄取成本更低。
开源收集代理:New Relic正从专有收集代理转向标准化的开源方法。
(2)注意事项:
定价和许可变更:New Relic在过去一年中定价变化大,导致许多客户因为支出增加,并对新定价模型感到困惑。
数据处理的专注度:New Relic正定位为通用数据分析厂商,而非纯粹的APM供应商,这可能会影响公司对APM功能的关注。
战略挑战:转向New Relic One平台使得公司重新安排其产品规划和优先级,数个关键功能被推迟,包括日志中的异常检测和对Azure Functions的更深入支持。