网络知识 娱乐 腾讯云&信通院国内首发《降本之源-云原生成本管理白皮书》

腾讯云&信通院国内首发《降本之源-云原生成本管理白皮书》

在11月4日举办的2021腾讯数字生态大会云原生专场上,腾讯云联合中国信通院率先在国内重磅发布了《降本之源-云原生成本管理白皮书》(简称白皮书)基于腾讯云在业内最大规模的 Kubernetes 实践经验,系统性呈现云原生成本优化方法论和最佳实践路径。

腾讯云容器产品总经理邹辉表示:“Kubernetes 是云原生技术栈的核心,腾讯云原生经过多年的技术积累以及众多腾讯内外部复杂业务考验已经步入非常成熟的阶段。TKE 目前拥有国内最大规模的 Kubernetes 集群以及业界最好的 Kubernetes 成本优化实践;目前 TKE 运行着  900 万+个 Pod ,管理了数千万 CPU 核;同时我们大规模在腾讯内部核心业务中应用了成本优化技术,CPU 利用率最高提升了3倍;在腾讯外部,小红书80%的业务都跑在TKE上,成本降低了40%。”

当前,越来越多的企业开始拥抱云计算,但随着用云程度的加深,云资源浪费的问题也变得越发明显。白皮书指出,弹性按需是云原生的资源利用优势,但如果资源配置策略设置不合理可能会导致资源的浪费。此外,云原生资源利用的计量方式如果不够灵活,会使得企业难以准确调控用云成本,因此,企业在应用云原生架构之后,需要考虑如何管理、优化和使用云原生服务来进一步提升业务的数字化转型效。

基于丰富的海量应用服务经验,腾讯云原生在内部和外部都有着成熟的资源优化方法论。在内部,腾讯云采用资源利用率成熟度模型,通过四个阶段对业务进行容器化,最终实现利用率达到60~70%。在外部,腾讯云推出了容器产品“成本大师”,从成本洞察、成本优化、成本运营三个层面来协助企业做更好的成本管理。

据介绍,成本大师具有全链路的成本优化能力,能够精确智能的进行成本洞察,一分钟发现资源浪费,并提供8种弹性策略组合,满足任意场景的弹性需求,而全构混部是业内首家云上支持 CPU/GPU 的混部产品,覆盖腾讯千万核资源规模。核心能力 qGPU,是强隔离的 GPU 虚拟化技术,该技术在业内首次实现了 GPU 算力、显存和故障的强隔离,支持算力精细切分共享和多优先级混部, GPU 利用率最高可提升230%。

《降本之源-云原生成本管理白皮书》正是腾讯基于内外云原生成本管理最佳实践,并结合行业优秀案例,提出的一套体系化的云原生成本优化方法论和最佳实践路径。旨在帮助企业改善用云成本,充分发挥云原生的效能和价值

此外,白皮书中,腾讯云还通过对数十个客户的详细访谈,了解到在企业实际成本管理中存在的焦点问题,并基于资源利用率的现状和挑战,整理出企业使用的“成本洞察”、“成本优化”、“成本运营”三阶段云原生成本管理模型。

成本洞察即团队需要定义一致的标签和命名空间来改善分配,基于多维度(如云产品、环境、业务线)的资源和成本的可视化分析,能够帮助团队有效地建立起相应的问责机制,并根据获取到的实时数据快速制定优化方案及措施。

成本优化是对云资源规格、数量的调整,也包含了对业务的架构优化、以及通过弹性能力和资源混部等手段提升资源利用率。主要方案包括:设置合适的资源请求,通过动态调度解决资源碎片的问题,提高装箱率。通过弹性和混部做到按需使用;对于固定资源池,对负载峰值在不同时段的在线应用、在离线应用进行混部,做到分时复用;针对 GPU 资源,实现资源的池化和共享。

成本运营则是鼓励企业从组织、文化、流程等方面建设成本运营体系,根据目标持续不断调整和优化。具体方案包括:建立成本优化团队,推动成本优化意识,数据驱动成本优化,在流程中考察成本以及量化成本优化交付的业务价值。

白皮书围绕该模型,并结合企业实际落地情况提供成本管理的最佳实践,帮助企业上云、云原生改造时兼顾成本优化,助力数字化转型。

此外,白皮书还收录了腾讯内外部10余个企业降本实践案例。将包括作业帮、云集、QQ 浏览器、腾讯广告等企业或业务上云遇到的成本挑战及降本实践全方位呈现,为其他企业运维减负提供了详实的参考。

除了《云原生成本管理白皮书》,针对容器的安全难题,腾讯云容器服务TKE还联合腾讯安全云鼎实验室,发布了《腾讯云容器安全白皮书》。白皮书对腾讯云容器用户进行了深入的调研和走访,同时结合长期以来的容器安全运营实践,详细梳理并分析了容器环境所面临的安全威胁和挑战,并介绍了腾讯云在云原生容器安全建设上的思路、方案以及实践,希望以这样的方式共同推动云原生安全的发展。这也是国内首次大规模的对容器环境安全现状进行的分析总结。

据介绍,腾讯云一直致力于在云原生领域为用户提供更全面、更稳定、更安全的云原生服务。在云原生产品的设计和实现之初,就充分融入了安全性的设计和考虑,使云原生系统天然具备安全特性,使安全成为像计算、存储、网络一样的基础能力,助力用户实现应用系统的云原生化,并且持续的保障其安全稳定的运行。

更多细节内容,可点击“阅读原文”下载《降本之源-云原生成本管理白皮书》进行了解。

  往期精选推荐  

  • 如何构建万级Kubernetes集群场景下的etcd监控平台?
  • 在 TKE 中使用 Velero 迁移复制集群资源
  • 被集群节点负载不均所困扰?TKE 重磅推出全链路调度解决方案
  • 拥抱云原生,腾讯发布TCSS容器安全服务!
  • 一个优秀的云原生架构需要注意哪些地方