玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!

 

数字时代下,算力成为新的核心生产力,传统以CPU为核心的架构难以满足新场景下快速增长的算力需求,具备软硬加速能力的DPU得以出现并快速发展。天翼云凭借领先的技术和丰富的应用实践自研紫金DPU,打造为云而生的全新一代云计算体系结构,助力算力基础设施升级,赋能海量算力高效释放。

传统数据中心里,所有的数据处理都依赖于CPU的通用计算能力,近10年来,数据带宽增长超过10倍,然而因为摩尔定律的失效,CPU的主频几乎没有增长,给算力基础设施的发展带来了极大挑战。

玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!

云计算要实现虚拟化管理需要依托众多虚拟化和管理组件,这会大量占据服务器主机的CPU和内存资源,带来巨大的算力消耗,形成高额的算力税。然而即便如此,基于CPU通用计算能力、以纯软件来实现的虚拟化组件,整体性能仍无法满足客户日益增长的数据处理需求。且国产化芯片架构、操作系统种类繁多,复杂的适配工作会耗费大量的人力和时间成本,新型高性能计算架构势在必行。

天翼云作为云服务国家队,积极应对算力挑战,自研紫金DPU,通过虚拟化组件卸载、多种业务硬件加速以及自研三栈合一高性能网络协议,打造高性能、低延时、高可靠性并且可大规模部署的环境,助力算力基础设施升级。

玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!

天翼云紫金DPU采用SOC+FPGA架构,依托FPGA强大的处理性能和灵活的可编程能力,对多种应用进行加速。

玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!

对于客户使用的虚拟网络和存储设备,其后端都是通过DPU硬件来实现。天翼云紫金DPU通过硬件DMA提供超强性能和超低时延;通过硬件模拟提供数以千计的pvf设备和queue资源,充分满足虚机容器等场景下大量虚拟设备的应用需求。

对于虚拟网络、虚拟存储业务,天翼云实现了DPU卸载加速。虚拟网络的控制面,包括vnet的agent和OVS的控制面,以及数据面Slowpath都运行在DPU的SOC上;慢速路径处理后生成的fastPath,则全部被卸载到DPU的硬件上。除首包需要上送到软件之外,后续报文都可以直接通过硬件处理来进行加速。

对于存储业务,控制面的建链也是通过DPU的SOC来实现的。SOC完成建链后,会将连接信息以及云盘的元数据信息等都更新到FPGA硬件里面,之后的存储IO硬件能够直接处理,无需再通过SOC。除了支持基础的存储IO卸载加速外,紫金DPU还支持部分应用加速,例如EC纠删码计算、数据压缩、存储object hash值计算等操作。通过硬件卸载加速,天翼云的存储业务可以为客户提供极致的性能。

此外,天翼云还开创性的推出三栈合一的传输层网络协议栈,即SF-Stack,Super fusion超融合协议栈,在底层提供统一的传输层接口,支持传输协议的动态选择和切换,上层应用只需要关注业务逻辑,无需关注传输层,做到简单易用、超高性能、超高可靠。AZ内数据传输采用RDMA传输协议,跨AZ的传输首选用户态的TCP协议,实现极致性能,同时该协议还保留了可靠性更高的内核态TCP,作为故障发生时的最后兜底手段。

最后,依托于DPU的物理隔离,天翼云紫金DPU将虚拟化组件和DPU一起作为一个整体,实现了不同算力、不同架构、不同系统即插即用,支持市面上大多数不同架构的主流芯片,真正做到了一云多芯,助推国产算力基础设施生态发展。

玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!

依托全新的紫金架构,天翼云实现了服务器虚拟化接近零损耗,助力算力全面释放,推动整个算力基础设施运营效率大幅提升,为客户带来更优的使用体验。

在虚拟网络转发方面,通过DPU卸载加速,曾经需要十余个宿主机CPU才能实现的2000万pps提升至4000多万,提升了超100%;

在存储方面,通过硬件RDMA加速,配合天翼云自研拥塞控制算法,IOPS能力从60万提升至200万,提升了超200%;

▍在时延方面,紫金DPU使网络时延降到了原来的四分之一。

在数字经济飞速发展的当下,DPU作为新的蓝海赛道,具有巨大的探索空间及应用价值。天翼云将继续坚持科技创新,挖掘DPU的更多潜力与可能,推动数据中心向高效率、高扩展、高带宽、高灵活性发展,为数字中国建设铸牢云底座。

 

 

原文链接:https://www.cnblogs.com/developer-tianyiyun/p/17337600.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手! - Python技术站

(0)
上一篇 2023年4月22日
下一篇 2023年4月25日

相关文章

  • 云计算需要学习哪些内容 为什么要学容器技术

      云计算需要学习哪些内容?为什么要学容器技术?云计算是一门新兴热门技术,包含的内容很多,而容器技术是其中的重点。有人好奇为什么要学习容器,它具有哪些价值?下面就给大家讲解一下。   容器的价值可以从两个角度来分析:   1、从应用架构的角度。容器技术可以方便地支持微服务架构实现应用的现代化,更加灵活的应对变化和弹性扩展。在软件生命周期管理上面,容器技术可以…

    云计算 2023年4月13日
    00
  • 华工软院IBM LinuxONE Community Cloud云计算实验文档

    此博文介绍华南理工大学软件学院“云计算开发与应用”实验课。本人在大二期间选修了这门课,实验课内容是把已有的app部署到云服务器上运行。虽然实验内容很简单(作者大概一个小时就做完了两天的实验内容),但觉得这次实验是我在华工期间做过的为数不多有意义的实验之一,故作此博客记录实验详细过程。此博客以linux环境为准。 实验所需材料与环境配置: 本地环境:Manja…

    云计算 2023年4月11日
    00
  • linux环境不使用hadoop安装单机版spark的方法

    下面我为您详细讲解“linux环境不使用hadoop安装单机版spark的方法”的完整攻略。 一、安装Java环境 在Linux环境中,首先需要安装Java环境。可以通过以下命令进行安装: sudo apt-get update sudo apt-get install default-jre sudo apt-get install default-jdk…

    云计算 2023年5月18日
    00
  • ASP.NET Core3.X 终端中间件转换为端点路由运行详解

    下面是关于“ASP.NET Core3.X 终端中间件转换为端点路由运行详解”的完整攻略,包含两个示例说明。 简介 在ASP.NET Core 3.X中,终端中间件已被弃用,取而代之的是端点路由。端点路由是一种新的路由方式,它将路由和终端中间件合并到一起,提供了更加灵活和可扩展的路由方式。在本攻略中,我们将介绍如何将终端中间件转换为端点路由运行。 实现步骤 …

    云计算 2023年5月16日
    00
  • 云管、SDN、OpenStack组成的虚拟化云计算:虚拟存储

      卷: “volume”: { “attachments”: [], “availability_zone”: “nova”, “bootable”: “false”, “consistencygroup_id”: null, “created_at”: “2018-11-29T06:50:07.770785”, “description”: null, …

    2023年4月10日
    00
  • 给博客园闪存添加第三方功能 —— 云计算

    前言:   博客园有个闪存功能想必大家是都知道的, 如果你是第一次听说博客园的闪存, 那么可以先到这了解一下闪存的情况 http://home.cnblogs.com/ing/ 闪存每次最多能够发布300个字符, 比微博要长,  据我长期刷闪存的体验来看, 闪存的作用至少有两点, 一是及时记下自己瞬间的灵感, 二是大家在一起聊聊, 嗯, 挺好挺温馨的。   …

    云计算 2023年4月12日
    00
  • .NET 6新增的20个API介绍

    下面我来详细讲解“.NET 6新增的20个API介绍”的完整攻略。 1. 前言 在.NET 6中,添加了许多新的API,这些API覆盖了不同的领域,可以更容易地开发不同类型的Web和桌面应用程序。本文将向您介绍.NET 6中新增的20个API。 2. 新增的20个API 2.1. HttpClientJsonExtensions 在.NET 6中,为HTTP…

    云计算 2023年5月17日
    00
  • 云原生周刊:Kubernetes v1.27 发布 | 2023.4.17

    开源项目推荐 Palaemon Palaemon 是一个开源开发工具,用于监控 Kubernetes 集群的健康状况和资源指标并分析内存不足 (OOMKill) 错误。 Gitkube Gitkube 是一种使用 git push 将 Docker 镜像构建和部署到 Kubernetes 上的工具。 经过简单的初始设置后,用户可以简单地持续推送他们的仓库来实…

    云计算 2023年4月18日
    00
合作推广
合作推广
分享本页
返回顶部