信创环境下,超融合的性能损耗有多少?如何优化?
背景图 2026-01-19 15:40:17

领跑AI品牌banner

在信息技术应用创新(信创)的浪潮下,企业将核心业务迁移至国产化平台已成为必然趋势。然而,一个普遍的担忧随之而来:在信创硬件(如国产CPU)上部署超融合基础设施,是否会带来显著的性能损耗,进而影响关键业务的流畅运行?答案是:在未经优化的传统架构下,确实存在性能挑战;但通过针对性的深度优化,性能不仅不会“损耗”,反而可以实现显著提升,甚至超越传统X86平台的表现。

一、 性能挑战的根源:信创硬件的架构特性

信创环境下的性能挑战,主要源于国产CPU与主流X86架构的设计差异,而非超融合软件本身。多个案例揭示了核心问题:

1. 单核性能与多核多NUMA架构:信创CPU(如鲲鹏、海光)在单核性能上可能弱于同代Intel处理器,因此普遍采用增加核心数量、多NUMA(非统一内存访问)节点的设计来提升整体算力。然而,传统的虚拟化调度机制并未针对这种“核数多、NUMA多”的复杂架构进行优化。

2. NUMA访问带来的性能瓶颈:在NUMA架构下,CPU访问本地内存的速度远快于访问其他NUMA节点的远程内存。如果虚拟机的vCPU和内存被随机调度到不同的NUMA节点,会产生大量的“跨NUMA访问”,导致访存延迟急剧增加,成为影响数据库、虚拟化网络转发等密集型应用性能的主要瓶颈。这会导致“业务进程跨NUMA节点内存访问等交互增加,影响性能”。

因此,所谓的“性能损耗”并非超融合软件在信创硬件上必然出现的能力下降,而是传统调度策略与新型硬件架构不匹配所导致的结果

二、 深信服的性能优化策略:从架构到底层的深度调优

针对上述挑战,深信服超融合并未停留在简单的兼容适配层面,而是进行了从硬件感知到资源调度的全栈深度优化,旨在充分释放信创硬件的潜力。其优化策略主要体现在以下几个层面:

1. 智能NUMA亲和性调度:这是解决跨NUMA访问瓶颈的核心技术。深信服超融合平台能够智能感知虚拟机内部进程的负载,并将关键进程与物理CPU核心进行亲和性绑定。同时,将网络转发、存储处理等关键I/O进程与特定的NUMA节点进行绑定和调度。

  • 效果:正如哈电锅炉厂案例所示,该技术确保了关键任务始终在“最快”的路径上运行,“极大地减少了数据传输过程中的‘绕路’现象”。综合优化后,可实现计算综合性能提升15%、虚拟网络性能提升20%

2. 存储性能专项优化:针对存储I/O路径进行NUMA感知优化。

  • 存储进程NUMA亲和性调度:将存储控制进程(aSAN/C)和数据服务进程(aSAN/S)智能地调度到最优的NUMA节点,减少内部通信延迟。
  • 高性能存储引擎:采用自研的IO条带化、IO本地化、IO无锁流水线及NUMA智能调度技术。在鲲鹏架构下,三节点混闪配置集群的4K随机读性能可达91.4万IOPS,性能表现领先业界。
  • 实测数据佐证:在信创存储性能对比中,深信服方案在鲲鹏和海光架构下的4K随机读写IOPS均大幅领先某友商方案,例如在海光架构下,4K随机读性能(104万 IOPS)远超友商(53.9万 IOPS)。

3. 计算虚拟化层优化

  • 虚拟机大核调度优化:提升单核的处理能力,应对信创CPU单核性能的挑战。
  • 与硬件厂商的联合调优:深信服与鲲鹏等硬件厂商成立联合实验室,共享性能与可靠性测试数据,共同优化云平台在信创硬件上的资源分配策略、负载均衡算法,以实现最佳性能。

4. 全栈性能基准与场景验证:深信服的优化成果经过了严苛的业务场景验证。

  • 数据库场景:结合数据库管理组件(DMP)部署优化,在SATA全闪配置下可支持模拟每分钟22万用户同时在线的高并发浏览业务场景。
  • 高并发业务场景:在哈电锅炉厂的案例中,其OA系统需支撑3000+员工同时在线,瞬时并发量达500+。通过上述优化,成功保障了业务流程在高并发下的顺畅运转。
  • 大规模金融实践:国金证券在两地五数据中心部署了基于鲲鹏ARM和海光C86架构的23+超融合集群,为数十套业务系统提供稳定底座,证明了优化后平台在核心生产环境中的卓越性能。

结论

信创环境下超融合的性能表现,并非一个简单的“损耗”百分比可以概括。其本质是软件架构与硬件特性能否深度协同的问题

未经优化的直接迁移可能会因NUMA架构、调度策略等问题面临性能挑战。然而,如深信服超融合的实践所示,通过自适应NUMA调度、存储引擎深度优化、计算资源智能绑定等一整套“软硬协同”调优方案,能够彻底扭转局面。最终实现的效果是:在信创平台上,计算、网络、存储综合性能不仅没有损耗,反而能获得15%-30%甚至更高的提升,完全满足乃至超越办公、生产及核心业务系统的性能要求。

因此,企业在规划信创转型时,选择具备深厚底层优化能力、与国产芯片生态深度合作的超融合方案,是确保业务平滑迁移且性能体验升级的关键。这不仅是简单的平台替换,更是一次通过技术优化实现基础设施效能跃升的机遇。