华为数据存储亮相第六届数字中国建设峰会,华为公司副总裁、数据存储产品线总裁周跃峰博士出席数字产业集群分论坛并发表了“构建先进数据存力,推动数据基础设施高质量发展”的主题演讲。周跃峰表示,数据基础设施是数字经济高质量发展的基石,我国数据存力建设仍处于发展阶段,通过加强先进数据存力建设,可有效提升数据基础设施水平,充分释放数字经济活力。
主要发言内容如下:
数字经济已经成为主流。2022年,中国数字经济占整个GDP的40%左右,数据基础设施已经成为了数字经济高质量发展的基石,其中有三种能力是很重要的:计算力量(算力)、数据存储力量(存力)、搬运数据的力量(运力)。
数据存力是以存储容量为核心,包含性能表现、可靠程度、绿色低碳在内的综合体现。截至2022年底,中国的存力规模已经超过1000EB排列全球第二。
今天我想分享的主题是构建先进数据存力,推动数据基础设施高质量发展。
首先,我们看到了未来的一些变化:
1、新型应用越来越多,十年前企业在数字化转型过程中应用更多的是数据库、数据查询等工具,而今天大数据、人工智能等更多的新型应用层出不穷。
2、非结构化数据进入生产系统。数字化过程中以往主要是结构化数据,如表格类。而今天,图像、语音甚至是视频这类数据逐渐成为了新的生产要素。
3、数据安全越来越重要。过去由于自然、人为因素造成的数据丢失已经让很多企业甚至政府承受了巨大损失。如今勒索病毒攻击也在无时无刻发生,我国发生的频率也越来越高。面向未来,数据安全这一工作已经成为一个重要挑战。
过去谈起数据存储,我们主要关注三个方面:容量、可靠、性能。面向未来我们认为还应增加三类维度:能效、安全与多云生态。发展先进数据存力,有六个方面的创新是值得我们关注的:
第一,先进介质应用。
数据是存在介质上的,而介质是不稳定的。几千年前我们把文字写在纸上甚至是刻在石头上,到今天留下来的信息非常少了。现在我们把数据存放在U盘、硬盘当中,过几年数据可能也会丢失,但是不同的介质保持稳定度和能耗不一样。如今中国的数据中心使用半导体介质即SSD闪存盘的比例不到30%,在美国、新加坡、瑞士等数字化程度比较高的国家的数据中心先进的半导体介质使用比例已经超过了50%。介质的选择对节能来说显得尤为重要。传统硬盘的容量密度和能耗相对来说都是比较差的,尤其是能耗方面,数据中心的能耗大概30%都消耗在数据存储当中。因此,使用半导体的存储介质已经成为一个潮流,磁退硅进,使用更高比例的SSD闪存盘将使得我们的存力更为先进。
第二,新兴应用承载。
过去我们很多应用是放在一台服务器或者多台服务器当中,需要调用服务器中算的力量和存的力量,人们很难对算力和存力做到最为合理的规划。今天我们更愿意推广一种架构就是存算分离的架构。算力来处理程序应用,存力来承载数据,分离之后规划将变得更加清晰,存不够了增加存力,算不够了增加算力。很多例子表明,先进的存算分离架构可以承载更多的、更好的新兴应用。
三,多云数据协同。
企业和政府往往会有多个云存在,可能是多个私有云+多个公有云,每一个私有云或者公有云承载了不同业务部门的数据。如何让某一个私有云下面的应用调用另外一个部门或者其他私有云下面的应用,我们过去往往需要拷贝数据,这是非常浪费资源的。更先进的做法是底层存储具备数据分级存储和流动的能力,让数据能够在多云之间流动起来,这是产业界面向未来很重要的存力创新方向。
四,Diskless新型架构。
在数据中心、尤其是公有云数据中心需要搭建大量的服务器,服务器里有算力也有存力。面向未来,在数据量暴增后,我们更希望看到一种先进的架构即Diskless架构,让服务器成为无状态的,即上层是不带硬盘的服务器,下层是我们集中的硬盘,让服务器与数据解开。这样做的好处是存算分离之后,我们可以解决算力和存力生命周期不一致的问题、硬盘亚健康管理运维问题以及三副本技术带来的成本问题。应用Diskless架构后,可以帮助节约30%的项目成本,让数据中心更高效。
五,数据安全可靠。
在中国,我们的数据容灾备份比例较小,只有欧美国家的一半,这就意味着我们在遭受一些自然灾害、系统性硬件故障或者人为错误时数据很容易丢失。除此之外,近年来在中国乃至全球,每10秒钟大概就有一起数据勒索的事件发生。数据勒索是指人为的、刻意的把病毒侵入到数据中心,对数据进行加密,让你无法使用,除非交大量的赎金。过去,我们重视网络安全却忽略了数据存放的“保险箱”的安全,而存储作为数据的“保险箱”,应该具备内生的防勒索能力。
六,绿色低碳节能。
数据中心大概30%的能耗被存储设备所消耗掉,我们需要更多创新的技术帮助存储系统在全生命周期管理内系统化提升能效。我们倡导从生产加工、架构设计到行业应用都要实现绿色节能,这要求我们采用创新的工艺和技术使能存储,比如零波峰焊接、标签无纸化等,才能有效降低数据中心能耗与碳排放。
基于以上这些重要技术创新,我们认为它们将是构建中国先进数据存力的重要方向。最近我们也计划联合各单位发布一系列白皮书,将更系统的向产业界阐述先进数据存力,希望大家可以持续关注,谢谢大家!