2022年2月,国家发改委、中央网信办等4部门联合印发通知,同意在京津冀、长三角地区、粤港澳大湾区、成渝地区、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。这是我国继“南水北调”“西电东送”“西气东输”等工程之后,又一项国家重要战略工程。
(相关资料图)
夯实算力网络基础建设
“数”指数据,“算”即算力,是对数据的处理能力。所谓“东数西算”,是通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部数据流动到西部存储、计算。那么,“东数”为什么要“西算”?中国工程院院士、清华大学计算机科学与技术系教授郑纬民表示,目前,我国数据中心大多分布在东部地区,但由于土地资源紧张,电力成本较高,100P计算能力的机器一年的电费约为5000万元,不利于实现碳中和与碳达峰。而西部地区具有土地资源和电力资源(清洁能源)优势,为计算存储器搭建提供了便利条件。
“随着互联网的普及,各行各业都有大量数据需要处理,对算力的需求非常庞大,而且还在不断增长。”中国社会科学院可持续发展研究中心副主任陈迎介绍,截至2021年底,我国在用数据中心机架规模达520万架,近五年年均复合增速超过30%。数据中心不仅需要占用土地,而且处理数据耗电量巨大。
数据显示,2021年,我国全社会用电量83128亿千瓦时。其中,数据中心年用电量占全社会用电量的2%左右,且增长快速。陈迎谈到,对于绝大部分城市和地区,没有特殊电力优惠或补贴的情况下,电费约占运营成本的60%左右,北京或上海等地可高达70%—80%。数据中心既是耗电大户,也是碳排放大户。2021年,全国数据中心二氧化碳排放量达7830万吨。
按照全国一体化大数据中心体系布局,8个国家算力枢纽节点将作为我国算力网络的骨干连接点,发展数据中心集群,开展数据中心与网络、云计算、大数据之间的协同建设。以此作为国家“东数西算”工程的战略支点,推动算力资源有序向西转移,解决东西部算力供需失衡问题。
8个枢纽节点中,京津冀地区、长三角地区、粤港澳大湾区、成渝地区,属于我国经济发展核心区域,用户规模较大;而内蒙古、贵州、甘肃、宁夏都在西部地区,当地的算力需求不大,可承接东部地区的算力需求。
那么,哪些数据应送往西部去算?郑纬民提出,西部的算力枢纽和数据中心,主要可以用来处理后台加工、离线分析、存储备份等对网络要求不是很高的业务;东部的算力枢纽和数据中心,主要用来处理工业互联网、金融证券、视频通话、游戏程序、人工智能推理等对网络要求高的业务。
“东数西算”潜力巨大
近年来,张家口以超大规模绿色存储为切入点,不断推动大数据产业发展,使之逐步发展成为产业转型升级、经济提质增效的新引擎。正在建设的张家口数据中心集群起步区为张家口市怀来县、张北县、宣化区。该数据中心集群将积极承接北京等地实时性算力需求,构建辐射华北、东北乃至全国的实时性算力中心。截至目前,阿里、腾讯、秦淮等12个数据中心在这里投入运营,投运服务器103万台。
数据中心产业对提升全社会生产效率和全要素生产率作用巨大。陈迎认为,“东数西算”工程试图改变数据中心分布地域不均衡的格局,使东西部的需求和资源得到优化配置,实现优势互补。这一布局有助于进一步提升国家整体算力水平,促进数据中心产业向绿色化、一体化、集约化、高效化方向发展。同时,有利于通过加大对西部地区数字化基础设施布局和建设,促进数据中心行业的绿色低碳发展,带动相关产业转移,对数字中国建设和实现“双碳”目标均具有重要价值。
“东数西算”工程将惠利西部地区信息技术、绿色能源等产业健康发展。上海交通大学网络信息中心副主任林新华认为,“东数西算”工程在应对数据中心建设上是双赢举措。一方面,西部地区丰富的电力和土地资源将得以充分利用;另一方面,东部地区的电力负担将得以大幅减轻,数据中心的用地需求也将大幅降低。在促进区域经济发展上,通过建设各类数据中心,不仅可以带动相关产业的发展和人才培养,减轻东部大城市的压力,也有助于刺激西部地区经济发展,提升居民生活水平。
为建设数字中国提供有力支撑
截至2022年4月,全国10个国家数据中心集群中,新开工项目25个,数据中心规模达54万标准机架,算力规模巨大,带动各方面投资超过1900亿元。
“当前,我国算力可分为三大类。”郑纬民介绍,第一类是高性能计算,即“超算”,我国有十几个超高性能计算中心,这些超算中心的算力强大,对国防、国家经济、国民生活水平起到很大作用。第二类是近些年出现的人工智能计算机,它们主要处理人工智能应用问题,国内正在建设很多人工智能计算机中心,发展很快。第三类是数据中心,更多是通过云计算的方式为大家提供算力的公共服务。其中,前两类算力更适合建在西部,而数据中心算力对实时性要求很高,目前尚无法建到西部。
郑纬民建议,推进“东数西算”工程,打消企业数据西迁顾虑,首先要解决的是并网问题,努力实现带宽高、延迟低的传输要求。另外,随着各地算力基础设施发展完善,算力联网形成统一标准、统一调度是大势所趋。因此,亟待解决的第二件事是尽快完善调度程序,通过算力调度,实现算力资源有效配置。
林新华表示,构建全国一体化算力网络体系要抓住两个关键点。第一,要遵照国家统一布局,各数据中心和计算中心建设要控制节奏,有序推进。第二,要重视规范和标准。由于各中心的建设使用了不同厂商的不同技术方案,为了实现数字资源的平滑使用,实现计算资源的互联互通,需要从一开始就重视数据规范的制定以及数据交互标准的研制。
“东数西算”工程在推进过程中必然会面临不少困难,很多问题已引起高度重视并着手解决,比如技术问题、政策问题等。在林新华看来,“东数西算”和“南水北调”“西气东输”等工程相比,有一个本质区别,即“东数西算”中的数据是人工资源,而其他工程调运的都是自然资源。自然资源在使用上门槛较低,对人的要求不高。但数据这种人工资源则不同,在使用上有较高的门槛,数据到了具有专业知识和技能的人手里才能发挥出最大作用。因此,“东数西算”工程的顺利推进,需要大量懂数据和计算的专业人才做支撑。我们要特别重视这个问题,加大人才培养力度,提升人才储备和服务水平。
全球数字化浪潮使数据成为继土地、资本、劳动力、技术后的又一关键生产要素。随着“东数西算”工程的逐步推进,大数据、云计算、超级计算中心、新一代网络技术等相关产业加速发展,打通东西数据直连通道,确保“东数西算”这一重大工程目标任务落到实处,将为建设数字中国、推进经济高质量发展注入新动能。
中国社会科学报记者 段丹洁