2025年4月10日-11日期间,由中国移动主办的“2025中国移动云智算大会——由云向智,共绘算网新生态” 在江苏苏州举行。中国信息通信研究院云计算与大数据研究所副所长栗蔚出席大会,并发表“大模型推理应用重塑云智算技术体系”主题演讲。
大模型推理应用正重塑云智算技术体系,成为推动智能化转型的核心引擎。从算力需求的结构性转换到技术架构的深度重构,再到大模型推理服务质量的场景化演进,云智算技术正迈向从“算力供给”到“智能赋能”的新范式,为数字经济的高效、普惠与可持续发展提供坚实技术支撑。
“人工智能+算力+云”融合,加速我国数字经济蓬勃发展。
栗蔚指出,大模型推理性能驱动算力结构转型,从以训练为主转向以推理为核心,从当前70%以上用于集中式训练到未来70%以上用于分布式推理。全球云计算市场规模持续增长。2024年全球云计算市场规模达7,022亿美元,增速 19.7%。国内市场云计算市场规模总计8,378亿元,较2023年增长35.9%,其中以中国移动为代表的运营商占三分之一以上份额,走在全球运营商前列。数字产业化市场来看,以大模型为主线的人工智能技术创新活跃,显著促进我国全要素生产率提升,对经济增长的整体贡献达到22.5%。 破局与重构:大模型推理加速的云智算技术突破
栗蔚指出,从数字化时代向智能化时代的演进中,云智算技术正聚焦于大模型推理场景与应用,呈现“1+3”的破局与重构趋势。商业模式破局,随大模型产业从预训练竞赛转向推理服务效能优化,商业模式逐步由单纯的技术竞赛过渡到价值共享与产业落地,强调高效推理技术与垂直应用场景结合以实现商业闭环;“云+算力互联”重构,一纵一横推动了云计算与分散算力资源的有效整合,催生了MaaS、AaaS等新型服务模式,并构建了“一点接入、全算贯通”的算力互联网架构,赋能全域大模型推理调度;“云+大模型”重构,芯片、框架和模型三位一体的协同优化进一步提升了异构推理性能;算力部署演进,政企大模型部署经历了从云原生到私有化场景的一体机方案,直至未来迈向云边端协同的发展路径。
可用性与性能是衡量大模型推理云服务质量的关键
栗蔚指出,随着云智算技术架构的深度重构,可用性与性能是衡量大模型推理云服务质量的关键。可用性方面,DeepSeek官网服务的频繁繁忙现象,折射出大模型推理服务接入后的首要挑战——如何保障服务的稳定性和连续性。性能方面,以TTFT、TPOT、延迟、单卡吞吐量和上下文长度为代表的“快、稳、密、异”四大指标是客户端关注推理性能的焦点。通用基线场景中,各云厂商通过优化整合“云+算力互联+大模型”,在昇腾910B、H20等芯片上的适配优化提升推理表现。行业应用场景中,因输入输出特性的差异,定制化需求显著,需依赖硬件互联效率与容错机制的协同进化来突破分布式推理性能瓶颈,而算力互联调度则是提高资源利用率的核心基石。
中国信息通信研究院工作开展
未来,中国信通院将不断深化大模型推理领域的研究探索,推动AI Cloud与算力互通体系建设,持续开展大模型推理云服务性能测试,强化产业协同与合作,提升各行业智能化水平,构建一个开放、合作、共赢的人工智能、算力和云计算深度融合的生态,为企业数智化转型注入活力。