读创
读创
深圳商报·读创客户端首席记者 陈小慧
4月3日,由中国电信联合阿里云建设的粤港澳大湾区首个“真武”万卡智算集群在韶关数据中心正式上线。作为国家“超大规模智算集群”新基建工程在大湾区的首个落地项目,该集群实现了从芯片、云平台到模型应用的全链路自主研发,标志着国内先进算力正从高端性能突破迈向规模化产业落地。
据介绍,该集群在技术层面实现了多项关键突破。集群采用新一代高性能组网架构,端到端数据传输时延低至4微秒,网络峰值利用率超过95%,上万张芯片得以像一台超级计算机一样协同工作,稳定承载千亿参数级大模型的训练与推理任务。单机性能同样突出——单台“真武”服务器配备1.5T超大显存,片间互联带宽700GB/s,Qwen3.5、DeepSeek-V3.2全参数版等主流开源大模型均可在单机上直接部署运行。在开发生态层面,“真武”芯片已全面适配主流AI框架与工具链,并提供统一编程接口,开发者无需重写代码即可将已有业务平滑迁移至国内算力平台。
在此基础上,集群提供了从IaaS、PaaS到MaaS的全栈AI云能力,用户既可以用它训练自己的专属模型,也可以直接调用已有的大模型能力。得益于针对“真武”芯片深度优化的工具套件,模型运行环境可在秒级完成加载,单个模型的微调最快数小时即可完成,整体训练与推理效率较通用方案提升超过30%。这种“开箱即用”的模式,让用户无需受困于底层建设与反复调参。
目前,该集群已在诸多行业场景落地。在医疗民生领域,集群上线“全诊通”应用,面向基层医疗机构提供诊疗智能化服务,已在中山大学肿瘤防治中心等医院开展应用试点;在产业创新领域,为电子信息、先进材料、生物医药、装备制造、低空经济等重点产业提供模型训练、推理与调优服务,有效缩短创新周期。
依托阿里全栈AI技术带来的协同优化,集群单卡吞吐性能较传统部署模式提升达9.3倍,单机每秒Token生成量实现近10倍。为进一步推动算力普惠,相关资源已同步上架“广东电信算力超市”,面向中小企业提供按卡、按小时计费的算力零售服务。同时,集群预计扩容至十万卡规模,助力大湾区更多科研机构、企业和政府单位以更低成本、更高效率使用算力资源。
审读:马如骁
Copyright©2020 Sxzm. All rights reserved.