新闻

你的位置:kaiyun体育全站app入口IOS/安卓全站最新版下载 pc6下载站 > 新闻 > 开yun体育网结束分钟级故障定界定位和小时级模子断点续训-kaiyun体育全站app入口IOS/安卓全站最新版下载 pc6下载站


开yun体育网结束分钟级故障定界定位和小时级模子断点续训-kaiyun体育全站app入口IOS/安卓全站最新版下载 pc6下载站

发布日期:2025-07-24 11:05    点击次数:90

本报记者 李乔宇

哈尔滨冬日的室外温度动辄低至零下二十摄氏度,中国挪动智算中心(哈尔滨)(以下简称“哈尔滨智算中心”)的展厅却和睦如春。

与其他地区的数据中心比较,哈尔滨智算中心具有特有的温度上风。“数据中心是公认的‘耗能大户’,但在哈尔滨,咱们每年有157天无须空调降温,将大幅减少智算中心降温所需要的能耗。”在上述展厅里,中国挪动通讯集团(以下简称“中国挪动”)黑龙江有限公司政企作事部司理郅刚告诉《证券日报》记者:“同期咱们也对智算中心的热能有考究化的二次欺诈,展厅的温度以及总共园区的供暖齐来自机房的免费的‘热’。”

特有的状态上风,让公共运营商最大单集群智算中心落户于此。如今,哈尔滨智算中心也曾结束AI芯片100%国产化,初度通过国产汇集劝诱探索1.8万张智算卡单集群部署范围上限,可提供6.93EFLOPS(每秒693亿亿次半精度浮点运算)智能算力,相当于300多万台高性能计算机的算力水平。

筑起“极致算力”

据先容,哈尔滨智算中心的前身哈尔滨数据中心看成“四云合一”的数据中心,具备坚决的数据处理和存储功能,承载了中国挪动用户十亿量级的行程码数据;看成寰球5G汇集东北大区的中枢节点,这里还承担着北京和河北地区的通讯备份任务,在诸如冬奥会等要紧行径期间,哈尔滨简略提供与北京同等第别的通讯保险;哈尔滨数据中心还积存了包括百度在线汇集本领(北京)有限公司、阿里巴巴集团控股有限公司、腾讯控股有限公司在内的120余家互联网大厂的工作器。

伸开剩余69%

“同期咱们还具备坚决的算力运输才能。”郅刚示意,中国挪动在哈尔滨建筑了寰球400G的OTN(光传送网)省际主干网,简略结束地市之间1毫秒、省内5毫秒、寰球20毫秒的信息传输速率,为算力“大脑”构建起高速开动的“神经”。

在哈尔滨智算中心里面,一条写着“大干两个百天 死力书写智算范围自立自立的时间答卷”的红色横幅高出轮廓。

在两个“一百天”里,中国挪动完成了哈尔滨数据中心迈向哈尔滨智算中心的转型升级,完成3千多正常米高功耗机房要紧退换改良,千万级精密器件复杂施工;30多个单元、千余东谈主的协同作战,结束了提前4个月建成公共运营商最大单集群智算中心。

谈及哈尔滨智算中心,郅刚用了“极致算力、极限组网、极效存储、极速运维”几个词。“极致算力”指的是6.93EFLOPS智能算力;“极限组网”指的是罗致国产46KW风冷汇集劝诱、构建最大范围两级组网;“极效存储”指的是罗致大范围交融分级存储,温顺大模子考验时海量、万般数据的高效处理和高糊涂条目;“极速运维”指的是通过轨制、本领和要领三大措施,结束分钟级故障定界定位和小时级模子断点续训,保险万张AI加快卡长久间踏实并行考验,为万亿模子考验提供高性能、高可用、高可靠的算力底座。

“目下,中国挪动九天千亿参数模子已在集群上结束高效、长久踏实考验。”郅刚示意。

国产化进度进步

哈尔滨智算中心中红色横幅提到的“智算范围的自立自立”,既体目下万卡集群赋能国内AI产业发展上,也体目下AI芯片国产化率100%上。

“万卡集群”是由越过一万张加快卡(如GPU、TPU、NPU等专用AI芯片)构成的高性能计算系统,主要用于加快东谈主工智能模子的考验和推理。

“咱们每台机柜会装置三台寰球产化算力工作器——昇腾智算工作器Atlas 800 TA2,每台工作器搭载4颗CPU芯片和8颗NPU芯片,每一颗NPU芯片提供376TFLOPS(每秒一万亿次浮点运算)算力,八颗NPU芯片一共简略提供3PFLOPS(每秒一千万亿次浮点运算)算力,哈尔滨智算中心的工作器总和为2304台,举座简略保险6930PFLOPS高效踏实的算力输出。”

值得一提的是,《证券日报》记者驻扎到,跟着本领、性能和生态建筑上捏续完善,我国AI芯片也曾简略结束与海外顶尖居品同台竞技。

2024年4月份,中国挪动智算中心(呼和浩特)为彼时公共运营商最大单体智算中心,AI芯片国产化率超85%,智能算力范围高达6.7EFLOPS。四个月后,哈尔滨智算中心弘扬上线投产,AI芯片国产化率以及智能算力范围较中国挪动智算中心(呼和浩特)均有增长。此外,政府为主导的城市智能计算中心多罗致国产AI芯片。

谈及万卡集群智算中心国产化态势,中昊芯英(杭州)科技有限公司首席处理决议架构师平晓峰示意,目下国内国产GPU芯片厂商与NPU、TPU等芯片厂商齐在积极布局万卡集群市集。

据平晓峰先容,GPU芯片与NPU、TPU芯片各有千秋,均能充分温顺万卡集群智算中心的算力需求。“GPU出现较早,着手用于图像处理,因其高并行计算才能而在大模子出现的早期阶段成了支捏模子计算的硬件采用,但其功耗和老本较高。”平晓峰示意,“像以TPU为代表的AI芯片,则是特意针对AI大模子计算框架而贪图,在AI智算场景中所阐扬出来的计算性能、算力欺诈率、能效比等更有上风。”

“万卡集群智算中心的国产化趋势也曾较为显著。”平晓峰示意开yun体育网,智能算力建筑迈入万卡时间,算力需求旺盛,市集出路高大,预测国产AI芯片的新生发展与万卡集群智算中心的算力需求将结束互相建树。

发布于:北京市

上一篇:体育游戏app平台郑宏代表院党组向全体司法巡警致以节日的致意-kaiyun体育全站app入口IOS/安卓全站最新版下载 pc6下载站
下一篇:欧洲杯体育动怒点为卡斯泰克湖近邻-kaiyun体育全站app入口IOS/安卓全站最新版下载 pc6下载站