“昇腾 AI 开发者” 6 月 17 日宣布,昇腾 0 Day 支持 GLM-5.2,为编程与长程任务提供全面推理优化。
据官方介绍,目前昇腾 A3 系列产品已经支持 GLM5.2 的单双机以及大 EP 推理部署。针对 GLM5.2 模型的结构特点,昇腾围绕以下几个关键技术开展了高效推理优化:
通过将 AllReduce 优化为 ReduceScatter 与 AllGather 通信原语,并与矩阵计算形成紧耦合流水线,实现通信延迟的有效隐藏。
采用注意力前处理融合算子,结合多 Token 预测机制的加速,提升单步生成效率。
在高并发混合负载场景下引入预填充延迟调度,平滑计算峰值,降低 Prefill 阶段对 Decode 阶段的资源抢占。
结合 IndexCache 技术缓存高频专家路径与静态路由表,并采用 Chunked Prefill、稀疏索引检索等方法,优化长上下文推理性能。
通过 Prefill 与 Decode 阶段分离及前缀缓存技术,压缩解码时延抖动,提升在线服务吞吐稳定性。
智谱 6 月 17 日宣布上线。在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,GLM-5.2 取得全球可用模型第一的表现。
极致 Infra 优化,Day 0 运行在国产算力平台:在 1M 上下文长度下,将单位 token 的 FLOPs 降低至 2.9 倍;已在 Day 0 完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的推理适配;预计下半年昇腾 950 超节点上市后,也将成为 GLM-5.2 强劲的算力底座
特别
河南灵宝足疗店火灾致6人[*][*],事故细节披露:点蜡焚香引燃聚氨酯墙面,6名顾客因饮了酒未及时逃生,吸入有毒烟气遇难
国营煤矿“沉没”后,矿长司机发现名下有一个5800万流水账户,提现超1600万,投诉至今无果
杭州深山老林里,一辆酷炫的路特斯跑车趴窝了近半年,轮胎也全瘪了,每天都有人去打卡拍照,是被主人遗弃了?










