中信证券:大模型密集迭代升级 关注模型原厂、AI应用、AI基础设施方向机遇

发布时间:2026-04-02 20:56

  中信证券发布研报称,2026年以来,国产大模型厂商聚焦Agent及代码能力升级,竞相发布新模型。即将发布的DeepSeek下一代新模型有望延续高性价比开源模型路线,在能力上实现更强记忆功能与超长上下文处理,精进代码、Agent能力的同时并补齐多模态短板,带来模型原厂、AI应用、AI基础设施方向的新投资机遇,该行建议关注这三条投资主线。

  、Kimi等国内厂商均推出了“类龙虾”产品,释放数字员工生产力。原生多模态领域,原生多模态架构已成主流方向,混合嵌入编码快速突破,国内模型在实时音交互以及跨模态连续推理等关键环节仍亟待突破。

  代码能力进一步升级,M2.7 SWE-Pro测试得分56.22%,超越Gemini 3.1 Pro;在实现端到端完整项目交付场景VIBE-Pro测试中得分55.6%,比肩Claude Opus 4.6,对软件系统的运行逻辑理解进一步增强。同时M2系列模型在RL等场景参与M2.7训练过程,实现模型自我迭代。

  GLM-5引入DSA并自研“Slime”架构,能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,在工具调用和多步骤任务执行、联网检索与信息理解能力接近甚至超过海外领先模型水平。

  Kimi 2.5引入了Xiaomi MiMo-V2-Pro在ClawEval、t2-bench等衡量模型Agent调用能力的测试集中接近甚至领先部分海外头部模型,其早期内部测试版本以Hunter Alpha 的匿名代号上线OpenRouter,上线期间多天登顶调用量日榜。该行看好大模型底座赋能小米人车家全生态,实现AI能力跃升。

  DeepSeek在26年1月发布的DeepSeek V3.2采用稀疏注意力+混合专家架构,实现训练、推理的提效降本,输入/输出token定价分别下降60%/75%,同时代码、多Agent能力BenchMark得分显著提升。结合DeepSeek模型进化方向及梁文峰参与署名的Engram模块论文,该行认为DeepSeek V4.0等新一代模型有望将Engram融入已成熟的DSA+MoE架构,通过分层存储关键常用信息实现Transformer架构中注意力层计算量的指数级下降,进而实现超长上下文处理,提升模型效率的同时精进代码、Agent能力,补齐多模态短板。

  AI核心技术发展、应用拓展不及预期,算力降本不及预期,AI被不当使用造成严重社会影响,数据安全风险,信息安全风险,行业竞争加剧。

排行

精选