用时间积累换突破月之暗面专注通用人工智能领域

发布时间:2025-08-12 07:05

  走进北京海淀区知春路的一座大厦,玻璃幕墙折射着中关村的创新活力——这里正是近期备受关注的北京月之暗面科技有限公司,也是孕育开源大模型Kimi K2的地方。该模型7月份上线即登上全球开源模型榜单,并在开闭源总榜上排名第五。

  月之暗面创始人杨植麟告诉2023年4月,在ChatGPT引发的AI大变革中,做了10年NLP工作的杨植麟和他的伙伴们一起创办了月之暗面,正如他们研究通用人工智能的使命一样:探寻那些尚未被看见,却可能改变世界的可能性。

  与办公区朴素而低调的陈设形成鲜明对比的,是月之暗面拥有多个知名大模型研发经验的团队。“公司现有员工约300人,一半为‘90后’。”月之暗面副总裁张荣介绍,在算法和工程领域,研发团队囊括了自然语言处理、计算机随着顶尖人才“滚雪球”式涌入,企业不断产出研究成果。2023年10月,Kimi智能助手上线万字长文本的智能助手。有了这款智能助手,使用者能一次性输入大量信息,由模型理解进行问答和信息处理。

  此后,好消息接踵而至。2023年11月,Kimi开放平台上线月发布Kimi浏览器助手;2024年推出具备长文本分析和AI功能的模型。今年,Kimi继续延伸:1月有了K1.5凭借很强的前端编程能力,在3D、游戏、动画制作等场景上,用简单的指令与Kimi K2交互,就能得到满意的结果。

  Kimi K2参数总规模达到万亿级别,激活参数却仅有320亿。这意味着,其能以更低的成本开展更加复杂的工作。目前,Kimi K2已接入部分国际主流开发平台。

  “你好呀!我叫Kimi,是由月之暗面科技有限公司开发的大语言模型。我擅长用自然流畅的语言和你互动交流。可以帮你解答各种问题。虽然我没有感情,但我会尽力理解你的意图,给出清晰、有用的回答。有什么我可以帮你的吗?”打开页,在对话框中输入“介绍一下自己”,很快会跳出一段流畅的回答。

  短短两年打造出一个能力很强的AI助手,不仅因为月之暗面拥有一支实力雄厚的技术团队,还归功于其持续推动底层创新、解决方向性问题的技术理念。

  理念体现在最初产品的选择上。2023年10月,不同于其他大模型公司拼参数、展示各种各样的行业案例,Kimi智能助手让“长文本”成了绝对的主角。这个拥有超长记忆的AI助手,支持约20万汉字的上下文输入。使用者可以与Kimi聊天、发送网址链接、上传文件,由它随时回答问题、速读文件、整理资料、激发灵感、辅助创作。突出的“长文本”能力,让它从众多同期大模型中脱颖而出。

  如果把大模型想象成一台计算机,长文能力相当于内存。内存越大,能做的事情越多。坚持对数据无损压缩,不断提升模型能力,不走滑动窗口、降采样、小模型等技术捷径。半年内,月之暗面团队把长文本能力扩展至200万字。这份坚持赢得了大量用户的认可。2024年,Kimi用户量增长了100倍,从几十万跃升至几千万。

  对底层技术创新的坚持,不止体现在对无损长文本的执着中,也体现在后续产品的功能配置上。Kimi K2就是个典型,这款整体能力很强的开源模型上线后,迅速成为API调用量和下载量增长最快的大模型。

  Kimi K2在多项基准测试中都达到了最佳性能和最优表现,在自主编程、工具调用、数学推理三方面的能力更为突出:第一个是编程能力,相当于程序员的高考。如果能拿到高分,说明这个AI已经可以帮助软件工程师解决很多问题;第二个是工具调用能力,得分高代表它可以成为数字实习生,在现实中帮助人们完成任务;第三个对应数学推理能力,就像是一场数学竞赛,表现卓越就能跟尖子生“掰手腕”。

  Kimi K2成为闯进权威榜单前五名唯一的开源模型非常不容易。与在算法保密上煞费苦心的闭源模型不同,Kimi K2项目团队将智能和能力开放给了所有开发者,相当于把知名企业的顶尖能力从保险箱搬到一个公共货架上,谁都能用。

  “我们是典型的技术理想主义团队,用时间换空间,用积累换突破。”Kimi K2项目团队表示,作为一家专注通用人工智能的公司,月之暗面寻求将能源转化为智能的最优解,通过产品与用户共创智能,实现普惠AI。“我们把代码变成人人可用的工具,不再是程序员的专属。”

  计算机领域有很多方向,每个方向需要的技能不同。Kimi K2相当于一位多面手实习生,可以很大程度提升不同开发者的效率。用杨植麟的话说,“很多时候,一个模型表现成什么样子由平台决定,但每个人都有自己的偏好,都应该有个性化定制的机会”。

  AI助手能帮助人们做什么?当着其实,早在Kimi K2发布前,它就按项目组的要求,用自己的能力写出工具,“弹”响了公司门口的电钢琴。这证明它具备像人一样处理任务的能力。

  有了Agent能力,Kimi K2主动在各种环境中去探索使用工具、学习新技能,跟电子世界甚至真实世界进行交互得到反馈,进一步强化自主探索完成任务的能力。Agent能力,本质上是模型向下一个层级迈进,类似模型中的动物和人的主要区别。据Kimi K2项目团队介绍,具备运用工具的能力是大模型的重要迭代。这项能力去年在业内还没达成共识,Kimi K2开启了Agent智能时代,但目前也只是Agent领域的一个早期产品。

  告别被动的一问一答,想让模型学习能力更强,就得下功夫耐心打造更强大的基座模型。Kimi K2项目团队介绍,“我们拒绝了抢发模型的诱惑,先建好基座模型”。同时,训练Kimi K2时,首次将创新的优化器应用到万亿级别参数量规模的模型训练上,并且验证训练效率,实现了技术突破。

  与面向垂类客户的“超级员工”不同,月之暗面想做通用全能且超越人类智能水平的产品。公司尽可能发展通用、泛化能力,学会新技能反哺其他技能。杨植麟说:“通用技术更复杂、有更多瓶颈,是一条更难走的路。”

上一篇:机械工业支柱地位稳步提升

下一篇:没有了