2月12日凌晨,智谱正式上线并开源新一代大模型 GLM-5,同步在 Z.ai、智谱清言 App/网页版、BigModel平台开放体验。与以往偏向对话式的Vibe Coding工具不同,GLM-5是开源界第一个能处理长周期、多步骤、系统性工程任务的“架构师级”模型,实现了从Vibe Coding到Agentic Engineering的升级。
Vibe Coding时代过时!GLM-5实现一键“写工程”
不同于以往主要聚焦前端生成、函数补全或单点任务完成的编程模型,GLM-5面向的是真实工程场景中的完整开发流程。模型能够自主完成从需求理解、代码编写到调试与部署的全过程,覆盖跨文件协作、后端逻辑构建、错误定位与多轮调试等高复杂度工程问题,其能力边界正逐步逼近真实软件开发中的完整闭环。
GLM-5 在编程能力上实现了对齐 Claude Opus 4.5,在业内公认的主流基准测试中取得开源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型最高分数,性能超过 Gemini 3 Pro。

一句话自动干完整个复杂工程, 已经有人申请上架App Store
升级的智谱GLM-5在代码与智能体能力上达到开源SOTA水平,具备接近Claude Opus 4.5的工程能力。

GLM-5 已纳入 GLM Coding Plan Max 套餐,并在 BigModel.cn、Z.ai 及智谱清言同步上线,开发者可一键兼容 Claude Code、OpenCode、Kilo Code 等主流开发工具,标志着智谱AI商业化进程进入新阶段。其前代产品GLM-4.7的MaaS平台年度经常性收入(ARR)在10个月内从2000万增长至5亿元,其中海外收入占比超2亿元,展现出清晰的商业模式和强劲的全球变现能力。ARR曾在十个月内增长25倍。
在GLM-5匿名模型Pony Alpha的内测过程中,有开发者让GLM-5连续自己跑代码超过24小时,在700次工具调用、800次上下文之后,从零实现一个Game Boy Advance模拟器。有开发者使用 GLM-5 独立完成学术版“抖音”,目前这个 APP 已经提交 App Store 申请,即将上线。这一案例展示了 GLM-5 在复杂系统工程中端到端交付可部署产品的能力。
国芯神奇七姐妹护航大国模上线,GLM-5跑出最强“中国方案”
在工程落地层面,GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行。
这背后的意义不止是一次工程适配,更关乎 AI 算力供应链的自主可控,叠加国产算力平台的可控供给,使得开源Agentic Engineering级生产力工具第一次具备可大规模交付的现实条件。

长期以来,闭源模型凭借在复杂工程任务中的稳定交付能力构筑了竞争壁垒,开源模型则多定位于低成本平替。而GLM-5的发布,意味着开源阵营首次在“工程可交付性”上实现对顶尖闭源模型的追赶,为全球开发者提供了首个具备系统工程能力的开源基础模型,或将彻底改变行业格局。
