从写代码到做工程,北京AI用硬核技术改写全球AI竞赛规则

从写代码到做工程,北京AI用硬核技术改写全球AI竞赛规则
2026年02月17日 08:48 新京报网

2026年,全球人工智能领域迎来新一轮技术爆发潮。在这场激烈的技术竞赛中,北京企业展现出强劲实力,在全球掀起“惊涛骇浪”。

1月8日,智谱AI在香港交易所挂牌上市,成为“全球大模型第一股”,此后发布的智谱GLM-5在全球权威榜单中位居全球第四、开源模型第一。2月7日,字节推出的视频生成模型Seedance 2.0全球“出圈”,令好莱坞导演惊叹,让海外网友在社交平台“催上线”。Kimi、生数科技、面壁智能、银河通用等企业也相继推出新一代大模型产品,在通用大语言模型、多模态视频生成、代码编程、具身智能等核心赛道实现全面突破。

北京,这座千年古都,正在以惊人的速度蜕变为全球AI创新的策源地。

从“会写代码”到“能完成工程”

过去两年,大模型在代码生成能力方面的进展业界有目共睹。但写代码和完成工程系统之间,始终横亘着一道鸿沟。这道鸿沟,正在被北京的企业们用实实在在的技术突破填平。GLM-5的发布,标志着国产大模型完成了从“初级程序员”到“总架构师”的进化。

GLM-5采用了744B总参数、40B激活参数的MoE架构,引入DeepSeek稀疏注意力机制(DSA),部署成本降低30%以上。在Vending Bench 2测试中,GLM-5需要完全自主地经营一年的售货机业务,最终实现了4432美元的账户余额,这一表现已经非常接近顶级的闭源模型。

一个更具说服力的案例是,B站知名游戏博主、独立游戏开发者“夜神不说话”利用GLM-5,在12小时内开发出一款名为《逃离千禧年》的游戏,完成了传统开发模式下需要2~3个月才能完成的工作量。

开发者通过GLM-5调用多Agent同步并发架构,一人分饰多角,GLM-5不仅在短短20分钟内生成了包含1275行代码的复杂背包系统,且逻辑闭环无幻觉,还协助完成了美术素材的Python自动化处理脚本及音乐风格设计文档的生成。

这不是炫技,而是真正的生产力革命。

实际上,早在GLM-5正式发布之前,其测试版本“Pony Alpha”便已在海外开发者社区引起轰动。这个神秘模型在完全无人干预下,能自主修复代码、读取日志,耗时数天构建出一个可用的C语言编译器;甚至有人用它从零开发了手机应用,直接打包上架了应用商店。

2月11日深夜,谜底揭晓。被硅谷追捧的神秘模型“Pony Alpha”就是中国AI公司智谱发布并开源的旗舰模型GLM-5。海内外对GLM-5的赞誉不仅表现在热度上,同时也被迅速转化成了购买欲。智谱官方每天限额的GLM Coding Plan即使涨价30%也是秒空,没能上车的开发者也只能每天蹲点抢,甚至就连Ollama的云服务也在上线GLM-5之后被挤爆。

这说明,市场愿意为真正的技术突破买单。

从“单兵作战”到“集群协作”

处理真实世界的复杂难题不能只靠单打独斗,还需要更多团队协作。这正是月之暗面Kimi K2.5的核心突破所在。

Kimi K2.5的更新中,研发团队重构了强化学习基建,通过优化训练算法进行全新探索,推出Agent集群,让Agent从单兵突破进化成集群式作战。执行复杂任务时,K2.5不再是单一的“全能专家”,而是化身为一支即时组建的专业团队。它能根据任务需求,现场调度多达100个不同专业背景的“分身”,并行处理1500个步骤,所有的角色分配与任务拆解无需预设,全由K2.5即时决策。这不是简单的并行计算,而是智能化的任务分解与协同。

借助Agent集群,用户可以让一群“分析师”分头完成100家公司的市场调研,动员“语言专家团”翻译300页文档,还能派出不同的“研究员”综述5篇跨专业的论文,让效率提升十倍以上。

更重要的是,Kimi K2.5的Agent能力也全面扩展至办公场景。通过对Word、Excel、PPT、PDF等常用办公软件的深度学习,用户只需通过自然语言下达简单指令,即可成为快速精通办公软件的专业用户,并实现不同格式间的自由转换。

这种能力的突破,意味着AI正在从“工具”进化为“伙伴”,从“助手”升级为“协作者”。

在全球范围内,Kimi K2.5的表现同样令人瞩目。在HLE-Full w/ tools基准测试中,Kimi K2.5以50.2%的得分登顶,比GPT-5.2高出4.7个百分点,比Claude 4.5 Opus高出7个百分点。这个差距在高难度测试中堪称“碾压级”。

这是开源AI首次在高难度工具任务上正面击败闭源头部模型,具有里程碑意义。

从“内容生成”到“电影级生产”

如果说代码生成和智能体协作还是“数字世界”的事,那么视频生成技术的突破,则正在彻底改变“内容生产”这个万亿级市场。

进入2026年,AI大模型正加速迈过从“炫酷玩具”到“可靠生产力工具”的临界点。Seedance 2.0提升了视频生成的稳定性与可控性,使模型从“创意工具”转向“生产工具”,标志着AI视频生成进入“电影级全流程生成”新阶段。

Seedance 2.0定位为“可导演的电影级全流程生成引擎”,以导演级多镜头叙事、原生音画同步、跨镜头角色一致性等核心能力,明显降低视频创作门槛。

在可控性方面,Seedance 2.0实现全方位突破,支持9张图片、3段视频、3段音频的多素材组合输入,实现动作、特效、运镜、人物、场景、音效等创作要素的精准指定,将AI生成从被动推测转变为主动执行。

在多镜头叙事中保持角色特征、服装纹理、场景细节的高度统一,可生成30—60秒连贯叙事视频,彻底解决长镜头下的画面崩坏、风格漂移问题,模型视频生成可用率从50%提升至80%—90%。

原生音画同步是Seedance 2.0的另一大突破。该模型突破传统“先视频后配音”的后期叠加模式,实现音视频原生联合生成,在画面创作的同时完成匹配音效、配乐生成,实现精准口型同步与情绪匹配,大幅简化音画对齐后期流程,提升虚拟角色叙事表现力与内容沉浸感。

智能导演功能则大幅降低专业创作门槛。模型具备自动分镜与运镜能力,可根据文字提示词或故事描述,自动分析叙事逻辑,规划景别变化、机位运动,生成时空连贯的视频序列,将专业导演级的镜头语言能力集成于模型,让普通创作者可制作具备电影感的视频内容,推动创作能力全民化普及。

这些技术突破带来的直接影响是,内容创作的试错成本与制作成本大幅下降。

5秒特效镜头制作的成本相比传统人力制作实现千倍级压缩;90分钟影视级项目制作成本也从万元级降至千元级。这意味着依赖高频内容供给的行业,将从“人力密集型制作逻辑”转向“算力驱动型规模化生产逻辑”,盈利模型和产能上限被系统性抬升。

AI漫剧、AI短剧等形态对制作效率与成本敏感度高,将成为Seedance 2.0的优先落地场景。顶尖创作能力被技术平权至个人与中小团队,普通创作者与专业工作室之间的制作能力差距被快速压缩,小团队甚至个人即可完成类电影级动画与视频内容生产。

更有意思的是,过去往往是国内用户费尽心思去体验国外的AI工具,而这次,Seedance 2.0反而成为海外网友“争相体验”的对象。

由于该模型在部分国家和地区尚未开放,不少海外网友在社交平台频频“催上线”、询问开放时间。同时,抖音已在旗下AI助手App豆包内开启视频生成模型Seedance 2.0的灰度测试,已有一批海外博主专门制作了详细教程,分享如何通过中国手机号完成注册,并一步步体验Seedance 2.0的完整流程。

这不仅是中国技术的胜利,更是北京AI企业在核心技术赛道上实现全球引领的生动注脚。

新京报贝壳财经记者 罗亦丹

编辑 俞金旻

校对 贾宁

AI北京市
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片