从写代码到做工程?,北京AI用硬核技术改写全球AI竞赛规则,ai竞赛平台

  更新时间:2026-02-17 11:27   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

这正是月之暗面Kimi K2.Kimi K2.Kimi K2.

<p id="4AUFA2BH">2026年,全球人工智能领域迎来!新一轮技术爆发潮。在(这场激烈的技术竞赛中,北京企业展现出强劲实力,在全球掀起“惊涛骇浪”。</p> <p id="4AUFA2BI">1月8日,智谱AI在香港交易所挂牌上市,成为“全球大模型第一股”,此后发布的智谱GLM-5在全球权威榜单中位居全球第四、开源模型第一。2月7日,字节推出的视频生成模型Seedance 2.0全球“出圈”,令好莱坞导演惊叹,让海外网友在社交平台“催上线”。Kimi、生数科技、面壁智能、银河通用等企业也相继推出新一代大模型产品,在通用大语言模型、多模态视频生成、代码编程、具身智能等核心赛道实现全面突破。</p> <p id="4AUFA2BJ">北京,这座千年古都,正在以惊人的速度蜕变为全球AI创新的策源地。</p> <p id="4AUFA2BK"><strong>从“会写代码”到“能完成工程”</strong></p> <p id="4AUFA2BL">过去两年,大模型在代码生成能力方面的进展业界有目共睹。但写代码和完成工程系统之间,始终横亘着一道鸿沟。这道鸿沟,正在被北京的企业们用实实在在的技术突破填平。GLM-5的发布,标志着国产大模型完成了从“初级程序员”到“总架构师”的进化。</p> <p id="4AUFA2BM">GLM-5采用了744B总参数、40B激活参数的MoE架构,引入DeepSeek稀疏注意力机制(DSA),部署成本降低30%以上。在Vending Bench 2测试中,GLM-5需要完全自主地经营一年的售货机业务,最终实现了4432美元的账户余额,这一表现已经非常接近顶级的闭源模型。</p> <p id="4AUFA2BN">一个更具说服力的案例是,B站知名游戏博主、独立游戏开发者“夜神不说话”利用GLM-5,在12小时内开发出一款名为《逃离千禧年》的游戏,完成了传统开发模式下需要2~3个月才能完成的工作量。</p> <p id="4AUFA2BO">开发者通过GLM-5调用多Agent同步并发架构,一人分饰多角,GLM-5不仅在短短20分钟内生成了包含1275行代码的复杂背包系统,且逻辑闭环无幻觉,还协助完成了美术素材的Python自动化处理脚本及音乐风格设计文档的生成。</p> <p id="4AUFA2BP">这不是炫技,而是真正的生产力革命。</p> <p id="4AUFA2BQ">实际上,早在GLM-5正式发布之前,其测试版本“Pony Alpha”便已在海外开发者社区引起轰动。这个神秘模型在完全无人干预下,能自主修复代码、读取日志,耗时数天构建出一个可用的C语言编译器;甚至有人用它从零开发了手机应用,直接打包上架了应用商店。</p> <p id="4AUFA2BR">2月11日深夜,谜底揭晓。被硅谷追捧的神秘模型“Pony Alpha”就是中国AI公司智谱发布并开源的旗舰模型GLM-5。海内外对GLM-5的赞誉不仅表现在热度上,同时也被迅速转化成了购买欲。智谱官方每天限额的GLM Coding Plan即使涨价30%也是秒空,没能上车的开发者也只能每天蹲点抢,甚至就连Ollama的云服务也在上线GLM-5之后被挤爆。</p> <p id="4AUFA2BS">这说明,市场愿意为真正的技术突破买单。</p> <p id="4AUFA2BT"><strong>从“单兵作战”到“集群协作”</strong></p> <p id="4AUFA2BU">处理真实世界的复杂难题不能只靠单打独斗,还需要更多团队协作。这正是月之暗面Kimi K2.5的核心突破所在。</p> <p id="4AUFA2BV">Kimi K2.5的更新中,研发团队重构了强化学习基建,通过优化训练算法进行全新探索,推出Agent集群,让Agent从单兵突破进化成集群式作战。执行复杂任务时,K2.5不再是单一的“全能专家”,而是化身为一支即时组建的专业团队。它能根据任务需求,现场调度多达100个不同专业背景的“分身”,并行处理1500个步骤,所有的角色分配与任务拆解无需预设,全由K2.5即时决策。这不是简单的并行计算,而是智能化的任务分解与协同。</p> <p id="4AUFA2C0">借助Agent集群,用户可以让一群“分析师”分头完成100家公司的市场调研,动员“语言专家团”翻译300页文档,还能派出不同的“研究员”综述5篇跨专业的论文,让效率提升十倍以上。</p> <p id="4AUFA2C1">更重要的是,Kimi K2.5的Agent能力也全面扩展至办公场景。通过对Word、Excel、PPT、PDF等常用办公软件的深度学习,用户只需通过自然语言下达简单指令,即可成为快速精通办公软件的专业用户,并实现不同格式间的自由转换。</p> <p id="4AUFA2C2">这种能力的突破,意味着AI正在从“工具”进化为“伙伴”,从“助手”升级为“协作者”。</p> <p id="4AUFA2C3">在全球范围内,Kimi K2.5的表现同样令人瞩目。在HLE-Full w/ tools基准测试中,Kimi K2.5以50.2%的得分登顶,比GPT-5.2高出4.7个百分点,比Claude 4.5 Opus高出7个百分点。这个差距在高难度测试中堪称“碾压级”。</p> <p id="4AUFA2C4">这是开源AI首次在高难度工具任务上正面击败闭源头部模型,具有里程碑意义。</p> <p id="4AUFA2C5"><strong>从“内容生成”到“电影级生产”</strong></p> <p id="4AUFA2C6">如果说代码生成和智能体协作还是“数字世界”的事,那么视频生成技术的突破,则正在彻底改变“内容生产”这个万亿级市场。</p> <p id="4AUFA2C7">进入2026年,AI大模型正加速迈过从“炫酷玩具”到“可靠生产力工具”的临界点。Seedance 2.0提升了视频生成的稳定性与可控性,使模型从“创意工具”转向“生产工具”,标志着AI视频生成进入“电影级全流程生成”新阶段。</p> <p id="4AUFA2C8">Seedance 2.0定位为“可导演的电影级全流程生成引擎”,以导演级多镜头叙事、原生音画同步、跨镜头角色一致性等核心能力,明显降低视频创作门槛。</p> <p id="4AUFA2C9">在可控性方面,Seedance 2.0实现全方位突破,支持9张图片、3段视频、3段音频的多素材组合输入,实现动作、特效、运镜、人物、场景、音效等创作要素的精准指定,将AI生成从被动推测转变为主动执行。</p> <p id="4AUFA2CA">在多镜头叙事中保持角色特征、服装纹理、场景细节的高度统一,可生成30—60秒连贯叙事视频,彻底解决长镜头下的画面崩坏、风格漂移问题,模型视频生成可用率从50%提升至80%—90%。</p> <p id="4AUFA2CB">原生音画同步是Seedance 2.0的另一大突破。该模型突破传统“先视频后配音”的后期叠加模式,实现音视频原生联合生成,在画面创作的同时完成匹配音效、配乐生成,实现精准口型同步与情绪匹配,大幅简化音画对齐后期流程,提升虚拟角色叙事表现力与内容沉浸感。</p> <p id="4AUFA2CC">智能导演功能则大幅降低专业创作门槛。模型具备自动分镜与运镜能力,可根据文字提示词或故事描述,自动分析叙事逻辑,规划景别变化、机位运动,生成时空连贯的视频序列,将专业导演级的镜头语言能力集成于模型,让普通创作者可制作具备电影感的视频内容,推动创作能力全民化普及。</p> <p id="4AUFA2CD">这些技术突破带来的直接影响是,内容创作的试错成本与制作成本大幅下降。</p> <p id="4AUFA2CE">5秒特效镜头制作的成本相比传统人力制作实现千倍级压缩;90分钟影视级项目制作成本也从万元级降至千元级。这意味着依赖高频内容供给的行业,将从“人力密集型制作逻辑”转向“算力驱动型规模化生产逻辑”,盈利模型和产能上限被系统性抬升。</p> <p id="4AUFA2CF">AI漫剧、AI短剧等形态对制作效率与成本敏感度高,将成为Seedance 2.0的优先落地场景。顶尖创作能力被技术平权至个人与中小团队,普通创作者与专业工作室之间的制作能力差距被快速压缩,小团队甚至个人即可完成类电影级动画与视频内容生产。</p> <p id="4AUFA2CG">更有意思的是,过去往往是国内用户费尽心思去体验国外的AI工具,而这次,Seedance 2.0反而成为海外网友“争相体验”的对象。</p> <p id="4AUFA2CH">由于该模型在部分国家和地区尚未开放,不少海外网友在社交平台频频“催上线”、询问开放时间。同时,抖音已在旗下AI助手App豆包内开启视频生成模型Seedance 2.0的灰度测试,已有一批海外博主专门制作了详细教程,分享如何通过中国手机号完成注册,并一步步体验Seedance 2.0的完整流程。</p> <p id="4AUFA2CI">这不仅是中国技术的胜利,更是北京AI企业在核心技术赛道上实现全球引领的生动注脚。</p> <p id="4AUFA2CJ">新京报贝壳财经记者 罗亦丹</p> <p id="4AUFA2CK">编辑 俞金旻</p> <p id="4AUFA2CL">校对 贾宁</p>

编辑:内田健司