从写代码到做工程？，北京AI用硬核技术改写全球AI竞赛规则,ai竞赛平台

更新时间：2026-02-17 11:27 来源：牛马见闻

别嫌米兰冬奥会的散装，它正在成为全新的办赛潮流,2026年意大利米兰冬奥会

重启即翻车！日本最大核电站为何“烂而不倒”？

青绿入梦隋文静/韩聪奥运终章获第五

大国重器，来拜年啦！,大国重器下一句是什么

跟队：马竞已向小蜘蛛开新合同，世俱杯时阿森纳曾报价1.2亿欧,马竞实力强于阿森纳

这正是月之暗面Kimi K2.Kimi K2.�Kimi K2.

2026年，全球人工智能领域迎来！新一轮技术爆发潮。在(这场激烈的技术竞赛中，北京企业展现出强劲实力，在全球掀起“惊涛骇浪”。 1月8日，智谱AI在香港交易所挂牌上市，成为“全球大模型第一股”，此后发布的智谱GLM-5在全球权威榜单中位居全球第四、开源模型第一。2月7日，字节推出的视频生成模型Seedance 2.0全球“出圈”，令好莱坞导演惊叹，让海外网友在社交平台“催上线”。Kimi、生数科技、面壁智能、银河通用等企业也相继推出新一代大模型产品，在通用大语言模型、多模态视频生成、代码编程、具身智能等核心赛道实现全面突破。 北京，这座千年古都，正在以惊人的速度蜕变为全球AI创新的策源地。 从“会写代码”到“能完成工程” 过去两年，大模型在代码生成能力方面的进展业界有目共睹。但写代码和完成工程系统之间，始终横亘着一道鸿沟。这道鸿沟，正在被北京的企业们用实实在在的技术突破填平。GLM-5的发布，标志着国产大模型完成了从“初级程序员”到“总架构师”的进化。 GLM-5采用了744B总参数、40B激活参数的MoE架构，引入DeepSeek稀疏注意力机制（DSA），部署成本降低30%以上。在Vending Bench 2测试中，GLM-5需要完全自主地经营一年的售货机业务，最终实现了4432美元的账户余额，这一表现已经非常接近顶级的闭源模型。 一个更具说服力的案例是，B站知名游戏博主、独立游戏开发者“夜神不说话”利用GLM-5，在12小时内开发出一款名为《逃离千禧年》的游戏，完成了传统开发模式下需要2～3个月才能完成的工作量。 开发者通过GLM-5调用多Agent同步并发架构，一人分饰多角，GLM-5不仅在短短20分钟内生成了包含1275行代码的复杂背包系统，且逻辑闭环无幻觉，还协助完成了美术素材的Python自动化处理脚本及音乐风格设计文档的生成。 这不是炫技，而是真正的生产力革命。 实际上，早在GLM-5正式发布之前，其测试版本“Pony Alpha”便已在海外开发者社区引起轰动。这个神秘模型在完全无人干预下，能自主修复代码、读取日志，耗时数天构建出一个可用的C语言编译器；甚至有人用它从零开发了手机应用，直接打包上架了应用商店。 2月11日深夜，谜底揭晓。被硅谷追捧的神秘模型“Pony Alpha”就是中国AI公司智谱发布并开源的旗舰模型GLM-5。海内外对GLM-5的赞誉不仅表现在热度上，同时也被迅速转化成了购买欲。智谱官方每天限额的GLM Coding Plan即使涨价30%也是秒空，没能上车的开发者也只能每天蹲点抢，甚至就连Ollama的云服务也在上线GLM-5之后被挤爆。 这说明，市场愿意为真正的技术突破买单。 从“单兵作战”到“集群协作” 处理真实世界的复杂难题不能只靠单打独斗，还需要更多团队协作。这正是月之暗面Kimi K2.5的核心突破所在。 Kimi K2.5的更新中，研发团队重构了强化学习基建，通过优化训练算法进行全新探索，推出Agent集群，让Agent从单兵突破进化成集群式作战。执行复杂任务时，K2.5不再是单一的“全能专家”，而是化身为一支即时组建的专业团队。它能根据任务需求，现场调度多达100个不同专业背景的“分身”，并行处理1500个步骤，所有的角色分配与任务拆解无需预设，全由K2.5即时决策。这不是简单的并行计算，而是智能化的任务分解与协同。 借助Agent集群，用户可以让一群“分析师”分头完成100家公司的市场调研，动员“语言专家团”翻译300页文档，还能派出不同的“研究员”综述5篇跨专业的论文，让效率提升十倍以上。 更重要的是，Kimi K2.5的Agent能力也全面扩展至办公场景。通过对Word、Excel、PPT、PDF等常用办公软件的深度学习，用户只需通过自然语言下达简单指令，即可成为快速精通办公软件的专业用户，并实现不同格式间的自由转换。 这种能力的突破，意味着AI正在从“工具”进化为“伙伴”，从“助手”升级为“协作者”。 在全球范围内，Kimi K2.5的表现同样令人瞩目。在HLE-Full w/ tools基准测试中，Kimi K2.5以50.2%的得分登顶，比GPT-5.2高出4.7个百分点，比Claude 4.5 Opus高出7个百分点。这个差距在高难度测试中堪称“碾压级”。 这是开源AI首次在高难度工具任务上正面击败闭源头部模型，具有里程碑意义。 从“内容生成”到“电影级生产” 如果说代码生成和智能体协作还是“数字世界”的事，那么视频生成技术的突破，则正在彻底改变“内容生产”这个万亿级市场。 进入2026年，AI大模型正加速迈过从“炫酷玩具”到“可靠生产力工具”的临界点。Seedance 2.0提升了视频生成的稳定性与可控性，使模型从“创意工具”转向“生产工具”，标志着AI视频生成进入“电影级全流程生成”新阶段。 Seedance 2.0定位为“可导演的电影级全流程生成引擎”，以导演级多镜头叙事、原生音画同步、跨镜头角色一致性等核心能力，明显降低视频创作门槛。 在可控性方面，Seedance 2.0实现全方位突破，支持9张图片、3段视频、3段音频的多素材组合输入，实现动作、特效、运镜、人物、场景、音效等创作要素的精准指定，将AI生成从被动推测转变为主动执行。 在多镜头叙事中保持角色特征、服装纹理、场景细节的高度统一，可生成30—60秒连贯叙事视频，彻底解决长镜头下的画面崩坏、风格漂移问题，模型视频生成可用率从50%提升至80%—90%。 原生音画同步是Seedance 2.0的另一大突破。该模型突破传统“先视频后配音”的后期叠加模式，实现音视频原生联合生成，在画面创作的同时完成匹配音效、配乐生成，实现精准口型同步与情绪匹配，大幅简化音画对齐后期流程，提升虚拟角色叙事表现力与内容沉浸感。 智能导演功能则大幅降低专业创作门槛。模型具备自动分镜与运镜能力，可根据文字提示词或故事描述，自动分析叙事逻辑，规划景别变化、机位运动，生成时空连贯的视频序列，将专业导演级的镜头语言能力集成于模型，让普通创作者可制作具备电影感的视频内容，推动创作能力全民化普及。 这些技术突破带来的直接影响是，内容创作的试错成本与制作成本大幅下降。 5秒特效镜头制作的成本相比传统人力制作实现千倍级压缩；90分钟影视级项目制作成本也从万元级降至千元级。这意味着依赖高频内容供给的行业，将从“人力密集型制作逻辑”转向“算力驱动型规模化生产逻辑”，盈利模型和产能上限被系统性抬升。 AI漫剧、AI短剧等形态对制作效率与成本敏感度高，将成为Seedance 2.0的优先落地场景。顶尖创作能力被技术平权至个人与中小团队，普通创作者与专业工作室之间的制作能力差距被快速压缩，小团队甚至个人即可完成类电影级动画与视频内容生产。 更有意思的是，过去往往是国内用户费尽心思去体验国外的AI工具，而这次，Seedance 2.0反而成为海外网友“争相体验”的对象。 由于该模型在部分国家和地区尚未开放，不少海外网友在社交平台频频“催上线”、询问开放时间。同时，抖音已在旗下AI助手App豆包内开启视频生成模型Seedance 2.0的灰度测试，已有一批海外博主专门制作了详细教程，分享如何通过中国手机号完成注册，并一步步体验Seedance 2.0的完整流程。 这不仅是中国技术的胜利，更是北京AI企业在核心技术赛道上实现全球引领的生动注脚。 新京报贝壳财经记者罗亦丹 编辑俞金旻 校对贾宁

编辑：内田健司