4日,日前,发布并开源KiMi K2.6模型,在代码、长程任务执行和Agent能力等方面全方位升级。
目前,KiMi K2.6已上线,提供新版应用、API和KiMi编程助手。
在多项权威基准测试中,KiMi K2.6表现突出。
无论是高难度的类人类考试(Humanity’s Last Exam),还是侧重真实软件工程能力的SWE-Bench,均达到行业领先水平,持平或优于GPT-5.4、Claude OpUS 4.6和Gemini 3.1等闭源模型。
作为KiMi迄今最强代码模型,KiMi K2.6在长程编码能力大幅提升。
在测试中可以不间断编码13小时,编写或修改超过4000行代码,完成复杂系统的开发和优化。
同时,通过将代码与视觉能力的深度融合,KiMi K2.6可以交付极具设计创意的专业级Web应用。
在内部代码评测中,K2.6成绩较上一代K2.5提升约20%。
值得一提的是,其泛化能力同样突出。
实测显示,KiMi K2.6可在本地部署模型,并通过Zig语言优化推理流程,最终实现比M Studio快约20%的推理效率。
在Agent能力方面,KiMi K2.6支持多Agent协同,可调度不同长度的Agent组合完成复杂任务,整体任务质量显著提升。
同时,其Agent集群架构也升级,最多支持300个子Agent并行运行、执行约4000个协作步骤,可以一次性完成从文档到网页、再到PPT和表格的多产物端到端交付。