昆仑万维:天工AI重磅官宣SkyClaw-v1.0 Agent模型正式上线
5月26日,昆仑万维旗下天工AI正式推出高性能Agent(智能体)模型 SkyClaw-v1.0,并同步发布轻量化版本 SkyClaw-v1.0-lite,兼具顶尖性能与极致性价比。
据公司介绍,SkyClaw-v1.0支持百万Token上下文,深度适配各类真实智能体工作场景,重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。模型经过大规模mid-train、高质量合成任务SFT与端到端强化学习优化,可在 OpenClaw、Hermes、Nanobot 等主流Agent环境中运行,同时适配Claude Code、Codex等代码 Agent 框架,通用性与兼容性拉满。
Agent模型和Agent framework的组合,正在改变模型的使用方式。过去,模型主要回答问题;现在,模型被放进一个能读取仓库、调用工具、编辑文件、运行测试、观察反馈的执行环境里,开始承担完整工作流。SkyClaw-v1.0针对的正是这个阶段:让模型在长上下文和工具环境中持续推进任务,而不是只生成一段答案。
SkyClaw-v1.0的训练目标很明确:提升模型在Agent framework中完成真实任务的能力。训练重点放在三件事上:构建可交互的工具环境、筛选高质量任务轨迹,以及用强化学习提升多步执行稳定性。
训练环境基于OpenClaw-style agent frames构建,覆盖文件读取、代码编辑、检索、测试、页面观察等高频Agent动作。模型在训练中不只是生成答案,而是需要选择工具、组合工具,并根据工具返回结果继续推进任务。
团队进一步结合真实Claw任务数据和线上skill使用反馈,构建工具关系图谱,用来合成更接近真实工作流的复杂任务。这样得到的数据不是孤立问答,而是包含目标拆解、工具调用、结果观察和迭代修正的完整执行链。
SkyClaw-v1.0使用大量合成Agent轨迹进行mid-train与SFT。这一步主要解决Agent训练中的噪声问题。低质量轨迹会让模型学到无效工具调用、错误观察解释或偏离目标的中间步骤。SkyClaw-v1.0通过轨迹质量过滤和数据配比实验,保留更稳定、更可复用的任务执行模式。
强化学习阶段继续在自建Claw环境中进行。模型需要在可交互环境里执行任务、观察反馈、处理失败,并继续修正动作。优化目标从“回答是否好看”转向“任务是否完成、过程是否稳定”。因此,SkyClaw-v1.0在OpenClaw、Hermes、Nanobot、Claude Code、Codex等环境中使用时,优势更多体现在持续执行、错误恢复和多轮迭代,而不是单次回答的表面完整度。
在Agent框架中,SkyClaw-v1.0可以完成规划、文件编辑、代码生成、测试运行、页面调试与多轮迭代,更适合交付完整应用、交互式游戏和研究型网页报告。这些示例均从自然语言提示开始,在Hermes、Claude Code 和 Codex等代理框架中完成。我们强烈建议在代理工作流中使用SkyClaw-v1.0作为模型,而不是作为独立的聊天模型使用。