【TechWeb】4月17日,Anthropic发布了最新模型Claude Opus 4.7,已全面可用。相比Opus 4.6,新模型在高级软件工程领域实现了显著进步,在多模态能力上也大幅增强,能产出更高质量的界面、幻灯片等。

Opus 4.7的定价与Opus 4.6相同,每百万输入Token 5美元,每百万输出Token 25美元。
Anthropic在公告里明确表示,新分词器会导致相同内容的Token数变为原来的1.0到1.35倍。而API单价没变,实际成本上涨了10%-35%。
目前,已经有不少用户试用了最新的Claude Opus 4.7,从社交平台的信息来看,用户对Opus 4.7的评价较为两极。
大部分用户认可Opus 4.7在编程能力的提升,但在文案撰写、对话沟通等方面槽点较多。
Claude Opus 4.7主要能力提升

根据Anthropic官方的数据,在编码与推理方面,Opus 4.7在处理复杂、长时间运行的任务时更加严谨和一致,能够自行验证输出结果。用户反馈称,原本需要密切监督的复杂编码工作,现在可以放心交给Opus 4.7。该模型能够严谨且一致地处理长时间、多步骤的任务,精确遵循指令,并在汇报前主动验证自身输出。
Opus 4.7支持更高分辨率的图像输入,长边最大可达2,576像素(约375万像素),是前代Claude模型的3倍。这使得模型可以处理依赖精细视觉细节的多模态任务,如读取密集截图、从复杂表中提取数据、像素级参考等。
Opus 4.7严格按字面意思理解并执行指令。这意味着为旧模型编写的提示词可能会产生意外结果,用户需要据此重新调整提示词和工具链。
内部测试显示,Opus 4.7是更高效的金融分析师,能生成严谨的分析模型、更专业的演示文稿,并实现更紧密的任务整合。此外,在第三方评估GDPval-AA,Opus 4.7也达到了最先进水平。
Opus 4.7更擅长使用基于文件系统的记忆,能够在多轮时间工作中记住重要笔记,并在新任务中直接利用这些记忆,减少前期的上下文输入。

安全性方面,Opus 4.7配备了自动检测和拦截功能,可阻止涉及禁止或高风险网络安全的请求。Anthropic表示,安全专业人士如需将Opus 4.7用于合法网络安全目的(如漏洞研究、渗透测试),可申请加入新的“网络验证计划”。
总体而言,Opus 4.7的安全性与Opus 4.6相似,在欺骗、谄媚、协助滥用等行为上发生成率较低。在诚实性和抵御恶意“提示注入”攻击方面,Opus 4.7优于Opus 4.6;但在某些方面(例如对受管制物质给出过于详细的减害建议)则略有不足。
新功能更费Token了
Anthropic发布的blog显示,Opus 4.7还新增了不少功能,包括:Opus 4.7在High和Max之间新增了xHigh(极高)能力级别,让用户在困难问题上更精细地权衡推理质量和延迟。
在Claude code中,所有计划的默认能力级别已提升为xHigh。对于编码和智能体用例,建议从High或xHigh开始测试。

除了支持更高分辨率图像外,还测试了“任务预算”,让开发者可以引导Claude的Token开销,使其在较长运行中合理分配工作。
Claude新命令/ultraReview会启动专门的审查会话,通过阅读代码变化并标记出细心审查者才能发现的bug和设计问题。Pro和Max用户可免费试用3次。
此外,auto Mode(自动模式)已向Max用户开放,Claude可代为做出权限决定,从而以更少的中断运行更长的任务,同时降低风险。
另外,值得注意的是,Opus 4.7是Opus 4.6的直接升级版,但有两点变化会影响Token使用量,需要提前规划:
一是,新分词器改进了文本处理方式,但同样的输入可能会映射为更多的Token,具体比例约为1.0~1.35倍(取决于内容类型)。
二是,更高能力级别下的思考量增加,尤其是在智能体场景的后续轮次中,Opus 4.7会产生更多输出Token。
用户可以通过调整能力参数、设置任务预算或提示模型更简洁来控制Token使用量。
Anthropic的内部测试显示,在内部编码评估中,所有能力级别的Token效率均有提升。
用户评价两极
对Opus 4.7的编程能力,不少用户在实际体验后均给出了肯定的评价,能力确实更强大了。
让不少用户感到困惑的是Token消耗。有用户表示,官方通篇强调视觉提升,却未提及Token消耗的问题。使用同一张设计稿测试后,Opus 4.7的输入Token直接飙到Opus 4.6的3倍多。
另外,Opus 4.7在某些能力上出现了下降。
在长上下文检索上,Opus 4.6评分能到78.3%,而Opus 4.7直接掉到32.2%。Anthropic解释称新模型遇到缺乏信息会直接报错,不像以前那样随意编造。用户试下来,信息明明在上下文中,它也能漏掉。法律、金融等依赖长文档的场景需谨慎使用。
Opus 4.7的联网搜索和Agent能力也微降,其Agentic Search评测评分从Opus 4.6的83.7%掉到Opus 4.7的79.3%。
被吐槽最多的是Claude Opus 4.7的文笔大变味。
许多用户表示,Opus 4.7充满了“大厂黑话”,续写内容显得干巴巴。用户吐槽:“以前用它修改文案,现在改它的文案花两倍时间。”
最后,思考过程也被隐蔽。Opus 4.7默认不输出推理摘要,想看逻辑得手动加命令。复杂任务出错时,用户根本不知道哪一步出了问题,排查成本翻倍。有人说官方怕被蒸馏,但开发者体验确实不佳。
总之,Opus 4.7不是无痛升级。若不是硬核编码场景,建议先观望。