资讯

Claude Opus 4.7 发布：费用增加，用户评价分化

2026年4月20日 · www.gnrdhz.blogspot.md - 772 150 RUB T0N mcv

【TechWeb】4月17日，Anthropic发布了最新模型Claude Opus 4.7，已全面可用。相比Opus 4.6，新模型在高级软件工程领域实现了显著进步，在多模态能力上也大幅增强，能产出更高质量的界面、幻灯片等。

Opus 4.7的定价与Opus 4.6相同，每百万输入Token 5美元，每百万输出Token 25美元。

Anthropic在公告里明确表示，新分词器会导致相同内容的Token数变为原来的1.0到1.35倍。而API单价没变，实际成本上涨了10%-35%。

目前，已经有不少用户试用了最新的Claude Opus 4.7，从社交平台的信息来看，用户对Opus 4.7的评价较为两极。

大部分用户认可Opus 4.7在编程能力的提升，但在文案撰写、对话沟通等方面槽点较多。

Claude Opus 4.7主要能力提升

根据Anthropic官方的数据，在编码与推理方面，Opus 4.7在处理复杂、长时间运行的任务时更加严谨和一致，能够自行验证输出结果。用户反馈称，原本需要密切监督的复杂编码工作，现在可以放心交给Opus 4.7。该模型能够严谨且一致地处理长时间、多步骤的任务，精确遵循指令，并在汇报前主动验证自身输出。

Opus 4.7支持更高分辨率的图像输入，长边最大可达2,576像素（约375万像素），是前代Claude模型的3倍。这使得模型可以处理依赖精细视觉细节的多模态任务，如读取密集截图、从复杂表中提取数据、像素级参考等。

Opus 4.7严格按字面意思理解并执行指令。这意味着为旧模型编写的提示词可能会产生意外结果，用户需要据此重新调整提示词和工具链。

内部测试显示，Opus 4.7是更高效的金融分析师，能生成严谨的分析模型、更专业的演示文稿，并实现更紧密的任务整合。此外，在第三方评估GDPval-AA，Opus 4.7也达到了最先进水平。

Opus 4.7更擅长使用基于文件系统的记忆，能够在多轮时间工作中记住重要笔记，并在新任务中直接利用这些记忆，减少前期的上下文输入。

安全性方面，Opus 4.7配备了自动检测和拦截功能，可阻止涉及禁止或高风险网络安全的请求。Anthropic表示，安全专业人士如需将Opus 4.7用于合法网络安全目的（如漏洞研究、渗透测试），可申请加入新的“网络验证计划”。

总体而言，Opus 4.7的安全性与Opus 4.6相似，在欺骗、谄媚、协助滥用等行为上发生成率较低。在诚实性和抵御恶意“提示注入”攻击方面，Opus 4.7优于Opus 4.6；但在某些方面（例如对受管制物质给出过于详细的减害建议）则略有不足。

新功能更费Token了

Anthropic发布的blog显示，Opus 4.7还新增了不少功能，包括：Opus 4.7在High和Max之间新增了xHigh（极高）能力级别，让用户在困难问题上更精细地权衡推理质量和延迟。

在Claude code中，所有计划的默认能力级别已提升为xHigh。对于编码和智能体用例，建议从High或xHigh开始测试。

除了支持更高分辨率图像外，还测试了“任务预算”，让开发者可以引导Claude的Token开销，使其在较长运行中合理分配工作。

Claude新命令/ultraReview会启动专门的审查会话，通过阅读代码变化并标记出细心审查者才能发现的bug和设计问题。Pro和Max用户可免费试用3次。

此外，auto Mode（自动模式）已向Max用户开放，Claude可代为做出权限决定，从而以更少的中断运行更长的任务，同时降低风险。

另外，值得注意的是，Opus 4.7是Opus 4.6的直接升级版，但有两点变化会影响Token使用量，需要提前规划：

一是，新分词器改进了文本处理方式，但同样的输入可能会映射为更多的Token，具体比例约为1.0~1.35倍（取决于内容类型）。

二是，更高能力级别下的思考量增加，尤其是在智能体场景的后续轮次中，Opus 4.7会产生更多输出Token。

用户可以通过调整能力参数、设置任务预算或提示模型更简洁来控制Token使用量。

Anthropic的内部测试显示，在内部编码评估中，所有能力级别的Token效率均有提升。

用户评价两极

对Opus 4.7的编程能力，不少用户在实际体验后均给出了肯定的评价，能力确实更强大了。

让不少用户感到困惑的是Token消耗。有用户表示，官方通篇强调视觉提升，却未提及Token消耗的问题。使用同一张设计稿测试后，Opus 4.7的输入Token直接飙到Opus 4.6的3倍多。

另外，Opus 4.7在某些能力上出现了下降。

在长上下文检索上，Opus 4.6评分能到78.3%，而Opus 4.7直接掉到32.2%。Anthropic解释称新模型遇到缺乏信息会直接报错，不像以前那样随意编造。用户试下来，信息明明在上下文中，它也能漏掉。法律、金融等依赖长文档的场景需谨慎使用。

Opus 4.7的联网搜索和Agent能力也微降，其Agentic Search评测评分从Opus 4.6的83.7%掉到Opus 4.7的79.3%。

被吐槽最多的是Claude Opus 4.7的文笔大变味。

许多用户表示，Opus 4.7充满了“大厂黑话”，续写内容显得干巴巴。用户吐槽：“以前用它修改文案，现在改它的文案花两倍时间。”

最后，思考过程也被隐蔽。Opus 4.7默认不输出推理摘要，想看逻辑得手动加命令。复杂任务出错时，用户根本不知道哪一步出了问题，排查成本翻倍。有人说官方怕被蒸馏，但开发者体验确实不佳。

总之，Opus 4.7不是无痛升级。若不是硬核编码场景，建议先观望。