site stats
Claude Opus 4.8 Model Card- 1M 上下文 GraphWalks,提升明显- 增加了大量 multi-agent 内容- 更加诚实,愿意承认产生代码中的缺陷- 在 Agent 一些安全测试中,出现倒退- Vending-Bench 退步,涉及商业决策的任务中变弱
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: