使用下面的搜索规则,更精确:
例如: site:news.163.com author:老司机 saved:搜索自己收藏的内容
site:news.163.com author:老司机 saved:搜索自己收藏的内容
默认搜索标题...
DeepSeek V3 预览版低调发布,但是非常牛逼。 一句话重点:编程能力超过 Claude Sonnet 3.5。 这还只是预览版。 测试的基准是 Aider 的多语言基准,一个用于衡量模型编程能力的基准,具体介绍放在图2,官网放到回复里了。 几个模型的得分 - 62% o1 - 48% DeepSeek V3 预览 - 45% Claude - 38% Gemini-exp-1206 - 33% o1-mini
点击图片查看原图
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?