当下AI写代码最难的 benchmark 叫 ProgramBench。Claude Opus 4.7 最好，也只在"接近完成"这个指标上拿到了 3%，GPT-5、Gemini 系列，全是零。这个测试是 Meta、Stanford、Harvard 的研究团队搞的：给 AI 一个编译好的二进制文件和它的文档，让 AI 从零把这个程序重新写出来。

发布时间: 2026-05-11 13:40:21

1分

数据加载中

关注推特

收听电报

2

1

0

当下AI写代码最难的 benchmark 叫 ProgramBench。
Claude Opus 4.7 最好，也只在"接近完成"这个指标上拿到了 3%，GPT-5、Gemini 系列，全是零。
这个测试是 Meta、Stanford、Harvard 的研究团队搞的：
给 AI 一个编译好的二进制文件和它的文档，让 AI 从零把这个程序重新写出来。
IT技术
( twitter.com )

1个月前由向阳乔木提交

当下AI写代码最难的 benchmark 叫 ProgramBench。

Claude Opus 4.7 最好，也只在"接近完成"这个指标上拿到了 3%，GPT-5、Gemini 系列，全是零。

这个测试是 Meta、Stanford、Harvard 的研究团队搞的：

给 AI 一个编译好的二进制文件和它的文档，让 AI 从零把这个程序重新写出来。

没有源代码，不能反编译，不能上网查资料。

从小工具到大项目都有，有jq、ripgrep 这种命令行小工具。

也有 FFmpeg、SQLite、PHP 编译器这种级别。

官网：https://t.co/So4An5dmot
论文：https://t.co/zpr3GggZqo

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：

1

298

297

297

多么单纯天真的小脸蛋被几个上年纪的老男人操的四射喷水没想到单纯的外表内还藏着多么骚的一个灵魂
完整版点击下方链接观看
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

2

132

131

131

看我做作吗？哈哈哈哈哈哈
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

3

53

52

52

这称有问题，绝对有问题
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

4

424

423

423

福利到昨天不小心喷水了❤️。如果哥哥们喜欢的话要多转发按赞哦
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

5

89

88

88

角度真好，夸夸我自己
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

6

249

248

248

情色隔离室男同事把我打晕后在我面前强插顶级龙凤鲍鱼女友
完整版点击下方链接观看
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

7

302

301

301

上个视频吧，最近找不到什么衣服拍了，你们还有什么想看的可以给我提议哦，前提是180能穿得下的，没准我下次就上身了
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

8

37

36

36

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

9

368

367

367

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

10

757

756

756

两头都忙不过来了，美女们都456了
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 6 评论

11

634

633

633

如果你喜欢乖的又拒绝不了骚的我就白天叫你老公晚上叫你爸爸白天披头发晚上双马尾又乖又骚
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 4 评论

12

85

84

84

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

13

465

464

464

哥哥全都射到里面了嘛
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

14

744

743

743

Watch video
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

15

547

546

546

哥哥全部都射给瑶瑶好不好
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

16

223

222

222

【#BT盯射】健身女孩看见肌肉男非常喜欢，结果肌肉男在健身女孩面前袒露自己早泄，惨遭嘲笑！
当着她的面早泄出大量精液到自己的腹肌上...真丢脸！
视频同款可露点app（若失效请看我主页简介）：…
porn
( twitter.com)

4年前 • twitter机器人 0 评论

17

411

410

410

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

18

57

56

56

酒店爆艹表情淫荡的平面模特，这女的真骚，让做什么就乖乖照做，很有征服感！

完整版链接在评论区首条或视频中间弹幕
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

19

73

72

72

妹妹的脚是真的不错！
#上海模特
#上海线下
#上海资源
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

20

82

81

81

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

21

553

552

552

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

22

87

86

86

好久没发视频了
发一个存货⑧
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

23

51

50

50

人生在世，吃喝玩乐
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

24

377

376

376

乡村学生妹和表哥乱仑直播,假期在家赚生活费,疫情原因男友不能来，只能找帅气表哥凑合啦！插入的一瞬间无比销魂！
投稿@pubccs @yuziqoq感谢

完整版观看地址在评论区

porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

25

108

107

107

你喜欢这样的姐姐吗？
porn
( twitter.com)

4年前 • twitter机器人 0 评论