无了，昨天以为 llama-4 虽然写代码不行，但是1M-10M的超长上下文还能干点别的。结果今天 Fiction.LiveBench 结果放出了。llama-4 在 1K 上下文召回(近似, 实际上这个分数是问题回答的正确率)就掉到60%以下了，甚至 llama-4-scout 超过16K只有22%。

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

3296 位用户此时在线

24小时点击排行 Top 10：

山东人就是豪爽👍 老板娘人美心善，笑容太治愈👍😂

一年不吃晚饭身体的变化

侯总这办公室恋情💘，玩得很嗨皮嘛👍😂

要了解的心理学！最难的修行其实不是原谅别人，而是学会放过那个在愤怒中不断自残的自己。

福建金店遭遇打劫，歹徒用pdd 9.9元包邮的电棍对老板娘进行了长达5分多钟的疯狂电击

我想象中的春晚导演🤔

王菲、窦唯、高原的三角恋，原来是这样👍 这哪里来的窦唯家？是王菲花钱买的房子吧？窦唯吃软饭还出轨，王菲居然输给了高原？😂

医生揭开癌症真相：人患癌就两个原因，听完惊出一身冷汗。

“中学生铁棚内吃饭像在监狱” 近日，一段湖北孝感汉川一中多名学生在铁棚内吃饭的视频引热议，有网友称学生看起来“像在监狱”

近日，一名宝妈创业开了一家小学生私房早餐店，其在抖音上称店铺早上九点开门因为要多睡会，视频因此爆火。1月16日，她拍摄了店铺开业视频并上传至抖音。由于“小学生”三个字被网友们解读与习近平学历相关，评论区随后被官方清空。

有人问黄仁勋，你这么富有了还有梦想吗？

中老年人看过来，50岁以后你的身体需要的不是少吃，而是吃对。你的衰老是不是因为你吃的不行？

罗翔怎么了？哥们77年的，才48岁，这个样子68岁也不止吧？

1月27日，四川省宜宾市。一名30岁的女性在桥上一跃而下，留下香烟和手机。相关视频发布至抖音后，评论区中不少网友表达了强烈的共鸣，正经历不同的艰难处境，负债压力、贷款难偿、婚姻破裂

张又侠早过了退休年龄，老习完全可以让他退休，为什么要采取如此极端的措施？与军方交恶，得罪红二代群体，有什么动机？这是张又侠2024年8月会见拜登政府国安顾问沙利文，张又侠全程念稿，显得毫无个人发挥余地，已经是老习的复读机了在清洗自己人方面，老习已经超过腊肉，媲美朱洪武了👍

近日，中国三亚大东海，一群民粹主义分子高举大刀和红旗，在沙滩大喊大叫，使游客们的度假变成噩梦。

老板娘笑容太暖了，感动😹

普通人搞不懂经济学没关系，学会这5个反常识思维，受益一辈子！

你一定要知道的10个咖啡常识

杰我睿珠宝暴雷事件 1月28日，已出现第二起投资者跳楼维权事件

转🛜：说实话，我没有搞明白人物关系😢 一场饭局，凑齐了这辈子见过最荒唐的底线。起因是一个女海王，婚后在公司花园偷情小鲜肉 A，结果被 A 的女朋友抓现行，敲诈了一大笔钱。本以为这事儿翻篇了，结果一年半后，A 回来请客，宣布要结婚。新娘露面那一刻，全场死寂。新娘比 A 大 7

把下面那个推文再发一遍，方便网友们分享。

易中天：个人利益时常伪装成集体利益！

中國一名滑雪者因與雪豹自拍而被攻擊一名遊客在山中發現了這只稀有猛獸，決定走近拍攝一張完美的照片。當遊客與雪豹之間的距離縮短至三米時，雪豹突然撲向了她。滑雪頭盔幫助她避免了致命傷害，但她仍受了重傷。

1月28日，纽约法院批准了关恒的庇护申请。法官承认如果他被遣返回中国，将会面临严重的危险。国土安全部保留在30天内提出上诉的权利，在此期间关恒将继续被拘留。

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

无了，昨天以为 llama-4 虽然写代码不行，但是1M-10M的超长上下文还能干点别的。
结果今天 Fiction.LiveBench 结果放出了。llama-4 在 1K 上下文召回(近似, 实际上这个分数是问题回答的正确率)就掉到60%以下了，甚至 llama-4-scout 超过16K只有22%。
时政
( twitter.com )

9个月前由 karminski-牙医提交

无了，昨天以为 llama-4 虽然写代码不行，但是1M-10M的超长上下文还能干点别的。

结果今天 Fiction.LiveBench 结果放出了。llama-4 在 1K 上下文召回(近似, 实际上这个分数是问题回答的正确率)就掉到60%以下了，甚至 llama-4-scout 超过16K只有22%。

顺带一提哈利波特与魔法石正好是16K左右。这意味着你把这本书塞进去，然后问哈利小时候生活在卧室还是楼梯下面的储物间，llama-4-scout 只有22% 的机会能答对（近似理解，实际上召回要再复杂点）。总之，这个分数远低于头部的平均水平....

点击图片查看原图

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
...
400
下一页

1

2

1

1

成年了（虽然是昨天
推特精选
( twitter.com)

4年前 • twitter机器人 0 评论

2

2

1

1

@人文经济学会：虽然昨天人民币收复了失地，然而有评论认为……
图片
( ww4.sinaimg.cn)

10年前 • 有趣图片 0 评论

3

2

1

1

Llama 4将在未来几周推出
据金融时报报道 Meta 计划在其最新的开源模型Llama 4 中引入改进的语音功能，预计将在未来几周内推出。
知情人士表示，Meta认为未来的 AI 驱动代理将以语音对话为主，而非以文本为主，他们将押注语音功能。
时政
( twitter.com)

10个月前 • 小互 0 评论

4

2

1

1

小扎认为 Llama 会成为开源 AI 的行业标杆，就像当年的 Linux 一样
我们今天发布了LLAMA
IT技术
( twitter.com)

1年前 • 宝玉 • 下载视频 0 评论

00:02:48

5

2

1

1

我记得当年韩国世界杯进入4强，宣传的口号是亚洲人站起来了(虽然后来变成了，韩国人靠裁判偏心)
昨天韩日，双双晋级，朋友圈大家一堆骂，时代变了
时政
( twitter.com)

3年前 • twitter机器人 0 评论

6

2

1

1

12 个无代码 AI 工具

1.

无需代码在网站中创建和嵌入 GPT-4 应用程序

2.

自然语言书写 SQL

3.…
IT技术
( twitter.com)

2年前 • Cellier@undefined 0 评论

7

2

1

1

昨天有人弄了一个男性视角古代史，今天有豆瓣女网友整理了一份女性视角古代史，虽然古代杰出女性因为一些众所周知的原因，青史留名的不多，但她们依旧在发光发热。
大陆资讯
( weibo.com)

4年前 • 微博 0 评论

8

2

1

1

NVIDIA 发布AI Playground ，可以直接从浏览器尝试 Code Llama（Meta 的最新 #LLM ）。

Code Llama 在 LLama2 上进行了微调，可以生成 Python、C++、Java 等流行语言的代码。

地址：

From：
IT技术
( nvda.ws)

2年前 • Will • 下载视频 0 评论

00:00:08

9

2

1

1

在 4gb 的树莓派（Raspberry Pi 4）上运行 LLaMA 7B 参数的模型

虽然现在推理的速度还很慢，但是已经证明了 LLM 能够在消费级硬件上运行了，这仅仅是一个开始。

LLM 的 Stable Diffusi…
推特中文圈
( twitter.com)

2年前 • Jiayuan 0 评论

10

2

1

1

#ReimuLive
虽然是昨天的但还是好可爱啊——
哈！
视频
( twitter.com)

3年前 • twitter机器人 • 下载视频 0 评论

00:00:10

11

2

1

1

HuggingFace 推出了聊天助手，低配版 GPT，可以自定义Prompt，但是不能支持文档检索、调用外部API、代码解释器等功能。不过免费，支持Mixtral、Llama 2 以及 Meta 最新的 Code Llama 70B 等模型。
不过代码是开源的，你可以做一些自己的定制化工作

IT技术
( github.com)

2年前 • 宝玉 0 评论

12

2

1

1

立党真的成功了，虽然他完全不懂web3，也不懂怎么写代码。
但是他是有天使轮融资的CEO，天天在推特上扯淡就能赚钱
推特中文圈
( twitter.com)

4年前 • twitter机器人 0 评论

13

2

1

1

昨晚突然狂风暴雨，刮倒无数树木，我还以为台风来了
时政
( twitter.com)

2年前 • 说真话的徐某人 0 评论

14

2

1

1

推荐张俊林写的这篇LLama 3.1技术报告的分析
链接：
以下内容为转发其微博内容：
***
LLama 3 405B模型效果已经赶上目前最好的闭源模型比如GPT 4o和Claude 3.5，这算是开源届的大事，技术报告接近100页，信息很丰富，粗略看了一下，很有启发。这里就LLaMA
IT技术
( www.weibo.com)

1年前 • 宝玉 0 评论

15

2

1

1

虽然但是，我认为写中文是对的。
时政
( twitter.com)

2年前 • 每日反共🇺🇦 0 评论

16

2

1

1

后续：
4. 第一个远程挂在了 HR 面上
5. 之后有个线上面试第一次直播写代码，反转个链表竟然写出来了
6. 后面虽然通过了，我没选择去
7. 又面了一个远程，面试时因为网络体验非常差，我讨厌飞书的视频面试。最后循序渐进的一道…
推特中文圈
( twitter.com)

4年前 • twitter机器人 0 评论

17

2

1

1

【一不小心，你我瞬间都可能成为拆二代】“昨天老妈打来电话，说是好像老家的房子可能要拆，未来周边要建成博物馆，我很是诧异，因为房子是2001年的，算是很新了，虽然觉得这不可能，但抑制不住要成为拆二代的喜悦（虽然连上海一个厕所都买不到）。”
大陆资讯
( m.21jingji.com)

8年前 • 你妹的溢达 0 评论

18

2

1

1

停更是因为昨天已经写完所有策略了
年度到分钟级别的
所以等结果
推特中文圈
( www.tradingview.com)

2年前 • Kfather.eth 0 评论

19

2

1

1

虽然身为专业技术人才，也要为自己的盲目和无知付出生命的代价
时政
( twitter.com)

4年前 • twitter机器人 0 评论

20

2

1

1

昨天发现一个很好用的程序员写幻灯片的工具：Slidev
之前用过很多类似使用Markdown 写幻灯片的工具，但是 Slidev 真的是太丝滑了，昨天写个 PPT 体验特别好，功能也很丰富，以后写幻灯片可以无脑用了。而且功能特很丰富，可以完全匹配原生应用了，推荐给各位。

*…
IT技术
( sli.dev)

2年前 • Viking 0 评论

21

2

1

1

刚刚想起来昨天晚上梦里好像梦到有个地方写错了，回去一翻代码发现真的写错了（
推特中文圈
( twitter.com)

3年前 • twitter机器人 0 评论

22

2

1

1

【UFO也注视着地球】这是昨天以色列拍到的。美帝昨天也为太空军正名了，跟他们无关。
视频
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

23

2

1

1

有一种博弈方法，就是你虽然付出很大沉没成本，但是你的边际成本为零，所以你在博弈中仍然有巨大优势。比如说写书，写文章，写(有很多用户的) 开源代码，这种可以证明自己实力的沉没成本，其边际成本为零。
推特中文圈
( twitter.com)

3年前 • twitter机器人 0 评论

24

2

1

1

昨天晚上做了个动画视频然后写了一篇解释说明的文章：
视频
( www.youtube.com)

9年前 • twitter机器人 0 评论

1
2
3
4
5
6
...
400
下一页

0.13744 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: [email protected]

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特