Bad.
news
短视频
长视频
日本 AV
H 动漫
新闻
每日热点
下载 免费看片 App
更多
安全事故
年度热点
新闻快照
加入电报群
成人动漫
评论
相关内容
登录
|
繁體
搜成人🔞
搜新闻📰
最近搜索:
发布时间:
2024-04-04 13:43:42
1
分
数据加载中
关注推特
收听电报
2
1
0
使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集。
这件事让人深思,什么才是中文优质数据集?
Reddit 也是优质测试集。
是不是在真正有交流和碰撞的社区,才能激发逻辑思考能力?
想起了天涯社区,不知道有没有人试过
IT技术
(
mp.weixin.qq.com
)
1年前
由
orange.ai
提交
闪电预览
分享到
点击图片查看原图
Markdown支持
提交
提交中...
评论加载中...
您可能感兴趣的:
更多
1
2
1
1
【“弱智吧”帖子训练AI效果遥遥领先?研究人员回应:网上宣传过分夸大】“许多读者误以为我们使用‘弱智吧’网友的评论训练大模型就可以达到很好的效果,事实上,我们仅保留了弱智吧帖子的标题。”白岳霖说:“实验结果并不能代表弱智吧,因为数据实际上相当于多方(网友、作者们和大模型系统)协同构造的。”
大陆资讯
(
i.ifeng.com
)
1年前
•
舔你妹
•
--
点击
0 评论
分享到
2
2
1
1
弱智吧竟成最佳中文AI训练数据?中科院等:8 项测试第一,远超知乎豆瓣小红书
大陆资讯
(
www.qbitai.com
)
1年前
•
猪八戒
•
--
点击
0 评论
分享到
闪电预览
3
2
1
1
在线编程平台Replit近期发布了一篇关于《如何训练你自己的大型语言模型》的博客文章,分享了他们在训练自家编程大型语言模型(LLM)过程中的经验和教训。
他们把整个过程分成了三个阶段:数据管道、模型训练、推理
他们的主要数据来…
推特中文圈
(
twitter.com
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
4
2
1
1
找到一个弱智吧的数据集:
看来以后训模型要加一些这些题目了~
时政
(
github.com
)
1年前
•
九原客
•
--
点击
0 评论
分享到
5
2
1
1
话说,百度的大模型文心一言,是不是把百度弱智吧的数据都导进去进行训练了?
但是有一说一啊,看这个回答就知道,文心一言是绝对的原创大模型,绝对不可能抄袭ChatGPT或者好像李开复老师那样用LLAMA去改名字。
IT技术
(
twitter.com
)
2年前
•
零零發
•
--
点击
0 评论
分享到
6
2
1
1
政协委员,央视副召集人张勤提案大模型训练: 如果我们训练的大模型持续用西方价值观数据、西方应用场景来训练中国大模型,中国式的认知将被湮没。…
IT技术
(
twitter.com
)
1年前
•
宝玉
•
--
点击
0 评论
分享到
7
2
1
1
根据英伟达的幻灯片显示,GPT-4 是 1.8T 参数的混合专家模型。现在用 Blackwell 系统实际上可以在大约十天内训练一个像 GPT-4 这样拥有 1.8 万亿参数的大模型,而在两年前 Hopper 世代开始时,即使是几百亿参数的模型也很难在几个月内完成训练。
IT技术
(
baoyu.io
)
1年前
•
宝玉
•
--
点击
0 评论
分享到
8
3
2
2
开源之光:RedPajama重塑大语言模型的未来
LLaMA最强平替,超12万亿训练数据,全开源
1. 开源12万亿训练数据,参考LLaMA数据集配比。
2. 模型马上开源
*标题由Claude生成…
推特中文圈
开源推荐
(
twitter.com
)
2年前
•
nash_su
•
--
点击
0 评论
分享到
9
2
1
1
看论文看到哈哈大笑,用「弱智吧」标题+GPT-4回答微调后的Yi-34B模型评估结果超过了精心收集的 SFT 指令集数据,安全性评估也是第二名。
弱智吧就是百度弱智吧,里面的帖子是这种画风:「既然监狱里全是罪犯,👮♀️为什么不去监狱里抓人?」
论文:
时政
(
arxiv.org
)
1年前
•
九原客
•
--
点击
0 评论
分享到
创建一个新帐户
只需要几秒!
用户名:
电子邮件:
(必填)
密码:
输入验证码:
点此刷新
创建帐户
登录
已拥有账号并想要登录?
用户名:
密码:
登陆
忘记密码?