site stats
微博研发的VibeThinker-1.5B模型开源了,在三个困难数学测试集上超过DeepSeek-R1-0120,这说明小模型具有比业界认为高得多的发展潜力,但很多人可能没有认识到这一点,这能让大量缺乏GPU算力的研究机构人员加入到大模型研发技术进步过程中。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多