site stats
如果只是因为FP8 的格式不同牺牲精度换取动态范围训练的话 deepseek所谓的优势其实根本不复存在 唯一的优势,只是能让国产大模型“在没有英伟达芯片的前提下”不会死的太惨 但即便有最强芯片,其模型的水平也到不了世界前三 更别提AGI了 这点可以参考美国模型发布的竞争情况
sign_in_with_google sign_in_with_google

6465 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前