site stats
一个开源的多模态 LLM Unified-IO 2。 比较离谱的是它可以实现语音理解和动作理解还有图像标记这种任务,还可以理解空间关系。真正的 All in one 。 甚至还可以驱动机器人做对应的操作。 项目简介: Unified-IO 2,这是第一个能够理解和生成图像、文本、音频和动作的自回归多模态模型。…
sign_in_with_google sign_in_with_google

1219 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前