很前沿、hardcore的一集(关于robotics),嘉宾是Google DeepMind 机器人团队的技术负责人谭捷。可以从中了解:Google Robotics团队是怎么思考与工作的?我们也聊了聊这几年Google的研究文化变化🤖
一些takeaways:
1/机器人基座大模型最近几年的发展,主要依赖于多模态大模型,但多模态模型缺少robot action输出;
2/robotics最大问题是数据,它在一个非常复杂的unstructured environment里,可以发生任何事情;
3/bet on scalable data;
4/生成极大量仿真数据,是弥补它缺点的一个重要手段(用compute解决精度问题);
5/Gemini Robotics 1.5最重要的两点,一个是加入了thinking,另一个是跨具身迁移;
6/世界模型就是Vision-Language-Vision,vision和language in,生成下一帧的图像;
7/如果你有灵巧手,触觉就非常重要,之所以前面觉得触觉不重要,是受限于硬件,我们现在还处于夹爪时代;
8/一个有使命感的人,影响他跳槽不一定是钱,他不会容忍说“I’m on a wrong ship”。https://t.co/zRhKEOvczy