在写感谢 Pichai 的推文时,我写了一段话,大意是:
> 真正的“魔法时刻”,发生在你将 Nano Banana Pro 的可视化能力、世界知识,与 Gemini 的实时联网能力融为一体之时。Nano Banana Pro 不仅能将你天马行空的创意变为现实,让我们每一个人能自由的去创造。
然后这位网友问了我一个问题:
> 在整个工作流中,你觉得最难的部分是什么?
这里面最难的部分不是提示词,甚至不是创意,而是你得知道AI的能力的边界,模型擅长什么不擅长什么,再在模型的能力范围以内和你的想法之间找到一个最佳的结合点。
比如说这个城市天气预报的例子,我在 GPT-4o Image 的时候就写过类似的,那时候它就能生成很不错的效果,但是它不能自己去获取日期和天气再去生成图形,所以我得要写一个获取天气的API,把它做成GPTs,这就限制了它的可玩性。
所以当Gemini 集成了 nano banana pro 之后,我马上就重新测试了这个想法,发现Gemini模型现在能获取当前日期和天气然后生成图像,那么这个想法就可以很容易实现。
另外一个难点就是你的作品不应该只是单个的场景,不是只有作者自己为了展示自己的提示词多牛,而是应该让读者能参与其中,是一个提示词模板而不是提示词,每一个人都可以结合自己的场景、兴趣去尝试,去修改,这也是很有挑战的事情。比如说像这套城市天气的提示词,每个人都可以测试自己的城市,不同的日期,甚至可以衍生出很多好玩的版本,比如穿越回过去,把地方放到火星、虚拟的游戏地址。
点击图片查看原图