今天发布的豆包视频生成模型很牛P 基于DIT架构 ,能够实现复杂的多主体互动。 可以实现一个Prompt的多个镜头切换时,保持主体,风格,氛围和逻辑的一致性,实现导演自由。 也就是一个Prompt就能控制人物的样貌、服装和细节在不同镜头的切换下仍然保持一致,接近真实拍摄的效果。 看看这个效果... 这种一致性得益于 DiT架构(融合计算单元)的应用,使得视频生成在动态和运镜之间可以灵活切换,支持多种镜头语言,如变焦、环绕、平摇、缩放、目标跟随等。
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?