首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

主流 DiT 视频生成模型简单测试-歸藏

非常简单的测试,结果肯定不全面,全是主观看法,如果有其他想法欢迎交流。

Pixverse 的 DiT 模型也发布了,刚好完整的图生视频 DiT 凑齐了三家。

顺手做了一个简单测试,主要分成文生视频和图生视频测试,由于 Gen3 没有图生视频就没有测试。

文生视频的三个提示词分别是:

•宇航员在零重力下漂浮。慢动作。受损的空间站内,碎片漂流。•施展强大咒语的巫师。爆炸。神秘符号在空中旋转。•角色被拉入魔法书中。漩涡。旋转的书页和墨水形成现实。

图生视频的三张图有一张人像、一张动物运动、一个科幻飞船运动。

测试视频在这里:

测试结果

文生视频

我发现 Pixverse 在文生视频上有些实诚,对提示词的响应非常好

你只要写了它就会生成出来,不像其他几家觉得生成不好就不生成了。比如第一个提示词是宇航员在空间里,Runway 和 Luma 都没生成宇航员。

另外Pixvers对于奇幻和科幻的响应也很好。可灵就别说了,前两个很好。

Pixvers 第二个巫师施法的效果非常好,火焰甚至覆盖了巫师全身类似火焰护盾的效果,luma 直接皮克斯了,runway 也很滑稽。

第三个的提示词是“一个角色被拉进了魔法书里,旋转的页面和墨水形成现实”,属实有些难度,大家都拉了,不过Pixverse和可灵的起码能看。

图生视频

图生视频这里Pixverse的优势是运动幅度非常大,是几家里面最大的,比如飞船那个。 这里面 luma 的问题是亚洲人脸变成了欧洲人,可灵是无法维持老虎那个图片的美学氛围。 Pixverse的问题是运动幅度过大带来的抽卡成功率下降。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OMkTG-ZHLjZQXaKnkbGkw9Zw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券