Vidu:一个新的中国AI视频生成器挑战Sora和Kling
Vidu AI 模型基于一种专有的视觉转化模型架构,称为通用视觉变换器(U-ViT)。这整合了两个文本到视频的 AI 模型:扩散模型和变换器。这种架构能够创建高质量的视频,具有动态的相机运动、复杂的面部表情,以及真实的光影效果。这就是的仪表盘界面:Vidu 网站。图片由提供注册时,用户每月获得 80 个免费积分,并且生成高质量的输出,尽管免费版本的分辨率略低。每次会话限制生成 4 秒(付费版本允许
Vidu:一个新的中国AI视频生成器挑战Sora和Kling
Vidu AI 模型基于一种专有的视觉转化模型架构,称为通用视觉变换器(U-ViT)。这整合了两个文本到视频的 AI 模型:扩散模型和变换器。这种架构能够创建高质量的视频,具有动态的相机运动、复杂的面部表情,以及真实的光影效果。
这就是 网站 的仪表盘界面:

Vidu 网站。图片由 Jim Clyde Monge 提供
注册时,用户每月获得 80 个免费积分,并且生成高质量的输出,尽管免费版本的分辨率略低。每次会话限制生成 4 秒(付费版本允许生成 8 秒)。
工作原理
访问 Vidu 网站,通过电子邮件注册。在顶部导航栏中,点击“创建视频”按钮。

图片由 Jim Clyde Monge 提供
以下是一个示例:
提示:一名中国男子坐在桌旁,用筷子吃面条

图片由 Jim Clyde Monge 提供
在输出视频文件下方,您可以选择通过点击“ConfigCopy”按钮来放大或重用提示。以下是最终结果:

GIF 由 Jim Clyde Monge 提供
该视频是一个 4 秒、688 × 384 文件。由于文件较小,生成时间不到一分钟。请注意,其他生成 1080p 分辨率文件的 AI 视频工具每个视频至少需要 2–3 分钟。每次生成消耗 4 个积分。
设置页面相当简单。您可以在一般和动画之间更改视频风格。请注意,视频风格仅适用于文本到视频,8 秒的持续时间选项仅限于付费客户。

图片由 Jim Clyde Monge 提供
让我们在动画风格中尝试这个提示:
提示:在一间柔和灯光的浴室里,一只以美国动画角色风格设计的泰迪熊正在洗澡。熊部分浸泡在泡泡满满的浴缸中,另一只爪子拿着电话贴在耳边,同时用另一只爪子擦洗自己。环境光线柔和且清新,为场景投射出温暖而迷人的光辉。浴室的瓷砖是令人舒缓的柔和色彩,衬托出舒适和梦幻的氛围。泰迪熊那富有表现力的脸上流露出专注的神情,展现出它在洗澡和打电话这两项日常活动之间的多任务处理。

GIF 由 Jim Clyde Monge 提供
哇哦。我对输出视频的质量印象非常深刻。它看起来像是来自吉卜力工作室的动画电影。然而,您可能会注意到 AI 模型在连贯性方面存在困难。在提示中,熊应该用一只爪子拿着电话贴在耳边,同时用另一只爪子擦洗自己。
图像到视频
现在让我们看看图像到视频功能的表现。上传图像后,指定您希望它作为视频的第一帧还是角色参考使用。

图片由 Jim Clyde Monge 提供
这是来自 Midjourney 的参考图像:

图片由 Jim Clyde Monge 提供
提示:胜利的马拉松跑者接近终点线,埃菲尔铁塔在节日气氛中

GIF 由 Jim Clyde Monge 提供
这看起来非常酷。我很惊讶看到 Vidu 故意为场景添加了更多的主题,并在跑者的号码布上添加了清晰的文字。
文本渲染
大多数 AI 视频生成器在文本渲染方面都有困难。我们来看看 Vidu 如何处理这个提示:
提示:一面墙上有涂鸦写着“Vidu 是酷的”

GIF 由 Jim Clyde Monge 提供
文本并不准确,但字母是清晰的。看这些结果,似乎在生成视频中的文本方面比 Kling 更好。以下是 Kling 在 AI 视频中处理文本渲染的方法:
提示:Kling 是酷的

GIF 由 Jim Clyde Monge 提供
这是一团糟,文本与提示完全不符。
费用多少?
以下是订阅计划的总结:

图片由 Jim Clyde Monge 提供
用户还可以选择年度订阅,并享受 20% 的折扣。
更多推荐



所有评论(0)