Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >新型视频生成模型VideoCrafter-腾讯与香港科技大学联合开发并开源

新型视频生成模型VideoCrafter-腾讯与香港科技大学联合开发并开源

作者头像
Python兴趣圈
发布于 2023-11-15 11:12:03
发布于 2023-11-15 11:12:03
69500
代码可运行
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年
运行总次数:0
代码可运行

VideoCrafter 是一款由腾讯和香港科技大学合作推出了一种全新的视频生成模型,可以进行创建和编辑套件,采用了扩散模型,能够从文本描述生成照片和视频。即使没有视频编辑或动画经验的人也可以轻松制作专业品质的视频。

该项目提供了两种开放扩散模型,分别用于文本到视频(T2V)和图像到视频(I2V)任务。T2V模型能够生成具有1024576分辨率的逼真且具有电影质量的视频,在质量方面胜过其他开源T2V模型。而I2V模型则旨在生成与提供的参考图像内容严格一致的视频,保留其内容、结构和风格。这是第一个能够将给定图像转化为视频剪辑并保持内容保存约束的开源I2V基础模型。

这个模型包括视频VAE和3D去噪U-net,经过在庞大的数据集上进行了训练,其性能表现出色,超过了其他开源视频生成模型。

项目地址:https://github.com/AILab-CVC/VideoCrafter

演示地址:https://huggingface.co/spaces/VideoCrafter/VideoCrafter

功能概况:

  • • 通用文本到视频的生成
  • • 通用图像到视频的生成

下载与安装

下载项目

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
git clone https://github.com/AILab-CVC/VideoCrafter.git

安装videocrafter及依赖包

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
conda create -n videocrafter python=3.8.5
conda activate videocrafter
pip install -r requirements.txt

使用步骤

  • • 创建视频的书面大纲。
  • • 根据自己的喜好设置视频相关参数,包括分辨率和帧速率。
  • • 使用“生成”按钮。
  • • 输入一些文字,VideoCrafter将为您生成视频。
  • • 生成的视频可以在集成编辑器的帮助下进行修改。
  • • 在进行调整后,可以将视频保存为多种格式,包括MP4、MOV和AVI。

模型调用

1、通过Hugging Face下载预训练的 T2V 模型,并将其model.ckpt放入checkpoints/base_1024_v1/model.ckpt

2、输入命令

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
  sh scripts/run_text2video.sh

VideoCrafter的用户友好性使其即使对于从未使用过视频或动画软件的人也可以轻松使用。与商业制作的电影媲美,VideoCrafter的输出质量非常高。无论您想制作解释性视频还是短片,VideoCrafter都能胜任。更重要的是,VideoCrafter是一个免费的开源项目。

写到最后

感谢您的一路陪伴,用代码构建世界,一起探索充满未知且奇妙的魔幻旅程。如果您对Python编程技巧、好玩实用的开源项目、行业新知趣事和各类技术干货等充满兴趣,那么不要错过未来我为大家奉上的精彩内容!点击关注,让您的探索学习之旅更加丰富多彩,我们一同成长,一同前行!🚀💻📚

求一键三连:点赞、转发、在看

四款国内外远程桌面软件横测:ToDesk、向日葵、TeamViewer、AnyDesk

新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star

● 最新最全 VSCODE 插件推荐(2023版)

一款构建AI数字人项目开源了!自动实现音视频同步!

「多线程大杀器」Python并发编程利器:ThreadPoolExecutor,让你一次性轻松开启多个线程,秒杀大量任务!

如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️

在看你就赞赞我!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-11-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python兴趣圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯与香港科技大学开源 VideoCrafter 文生视频
VideoCrafter是一款由腾讯和香港科技大学合作推出的视频生成模型。该模型通过扩散模型来创建和编辑视频,能够从文本描述生成照片和视频。不需要视频编辑或动画经验的人也可以利用VideoCrafter轻松制作专业品质的视频。
疯狂的KK
2024/01/19
7400
腾讯与香港科技大学开源 VideoCrafter 文生视频
每日学术速递11.3
1.VideoCrafter1: Open Diffusion Models for High-Quality Video Generation
AiCharm
2023/11/06
2080
每日学术速递11.3
VideoCrafter2 - 腾讯AI文成视频再次偷偷升级
GitHub代码库:https://github.com/AILab-CVC/VideoCrafter
疯狂的KK
2024/03/20
1.4K0
VideoCrafter2 - 腾讯AI文成视频再次偷偷升级
VideoCrafter | 图文生成视频
VideoCrafter1: Open Diffusion Models for High-Quality Video Generation
iResearch666
2023/11/09
1.7K0
VideoCrafter | 图文生成视频
仅开源上线4天就飙升了1.4k star的图像视频生成模型-StoryDiffusion
大家好,我是xq👨🏻‍💻。今天给大家介绍一款既能保持角色一致又可生成多图漫画和长视频的AI工具,它就是StoryDiffusion。
Python兴趣圈
2024/05/13
4600
仅开源上线4天就飙升了1.4k star的图像视频生成模型-StoryDiffusion
混元视频:大型视频生成模型的系统框架
视频生成技术的最新进展极大地改变了个人与行业日常生活的面貌。然而,主流的视频生成模型仍为闭源,导致行业与公众社区在视频生成能力上存在显著的性能差异。在本报告中,我们提出了HunyuanVideo,这是一种新型开源视频基础模型,其视频生成性能可与主流闭源模型相媲美,甚至更优。HunyuanVideo具有一个综合框架,整合了多项关键贡献,包括数据整理、先进架构设计、渐进式模型缩放与训练,以及为大规模模型训练和推理设计的高效基础设施。凭借这些,我们成功训练了一个参数超过130亿的视频生成模型,成为所有开源模型中的最大模型。我们进行了广泛的实验并实施了一系列有针对性的设计,以确保高视觉质量、运动动态、文本-视频对齐和先进的拍摄技术。根据专业人工评价结果,HunyuanVideo的性能优于先前的最先进模型,包括Runway Gen-3、Luma 1.6和3个表现最佳的中国视频生成模型。通过发布基础模型及其应用的代码,我们旨在弥合闭源与开源社区之间的鸿沟。这一举措将使社区中的每个人都能够对自己的想法进行实验,从而培育一个更具活力和动态的视频生成生态系统。代码已公开发布在https://github.com/Tencent/HunyuanVideo。
AI浩
2024/12/19
4530
混元视频:大型视频生成模型的系统框架
DynamiCrafter: 利用扩散先验的开放域图片动画化
VideoCrafter的网络架构如图所示,它包括T2V和I2V两个子任务,相应的需要注入Text prompt和image prompt。Motion speed用fps控制,fps和timestep有同样的结构。
用户1324186
2024/05/11
6790
DynamiCrafter: 利用扩散先验的开放域图片动画化
视频生成领域的发展概述:从多级扩散到LLM
2023年是语言模型(llm)和图像生成技术激增的一年,但是视频生成受到的关注相对较少。今年刚到2月份,OpenAI就发布了一个惊人的视频生成模型Sora。虽然它的架构没有披露,但是通过总结现有的视频生成领域可能能对Sora的构架有所理解。
deephub
2024/02/21
8390
视频生成领域的发展概述:从多级扩散到LLM
Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务
Apple MM1Team 再发新作,这次是苹果视频生成大模型,关于模型架构、训练和数据的全面报告,87 亿参数、支持多模态条件、VBench 超 PIKA,KLING,GEN-3。
机器之心
2025/02/14
1620
Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务
20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
今天,视频生成领域迎来开源革命!Open-Sora 2.0—— 全新开源的 SOTA(State-of-the-Art)视频生成模型正式发布,仅用 20 万美元(224 张 GPU)成功训练出商业级 11B 参数视频生成大模型,性能直追 HunyuanVideo 和 30B 参数的 Step-Video。权威评测 VBench 及用户偏好测试均证实其卓越表现,在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。此次发布全面开源模型权重、推理代码及分布式训练全流程,让高质量视频生成真正触手可及,进一步提升视频生成的可及性与可拓展性。
机器之心
2025/03/13
850
20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
Sora 与文本到视频生成,探索通用人工智能的里程碑与挑战!
近期在AI生成内容(AIGC)领域的快速发展标志着向实现人工通用智能(AGI)迈出的关键一步,特别是继OpenAI在2023年初推出大型语言模型(LLM)GPT-4之后。AIGC 吸引了学术界和工业界的广泛关注,例如基于LLM的对话代理ChatGPT[1],以及文本转图像(T2I)模型如DALLLE[2],Midjourney[3]和Stable Diffusion[4]。这些成果对文本转视频(T2V)领域产生了重大影响,OpenAI的Sora[5]在图1中展示的出色能力便是例证。
AIGC 先锋科技
2024/07/08
3270
Sora 与文本到视频生成,探索通用人工智能的里程碑与挑战!
视频真伪难辨?蚂蚁集团 & 南大 & 上交通开源 DeMamba 即插即用,助你一臂之力 !
生成模型的进展令人印象深刻,使得创建高度逼真的图像变得更加轻松且无需专业知识。随着这些模型能够生成足够逼真的图像,越来越多的研究者探索如何改进视频创作。目前,某些生成算法,如Sora(Brooks等人,2024)和Gen2(Research,2023),能够通过简单的输入,包括文本和图像,制作高质量的视频。尽管这些生成算法可以减少人力劳动并增强创造力,但它们也引入了风险(Barrett等人,2023)。
未来先知
2024/08/08
4270
视频真伪难辨?蚂蚁集团 & 南大 & 上交通开源 DeMamba 即插即用,助你一臂之力 !
浅析SORA视频生成原理
OpenAI发布了视频生成模型Sora,最大的Sora模型能够生成一分钟的高保真视频。同时OpenAI称,可扩展的视频生成模型,是构建物理世界通用模拟器的一条可能的路径。
码之有理
2024/03/13
1K0
Step-Video-T2V:全球最强开源视频生成
目前阶跃已经成为行业内公认的内卷王之一。其覆盖的领域包含了语音、图片、视频理解和生成等。就在2月中,其就发布了Step-Video-T2V,号称全球最强的开源视频模型。同时一经发布,就已经上线官网,目前所有用户都可以注册进行免费使用,感兴趣的可以来到这个网站进行尝试:
算法一只狗
2025/03/20
2260
有哪些小众的开源项目养活了一大批人?
远的不说,近期开源的 DeepSeek 确实养活了很多人,连资本市场带 DeepSeek 概念的股票都能大涨,顺便带动很多科技股大赚特赚,反正我没赚到。
码农编程进阶笔记
2025/05/01
1280
有哪些小众的开源项目养活了一大批人?
视频生成模型Sora:引领视觉内容创作的新篇章
近日,人工智能领域的领军企业OpenAI发布了一款具有划时代意义的视频生成模型——Sora。这款模型凭借其强大的生成能力和逼真的视觉效果,迅速引起了广泛关注。本文将详细介绍Sora的技术特点、应用场景以及它对未来视觉内容创作的影响。
Front_Yue
2024/03/16
5220
视频生成模型Sora:引领视觉内容创作的新篇章
2022年AI顶级论文 —生成模型之年(上)
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 过去十年来,人工智能技术在持续提高和飞速发展,并不断冲击着人类的认知。 2012年,在ImageNet图像识别挑战赛中,一种神经网络模型(AlexNet)首次展现了明显超越传统方法的能力。 2016年,AlphaGo在围棋这一当时人们认为其复杂性很难被人工智能系统模拟的围棋挑战赛中战胜了世界冠军。 2017年,Google的Ashish Vaswani等人提出了 Transformer 深度学习新模型
AiCharm
2023/05/15
4860
2022年AI顶级论文 —生成模型之年(上)
腾讯混元视频生成工具全新开源
今天,我们正式推出并开源全新的多模态定制化视频生成工具HunyuanCustom。
腾讯开源
2025/05/10
2250
腾讯混元视频生成工具全新开源
定制您的AI助手!OpenAI发布GPTs,助您构建自己的专属GPT!
近日,人工智能行业龙头 OpenAI 的历史 首届开发者大会 揭幕。OpenAI 首席执行官山姆·奥特曼在接近45分钟的开幕演讲中,向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新。
Python兴趣圈
2023/11/10
8700
定制您的AI助手!OpenAI发布GPTs,助您构建自己的专属GPT!
Star 17.3k!这个截屏项目火了!给它一张屏幕截图,即可一键克隆网页!
你敢信,只凭借着一张屏幕截图即可转换生成 HTML/Tailwind CSS 代码。可以算得上是前端工程师的福音。它就是 screenshot-to-code。
Python兴趣圈
2023/11/24
2.4K0
Star 17.3k!这个截屏项目火了!给它一张屏幕截图,即可一键克隆网页!
推荐阅读
相关推荐
腾讯与香港科技大学开源 VideoCrafter 文生视频
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验