之前我们分享过如何使用 Midjourney(MJ)
生成图片,你有没有可以让图片动起来的技术呢?
这里给大家分享个如果让照片动起来网站。
首先生成一张图片,Heygen可以使用自己的视频进行制作哦~ 这个留给爱发现的你自己发掘了,我们本期只讲基本用法。
A middle-aged man, standing frontally, with a calm and serene expression, embodying wisdom and maturity. His hair is slightly graying, showing signs of aging yet well-maintained. His facial features are moderate, with deep and introspective eyes. He is dressed in a simple yet elegant manner, wearing a well-fitted dark shirt and neat trousers. The background is plain and unobtrusive, highlighting the subject's demeanor and expression. The overall image conveys a sense of steadiness and wisdom that comes with experience, front view, --ar 16:9
效果如下:
我们本次使用的文案为:
有钱人以后再也不会向下社交了
我发现我们的社会正在逐渐分裂为不同的层级,这种分裂在很大程度上是由网络上的攻击性评论和偏见造成的。有钱人越来越少地与不同社会阶层的人交流。我尝试邀请一些朋友参加我的节目,他们都婉拒了,担心公开发声会被误解为炫耀,甚至遭受网络攻击。这让我意识到,我们正在失去一种宝贵的东西:不同声音的交流和理解。
更重要的是,这种社会的分层化导致了信息的筛选。我们越来越多地只听到自己想听的声音,这加剧了阶层间的隔离。难道我们就愿意生活在一个只有单一声音的世界里吗?
我们需要跨越社会层级的界限,努力去理解和接受不同的观点和生活方式。我们需要的不是键盘上的攻击,而是面对面的沟通和理解。
让我们一起努力创造一个更加开放、包容的社会。记住,每个人的声音都值得被听到。让我们一起为一个更好的明天努力吧。
openai 1106 发布了TTS合成能力,我们本次使用openai的能力合成语音。
为了新手更加容易上手,这里使用参数传递的形式进行sk赋值,建议使用环境变量。
from pathlib import Path
from openai import OpenAI
client = OpenAI(
api_key="sk-XXX"
)
text = """
有钱人以后再也不会向下社交了
我发现我们的社会正在逐渐分裂为不同的层级,这种分裂在很大程度上是由网络上的攻击性评论和偏见造成的。有钱人越来越少地与不同社会阶层的人交流。我尝试邀请一些朋友参加我的节目,他们都婉拒了,担心公开发声会被误解为炫耀,甚至遭受网络攻击。这让我意识到,我们正在失去一种宝贵的东西:不同声音的交流和理解。
更重要的是,这种社会的分层化导致了信息的筛选。我们越来越多地只听到自己想听的声音,这加剧了阶层间的隔离。难道我们就愿意生活在一个只有单一声音的世界里吗?
我们需要跨越社会层级的界限,努力去理解和接受不同的观点和生活方式。我们需要的不是键盘上的攻击,而是面对面的沟通和理解。
让我们一起努力创造一个更加开放、包容的社会。记住,每个人的声音都值得被听到。让我们一起为一个更好的明天努力吧。
"""
speech_file_path = Path(__file__).parent / "speech.mp3"
print(speech_file_path)
response = client.audio.speech.create(
model="tts-1-hd",
voice="onyx",
input=text,
speed=1.3
)
response.stream_to_file(speech_file_path)
保存完tts.py,使用 python tts.py
生财音频,执行完成后在当前目录会生成 speech.mp3
文件,听下效果。
Heygen的注册比较简单,如果你遇到 Unable to register. Please avoid VPN and try again.
的错误提示建议换个工具。
腾讯云提供了,竞争实力云服务器,可以花几毛钱使用一小时,相当实惠
创建视频
上传图片
上传音频
图片上传完成以后点击右上角Submit等待合成成功即可。
如果动手能力强可以在本地尝试 SD的 SadTaker插件
https://github.com/OpenTalker/SadTalker
https://runwayml.com/
一款集成了机器学习功能的视频编辑和创作平台,允许用户利用先进的算法进行内容创作和编辑。
https://pika.art/waitlist
Pika 1.0发布了一个新的AI模型,能够使用文本生成和编辑多种风格的视频,如3D动画、动漫、卡通和电影风格。据说质量非常高!
让我们拥抱这些变化,用AI技术打破界限,共同创造一个更加多元、包容的未来。