前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >创造动态艺术:AI在视觉和声音上的突破

创造动态艺术:AI在视觉和声音上的突破

作者头像
一个程序猿的异常
发布2023-12-04 13:56:30
1.2K2
发布2023-12-04 13:56:30
举报
文章被收录于专栏:一个程序猿的异常

创造动态艺术:AI在视觉和声音上的突破

之前我们分享过如何使用 Midjourney(MJ) 生成图片,你有没有可以让图片动起来的技术呢?

这里给大家分享个如果让照片动起来网站。

首先生成一张图片,Heygen可以使用自己的视频进行制作哦~ 这个留给爱发现的你自己发掘了,我们本期只讲基本用法。

代码语言:javascript
复制
A middle-aged man, standing frontally, with a calm and serene expression, embodying wisdom and maturity. His hair is slightly graying, showing signs of aging yet well-maintained. His facial features are moderate, with deep and introspective eyes. He is dressed in a simple yet elegant manner, wearing a well-fitted dark shirt and neat trousers. The background is plain and unobtrusive, highlighting the subject's demeanor and expression. The overall image conveys a sense of steadiness and wisdom that comes with experience, front view, --ar 16:9

效果如下:

有钱人以后再也不会向下社交了

我们本次使用的文案为:

有钱人以后再也不会向下社交了

我发现我们的社会正在逐渐分裂为不同的层级,这种分裂在很大程度上是由网络上的攻击性评论和偏见造成的。有钱人越来越少地与不同社会阶层的人交流。我尝试邀请一些朋友参加我的节目,他们都婉拒了,担心公开发声会被误解为炫耀,甚至遭受网络攻击。这让我意识到,我们正在失去一种宝贵的东西:不同声音的交流和理解。

更重要的是,这种社会的分层化导致了信息的筛选。我们越来越多地只听到自己想听的声音,这加剧了阶层间的隔离。难道我们就愿意生活在一个只有单一声音的世界里吗?

我们需要跨越社会层级的界限,努力去理解和接受不同的观点和生活方式。我们需要的不是键盘上的攻击,而是面对面的沟通和理解。

让我们一起努力创造一个更加开放、包容的社会。记住,每个人的声音都值得被听到。让我们一起为一个更好的明天努力吧。

合成TTS

openai 1106 发布了TTS合成能力,我们本次使用openai的能力合成语音。

为了新手更加容易上手,这里使用参数传递的形式进行sk赋值,建议使用环境变量。

代码语言:javascript
复制
from pathlib import Path
from openai import OpenAI

client = OpenAI(
    api_key="sk-XXX"
)
text = """
有钱人以后再也不会向下社交了

我发现我们的社会正在逐渐分裂为不同的层级,这种分裂在很大程度上是由网络上的攻击性评论和偏见造成的。有钱人越来越少地与不同社会阶层的人交流。我尝试邀请一些朋友参加我的节目,他们都婉拒了,担心公开发声会被误解为炫耀,甚至遭受网络攻击。这让我意识到,我们正在失去一种宝贵的东西:不同声音的交流和理解。

更重要的是,这种社会的分层化导致了信息的筛选。我们越来越多地只听到自己想听的声音,这加剧了阶层间的隔离。难道我们就愿意生活在一个只有单一声音的世界里吗?

我们需要跨越社会层级的界限,努力去理解和接受不同的观点和生活方式。我们需要的不是键盘上的攻击,而是面对面的沟通和理解。

让我们一起努力创造一个更加开放、包容的社会。记住,每个人的声音都值得被听到。让我们一起为一个更好的明天努力吧。

"""
speech_file_path = Path(__file__).parent / "speech.mp3"
print(speech_file_path)

response = client.audio.speech.create(
    model="tts-1-hd",
    voice="onyx",
    input=text,
    speed=1.3
)

response.stream_to_file(speech_file_path)

保存完tts.py,使用 python tts.py 生财音频,执行完成后在当前目录会生成 speech.mp3 文件,听下效果。

Heygen 注册

Heygen的注册比较简单,如果你遇到 Unable to register. Please avoid VPN and try again. 的错误提示建议换个工具。

腾讯云提供了,竞争实力云服务器,可以花几毛钱使用一小时,相当实惠

Create Video

创建视频

上传图片

上传图片

上传音频文件

上传音频

图片上传完成以后点击右上角Submit等待合成成功即可。

其他平台推荐

如果动手能力强可以在本地尝试 SD的 SadTaker插件

https://github.com/OpenTalker/SadTalker

Runway

https://runwayml.com/

一款集成了机器学习功能的视频编辑和创作平台,允许用户利用先进的算法进行内容创作和编辑。

Pika

https://pika.art/waitlist

Pika 1.0发布了一个新的AI模型,能够使用文本生成和编辑多种风格的视频,如3D动画、动漫、卡通和电影风格。据说质量非常高!

让我们拥抱这些变化,用AI技术打破界限,共同创造一个更加多元、包容的未来。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一个程序猿的异常 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 创造动态艺术:AI在视觉和声音上的突破
  • 有钱人以后再也不会向下社交了
    • 合成TTS
    • Heygen 注册
      • Create Video
        • 上传图片
          • 上传音频文件
          • 其他平台推荐
            • Runway
              • Pika
              相关产品与服务
              云服务器
              云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档