AI日报|智谱AI再降价,同时开源9B系列模型;国内外气象大模型竞逐升级
字节跳动推出文本到语音模型家族——SEED TTS,其核心亮点在于生成的语音音色高度接近人类,在相似度与自然流畅度方面,可以与真声媲美。
在技术层面有以下创新:
https://bytedancespeech.github.io/seedtts_tech_report/
Stability AI宣布推出生成声音和歌曲的开放式人工智能模型—Stable Audio Open。该公司声称,该模型仅接受免版税录音训练。用户只需输入文本描述,模型就能生成最长47秒的声音片段,
Stable Audio Open能够创造鼓点、乐器旋律、环境音效及视频、电影、电视节目的制作元素,还能“编辑”现有歌曲或融合不同曲风,例如将柔和爵士风格应用于另一首歌。
并且Stable Audio Open一大亮点是用户可基于个人音频资料微调模型,让生成的内容更加个性化。
然而,这款开源模型存在局限:无法生成完整歌曲、旋律或人声,对此类需求,Stability AI推荐使用其付费服务Stable Audio。
此外,Stable Audio Open禁止商业用途。
https://techcrunch.com/2024/06/05/stability-ai-releases-a-sound-generator/
Pika完成全新6亿融资,即将发布全新视频生成大模型
AI视频生成初创公司Pika日前已完成总额8000万美元的B轮融资,由Spark Capital领投,Greycroft、Lightspeed Venture Partners以及Jared Leto参投,公司估值超过4.7亿美元,较上一轮翻了一倍。
截至目前,Pika总融资额已达1.35亿美元。Pika用户数达到数百万,每周生成数百万个视频。同时,Pika已租用数百个量级的GPU(图形处理器)芯片,用于模型训练和推理计算。
创始人郭文景表示:“我们正在努力打造最好的视频模式,同时也在努力打造真正服务于创作者的产品。”据悉,Pika将在今年下半年发布一个全新关键的基础模型以及配套产品更新。
https://mp.weixin.qq.com/s/fJtcza5MB9rmFRmLT2bI9g
从头开始制作3D角色动画通常既费力又费钱,需要使用复杂的软件和动作捕捉工具。Cartwheel希望让基本动画变得简单,只需用文字描述动画,就可以用AI生成基本动作。
因此用户在使用Cartwheel时,可以从文本框时输入任何内容,一两分钟后就可以得到一个流畅的基本动作动画,然后可以将其导出到3D编辑软件中。
Cartwheel表示,动画师无需在迈步,拍打,坐下等基本动作上花费太多时间,Cartwheel可以自动生成基本动作,用户可以自己对其进行关键帧处理,制作过程会更加快捷。
距离类似ChatGPT的智能功能引入iOS 18仅剩几天时间。ChatGPT 官方 iOS 应用迎来重大更新(1.2024.150),用户现在可以在使用其他应用的同时继续与ChatGPT进行对话。 ChatGPT的这项全新多任务功能默认处于关闭状态,需要手动开启。
开启后台对话功能后,用户可以启动与ChatGPT的语音对话,然后离开应用并继续交谈。即使用户在使用其他应用,也能继续与ChatGPT语音助手进行对话。
https://www.ithome.com/0/773/429.htm
得益于AI芯片的需求激增,英伟达今年股价飙升约147%,市值增加约1.8万亿美元,周三,该公司股价上涨5.2%,收于创纪录的1224.40美元,市值超过3万亿美元,超越苹果公司。
周三股价上涨使英伟达CEO黄仁勋在彭博亿万富翁指数上的财富增加了50多亿美元,达到1074亿美元。
英伟达没有放缓脚步的迹象,CEO黄仁勋表示计划每年升级其AI加速器。黄仁勋在台湾大学的演讲中提到,生成式AI的兴起是一场新的工业革命,随着AI技术渗透到个人电脑领域,英伟达将继续扮演重要角色。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。