这几天,ChatTTS这个项目爆火,作为一款文生声模型,比以往的模型更可控,带来的语气更接近正常人说话,同时,官方在roadmap中规划了Lora,这也就意味着我们将来可以训练自己的声音,另外还规划了实时流的音频生成,也就是说,chat流和tts结合,使得大模型对话更加流畅,我们甚至可以感受不到大模型在思考,就和真人对话一样。
https://www.bilibili.com/video/BV1zn4y1o7iV/
过去几年,“打造IP”是自媒体时代的终极命题,而随着AI最后一块拼图的完整,“打造AI IP”或成为可能。IP的本质,是具有独立个性的服务。随着AI蓝图的完善,我们可以提供千人千面的IP,过去我们养电子宠物,现在有一些爱恋宠服务,而未来我们可以为每一个用户定制爱豆宠。将数字人和物联网、车联网等结合起来,让自己最喜爱的独一无二的AI IP为自己提供虚拟管家服务,给用户带来的喜悦感,不言而喻。当然,随着机器人技术的不断成熟,打通线上线下,基于AI IP的实体服务也不是没有可能。
最近半年,在TTS领域也涌现了一大批音频领域的AI,TTS发展到了VITS阶段,so-vits-svc则是在音乐领域大放异彩。TTS从纯粹的文字朗读,变得富有情感和节奏,言语间显得更加自然。
对于内容创作和赚外快来说,无疑,AI的最后一块版图正在完善,而且,随着各个厂商们技术的成熟,创作者们的使用成本也会逐渐降低。