Meta 发布了一个“开源”版本的谷歌 NotebookLM 中爆红的播客生成功能,名为 NotebookLlama。不出所料,该项目主要使用 Meta 自家的 Llama 模型进行处理。与 NotebookLM 类似,它可以根据上传的文本文件生成类似播客的对白式摘要。
NotebookLlama 首先从文件(例如新闻文章或博客文章的 PDF)中创建一个文本转录。然后,它会添加“更多戏剧化”的元素和对话中断,再将转录内容输入开源的文本转语音模型。
目前,NotebookLlama 的生成结果的质量不如 NotebookLM。在我听过的 NotebookLlama 样本中,声音带有明显的机器人音质,并且在一些奇怪的点上会出现声音重叠。
但是,该项目背后的 Meta 研究人员表示,可以通过更强大的模型来提高质量。
他们在 NotebookLlama 的 GitHub 页面上写道:“文本转语音模型是影响自然度的限制因素。[此外,]另一种撰写播客的方法是让两个代理就感兴趣的主题进行辩论并编写播客提纲。目前我们使用单个模型来编写播客提纲。”
NotebookLlama 并不是第一个尝试复制 NotebookLM 播客功能的项目。一些项目比其他项目更成功。但即使是 NotebookLM 本身,也没有设法解决困扰所有人工智能的“幻觉”问题。也就是说,人工智能生成的播客必然会包含一些虚构的内容。
领取专属 10元无门槛券
私享最新 技术干货