法国独立非盈利AI研究实验室Kyutai推出了具备70种情绪的语音助手Moshi,被视为GPT-4的新挑战者。此次在巴黎的演示显示,Moshi不仅具备多模态交互能力,还能实时生成具有情绪变化的语音,开创性地实现了语音AI的全新应用。
Moshi的开发团队由Kyutai的八位研究人员组成,他们在六个月内从零开始打造出这款创新产品。Moshi不仅能够模拟人类的情绪,进行丰富多变的对话,还能在不同语境下展现出相应的风格,如用浓重的法国口音朗诵诗歌。此外,Moshi的功能还包括实时响应和低延迟交互,使其在实时应用场景中,如客户服务或实时翻译,表现出色。
Kyutai表示,Moshi的研发旨在为AI开放研究及其生态系统的发展贡献力量。未来几周,Moshi的模型代码、权重以及相关研究将被公开发布,这在同类技术中也是前所未有的。此举不仅展示了Kyutai对于科技开放和共享的承诺,也预示着这种技术的潜力,可能彻底改变我们与数字世界中的AI交流方式。
与此同时,Moshi的问世对OpenAI构成了直接挑战。OpenAI原本计划在其ChatGPT平台上推出类似的语音助手功能,但由于安全顾虑,发布已被推迟。Kyutai的快速动作在业界引起了广泛关注,许多人认为这标志着一个新的竞争阶段的开始。
Kyutai获得了欧洲实业资本等多方面的支持,包括法国亿万富翁Xavier Niel的投资。这不仅为Kyutai提供了坚实的资金支持,还强化了其在全球AI发展领域中的竞争地位。Kyutai CEO Patrick Pérez表示,他们相信Moshi将为用户提供前所未有的交互体验,使欧洲在全球AI领域中占据重要位置。
总的来说,Moshi的推出不仅是技术创新的胜利,也是对开放科技理念的一次有力支持。随着更多功能的加入和技术的完善,Moshi有望在不久的将来成为市场上的主导产品,重新定义用户与AI的互动方式。
领取专属 10元无门槛券
私享最新 技术干货