1、用户侧需录入语音转文本并作为消息发送到 ai侧。 2、ai,侧返回对应对话消息并转换成语音播放,且人物会随语音播放有说话的动作(口型与语音可以不一致,但要求是语音播放完毕后人物停止说话的动作)。
3、完成语音沟通后,在图6的聊天窗口中,需要体现所有语音聊天过程中的文本对话信息。(解释:就是在语音聊天过程中的对话信息也要展现在图6的对话框中,以文字展现)
4、默认情况下(在用户没有和ai沟通时),用户只会轻微左右摇头、眨眼等动作。
相似问题