首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AI虚拟人多模态交互落地难题如何破解?我们在乐享A.I.技术沙龙成都站找到了答案

    6 月 23 日,讯飞开放平台乐享 A.I. 技术沙龙“A.I. 虚拟人多模态创新交互”专场在成都圆满落幕。 35 秒带你回顾现场精彩瞬间↓↓↓ 近几年,随着图像处理、语音合成、语音识别、语义理解、多语种等多项人工智能技术不断发展,AI 虚拟人开始在各行各业落地应用,各大公司争相布局。这背后,其实是 AI 虚拟人多模态交互技术正在成为大趋势。 多模态融合视觉、听觉、文本等多种模态信息,能够打破单模态输入输出限制,从而更贴近人类真实使用习惯。对于 AI 交互产品来说,只有综合利用多模态信息才能更准确地理解人类

    01

    数据万象音视频处理 —— 打开对声音的想象,开启AI创作时代

    “前方路口请直行”、“限速100”、“前方路段拥堵”等,是不是看到这些导航常用语句,脑海中已经有您常听的声音浮现了?导航播报所使用的TTS语音合成技术的商业化道路从有声听书、银行智能客服覆盖到虚拟人配音、残障人士辅助应用等,用户需求来源多样,应用场景逐步细化和专业,在这众多的行业所孕育出的应用场景中,TTS语音合成技术大幅减少文字转为语音的时间与企业用工成本的同时,也为用户带来由AI创作赋予的全新体验,语音合成模型经过长时间的发展,由最初的基于拼接合成,到参数合成,逐渐达到了感情充沛、高流畅度、个性化的现阶

    01

    干货满满,中科院信工所于静新课帮你get学术研究与论文写作技能

    机器之心报道 机器之心编辑部 中科院信息工程研究所副研究员于静老师近期在 B 站开设了《科研与英文学术论文写作》视频课程,全程干货。 科研与学术论文写作是学术研究者需要具备的核心能力之一,但目前处于科研起步阶段的同学对如何做出高水平学术研究、如何写出高质量学术论文、如何培养必备的学术能力仍存在诸多困惑,也缺少科学的方法指导。在宝贵的在校学习阶段,尽早掌握一套完善科学的科研方法、了解具有实操价值的论文写作规范能够有效助力高水平学术成果的产出。 近期,中科院信息工程研究所副研究员于静老师在 “CCF 学生领航计

    02
    领券