央广网北京8月29日消息(记者 王晓蕾)从磁带、留声机到唱片、录音机,记录、处理声音的载体一直在不断更新迭代。最近几年,随着AI时代的到来,语音合成、变声等多项AI技术,为语音识别、翻译以及相关能力的产品提供了良好的技术支撑。
“目前市场上的录音笔功能还是比较单一。大家在录音笔产品上追求音质、存储空间、电量长短等,但用户用录音笔到底在做什么,我们对背后服务体验的思考其实是不足的,” 在昨天的搜狗听写服务开放暨AI创新联盟发布会上,搜狗CTO杨洪涛表示,加上最近几年,手机录音功能技术地更新,录音笔行业增速相对缓慢。
面对发展迟缓、替代性强等痛点,录音笔该如何突破发展瓶颈?AI技术的出现又将带来哪些新的机遇?
“现在的录音笔除了做智能降噪、去混响,具有超强的收音能力外,后续的录音转写、针对用户的场景化设置也至关重要。”会上,杨洪涛介绍,虽然只是在做录音笔这一个品类,但从音频分析、记录、处理等方面又会涉及更广泛的行业,例如,会议场景、电话场景等,怎么能够把我们的能力扩展到更广泛的行业以及场景中是未来的发力点。
搜狗公司AI交互技术中心总经理王砚峰表示,搜狗发布的这一代AI录音笔能够聚集多种个人场景服务。“我们不是只满足用户语音转文字的需求就足够了。用户语音转文背后的目的一定是编辑,所以我们希望能够在带给用户更好地编辑体验上做行业当中的首创优化。”他举例,在演讲、开会的时候有很多口头语、重复词,搜狗的文本顺滑功能会把这些口头语和重复词去掉,让大家拿到的文稿更通顺、更有逻辑性;在记者采访过程中,可能会涉及到很多采访对象的声音,搜狗首创了声音识别功能,能够把采访、开会过程中几个说话人的语音区分开来,并且把编辑的结果也区分开来。
此次发布会上,搜狗不仅推出了升级版AI录音笔炫彩版,满足用户更多元化、更时尚的需求,还宣布将其AI录音笔背后的“搜狗听写”服务开放。服务开放后,可以为市场上90%以上的录音笔产品提供接入服务。“服务的提供表面上看是免费的,但是背后有新的商业机会在里面,如果给用户转文字转得准,在文字内容生产上会带来更多新的价值,用户为此买单,而且在所谓的买单上,希望大家能一起产生新的后付费的商业模式。”杨洪涛在会后接受采访时表示。
会上,搜狗与爱国者、Newmine纽曼、索尼录音笔、万城集团四家录音笔行业企业成立AI创新联盟。而此次联盟达成将使录音笔行业从以硬件为主的单一收益模式向硬件+服务的多种收益模式转变,促进录音笔行业实现全面智能升级。
(王晓蕾)
领取专属 10元无门槛券
私享最新 技术干货