产品动态

最近更新时间:2024-10-12 15:15:11

我的收藏

2024年10月

动态名称
动态描述
发布时间
相关文档
客户端新增 HarmonyOS NEXT SDK,支持一句话识别、录音文件识别极速版接口
客户端新增 HarmonyOS NEXT SDK,支持一句话识别、录音文件识别极速版接口。
2024-10-12

2024年5月

动态名称
动态描述
发布时间
相关文档
客户端新增 HarmonyOS NEXT SDK,支持实时语音识别接口
客户端新增 HarmonyOS NEXT SDK,支持实时语音识别接口。
2024-5-9

2024年3月

动态名称
动态描述
发布时间
相关文档
语音识别大模型V2.0版本发布
语音识别大模型V2.0版本全新升级为普方英大模型,一个引擎同时支持中文普通话、英语、中文27种方言的混合识别,并且全新支持 实时语音识别 。当前模型在V1.0的基础上进一步加大了模型参数量和神经网络层数,语言模型性能增强,针对方言混合识别、噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,点击这里 进行通用版本与普方英大模型版本的识别效果对比。
2024-3-28



2024年2月

动态名称
动态描述
发布时间
相关文档
语音识别大模型V1.0版本发布
语音识别大模型V1.0版本支持了中文普通话大模型和中文方言大模型。模型参数量极大,语言模型性能增强,针对方言混合识别、噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升,点击这里 进行通用版本与大模型版本的识别效果对比。
2024-2-1



2024年1月

动态名称
动态描述
发布时间
相关文档
Flutter SDK 更新
增加临时密钥认证方式,修复部分回调信息错误, 更新iOS Framework版本至3.1.15
2024-1-19
体验模块支持历史记录查询
历史识别记录在云端最多保存7天,可以下载识别结果,支持用户查看文字识别内容。
2024-1-29



2023年10月

动态名称
动态描述
发布时间
相关文档
实时语音识别支持强制断句参数
实时语音识别支持强制断句参数,能够在连续说话不间断、或噪声不中断的情况下,支持用户配置断句参数将 vad 断开,从而实现强制断句的效果。
2023-10-31
新上线超级热词功能

当热词权重设置为11时,热词将升级为超级热词,以提升识别准确率。但建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
2023-10-30
Flutter 客户端新增一句话识别和录音文件识别极速版接口
Flutter SDK 客户端新增一句话识别接口、录音文件识别极速版接口。
2023-10-26

2023年09月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持口语转书面语
录音文件识别支持口语转书面语,可对转写结果做复杂的后处理,实现对语气词、重复词过滤的效果。
2023-09-26


2023年08月

动态名称
动态描述
发布时间
相关文档
客户端 SDK 支持回音消除
iOS/Android 客户端支持回声消除接口,客户可以自行选择开启或关闭。
2023-08-31
语音识别产品支持印地语
语音识别产品新增语言能力,新增支持印地语。
2023-08-31
语音识别产品支持西班牙语
语音识别产品新增语言能力,新增支持西班牙语。
2023-08-03



2023年07月

动态名称
动态描述
发布时间
相关文档
控制台上线新访问管理
可通过先创建 JSON 策略、再将策略关联用户或用户组的形式完成子账号权限的配置。
2023-07-27
语音识别产品支持阿拉伯语
语音识别产品新增语言能力,新增支持阿拉伯语。
2023-07-18
官网体验支持录音文件识别
官网体验页面支持上传录音文件识别功能、更全面展示产品能力。
2023-07-13


2023年06月

动态名称
动态描述
发布时间
相关文档
ASR+产品系列发布
新上线说话人识别、虚拟号真人判定。说话人识别可用于登录锁、身份核验等场景;虚拟号真人判定可用于智能外呼场景。
2023-06-28
ASR+产品系列


2023年04月

动态名称
动态描述
发布时间
相关文档
离在线语音识别SDK发布
离在线SDK是在离线SDK里支持在线接口,支持离在线混合识别模式,会根据网络情况自动切换离线和在线版本。
2023-04-28



2023年03月

动态名称
动态描述
发布时间
相关文档
语音识别产品支持越南语、马来语、印度尼西亚语、菲律宾语、葡萄牙语、土耳其语
语音识别产品新增语言能力,新增支持越南语、马来语、印度尼西亚语、菲律宾语、葡萄牙语、土耳其语。
2023-03-24


2023年02月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持情绪识别
录音文件识别接口中配置情绪识别相关参数(EmotionRecognition)后,可实现输出高兴、愤怒、伤心等情绪标签的输出。
2023-02-28



2022年12月

动态名称
动态描述
发布时间
相关文档
实时语音识别、录音文件识别极速版、一句话识别支持 QPS/并发叠加包购买。
QPS/并发叠加包可以对现有 QPS/并发进行扩容。
2022-12-26


2022年11月

动态名称
动态描述
发布时间
相关文档
实时语音识别、录音文件识别、一句话识别支持热词增强版
热词增强版可以有效提升热词在识别结果中的命中率,仅适用中文8k 和16k 的引擎。
2022-11-30
实时语音识别、录音文件识别、一句话识别支持中英粤混合模型
中文、英文、粤语可在免切换的情况下进行混合识别。
2022-11-28


2022年10月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持情绪能量值检测和静音时长检测
所有语种引擎支持情绪能量值检测。静音时长检测支持检测本句与上一句之间的静音时长,单位为秒。
2022-10-29


2022年09月

动态名称
动态描述
发布时间
相关文档
优化8k 引擎下的中文普通话模型
8k_zh(中文8k 引擎)识别率准确率和性能获得了提升,能够更好地适配电话场景
2022-09-27
优化16k 引擎下的多方言模型
16k_zh_dialect(中文16k 多方言引擎)解决了多识别的问题,部分方言的识别准确率明显提升。
2022-09-26
优化16k 引擎下的多方言模型
16k_zh_dialect(中文16k 多方言引擎)支持话者分离功能。
2022-09-26


2021年12月

动态名称
动态描述
发布时间
相关文档
语音识别产品支持四川话、武汉话等23种方言
在原有中文普通话、英语、粤语、日语、上海话基础上,新增了四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。
2021-12-03


2021年02月

动态名称
动态描述
发布时间
相关文档
语音识别发布多款行业模型
实时语音识别支持教育、医疗、游戏、法庭行业模型录音文件识别支持教育、医疗行业模型
2021-02-01


2021年01月

动态名称
动态描述
发布时间
相关文档
语音识别支持音频格式全面升级
对录音文件识别、实时语音识别支持的格式进行了全面的升级丰富
2021-01-21
实时语音识别 SDK 全面支持 websocket 协议
实时语音识别服务端、客户端、前端 SDK 都已支持 websocket 协议
2021-01-21
语音流异步识别子产品发布
对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型,可用于直播流质检等场景
2021-01-15
录音文件识别极速版子产品发布
对较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景
2021-01-15


2020年11月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持自动说话人分离
16k_zh_video 引擎模型支持说话人分离功能上线,电话场景和非电话场景均支持自动分离和指定说话人数分离
2020-11-27


2020年10月

动态名称
动态描述
发布时间
相关文档
ASR 接入层支持 websocket 协议
本接口服务采用 websocket 协议,对实时音频流进行识别,同步返回识别结果,达到“边说边出文字”的效果。
2020-10-10


2020年09月

动态名称
动态描述
发布时间
相关文档
ASR 访问控制
通过腾讯云的 CAM(访问控制)产品实现对 ASR 操作维度和资源维度的权限管理。
2020-09-16
语音识别电话场景支持英语模型
语音识别新增电话 8k 英语模型,适用于英语电话场景的语音转文字
2020-09-09
客户端 TRTC 接入实时语音识别技术指引上线
针对有实时音视频与语音识别需求的用户,可通过 TRTC 接入的实时语音识别的方式使用
2020-09-07


2020年08月

动态名称
动态描述
发布时间
相关文档
语音识别产品支持上海话方言
语音识别产品提升语言和方言能力,新增支持上海话方言的能力
2020-08-21
语音识别产品支持日语
语音识别产品提升语言和方言能力,新增支持日语的能力
2020-08-04
语音识别产品返回结果中标点符号能力提升
语音识别产品返回结果中标点符号能力升级后增加顿号、问号和叹号的支持
2020-08-01


2020年07月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持3人及以上多说话人分离
电话场景支持单声道2人话者分离,非电话场景支持单声道2-10人话者分离
2020-07-28
实时语音识别支持 OPUS 格式
OPUS 是一个低延时、高保真的适合在网络中传输的开源的语音编码格式,也是目前比较主流的音频流格式,可更好的支持使用该格式的客户接入实时语音识别
2020-07-02


2020年06月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持时长能力提升
当采用上传音频 url 方式使用录音文件识别时,url 的时长限制由1小时放宽到5小时
2020-06-18
实时语音识别支持词级别时间戳功能
实时语音识别支持词级别时间戳功能,该功能适用于通过语音识别加载字幕,并且对时延要求较高场景
2020-06-05


2020年04月

动态名称
动态描述
发布时间
相关文档
支持用户自主对识别结果进行数字转换
支持用户自主选择转换为中文数字还是智能转换为阿拉伯数字
2020-04-24
录音文件识别产品上线音视频领域模型
对于音视频领域(半远场、带背景音乐)的音频转写,有业界领先的识别精度
2020-04-07


2020年03月

动态名称
动态描述
发布时间
相关文档
发布语音识别后脏词过滤、语气词过滤和句末标点过滤用户自主选择功能
支持用户根据使用场景自主选择是否过滤脏词、语气词和句末标点
2020-03-16


2020年02月

动态名称
动态描述
发布时间
相关文档
语音识别产品支持通过控制台创建热词
添加热词可以显著提升专有词汇识别准确率
2020-02-25


2020年01月

动态名称
动态描述
发布时间
相关文档
实时语音识别与一句话识别产品价格策略变更
变更后的计费策略是根据用量梯度决定产品价格,用量越多单价越低
2020-01-01


2019年12月

动态名称
动态描述
发布时间
相关文档
录音文件识别支持云函数接入方式 
对于将音频文件存储在腾讯云 COS 上的用户,使用云函数方式接入的方法可明显减少前期的接入开发工作
2019-12-18
语音识别产品上线 Beta 版本自学习模型
支持通过语言模型自学习工具进行定制优化,可有效提高专有领域或行业下的语音识别准确率
2019-12-10
语音识别产品支持预付费的购买方式
腾讯云语音识别 ASR 提供预付费和后付费两种计费模式
2019-12-06


2019年11月

动态名称
动态描述
发布时间
相关文档
实时语音识别、一句话识别支持英语和粤语
实时语音识别、一句话识别提升语言和方言能力,新增支持英语和粤语的能力
2019-11-13