2024年10月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
客户端新增 HarmonyOS NEXT SDK,支持一句话识别、录音文件识别极速版接口
|
客户端新增 HarmonyOS NEXT SDK,支持一句话识别、录音文件识别极速版接口。
| 2024-10-12 |
2024年5月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
客户端新增 HarmonyOS NEXT SDK,支持实时语音识别接口
|
客户端新增 HarmonyOS NEXT SDK,支持实时语音识别接口。
| 2024-5-9 |
2024年3月
2024年2月
2024年1月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
Flutter SDK 更新 |
增加临时密钥认证方式,修复部分回调信息错误,
更新iOS Framework版本至3.1.15
| 2024-1-19 | |
体验模块支持历史记录查询
|
历史识别记录在云端最多保存7天,可以下载识别结果,支持用户查看文字识别内容。
| 2024-1-29 |
2023年10月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
实时语音识别支持强制断句参数 | 实时语音识别支持强制断句参数,能够在连续说话不间断、或噪声不中断的情况下,支持用户配置断句参数将 vad 断开,从而实现强制断句的效果。 | 2023-10-31 | |
新上线超级热词功能 | 当热词权重设置为11时,热词将升级为超级热词,以提升识别准确率。但建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
| 2023-10-30 | |
Flutter 客户端新增一句话识别和录音文件识别极速版接口 |
Flutter SDK 客户端新增一句话识别接口、录音文件识别极速版接口。
| 2023-10-26 |
2023年09月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持口语转书面语
|
录音文件识别支持口语转书面语,可对转写结果做复杂的后处理,实现对语气词、重复词过滤的效果。
| 2023-09-26 |
2023年08月
2023年07月
2023年06月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
ASR+产品系列发布 | 新上线说话人识别、虚拟号真人判定。说话人识别可用于登录锁、身份核验等场景;虚拟号真人判定可用于智能外呼场景。 | 2023-06-28 | ASR+产品系列 |
2023年04月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
离在线语音识别SDK发布 | 离在线SDK是在离线SDK里支持在线接口,支持离在线混合识别模式,会根据网络情况自动切换离线和在线版本。 | 2023-04-28 |
2023年03月
2023年02月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持情绪识别 | 录音文件识别接口中配置情绪识别相关参数(EmotionRecognition)后,可实现输出高兴、愤怒、伤心等情绪标签的输出。 | 2023-02-28 |
2022年12月
2022年11月
2022年10月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持情绪能量值检测和静音时长检测 | 所有语种引擎支持情绪能量值检测。静音时长检测支持检测本句与上一句之间的静音时长,单位为秒。 | 2022-10-29 |
2022年09月
2021年12月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
语音识别产品支持四川话、武汉话等23种方言 | 在原有中文普通话、英语、粤语、日语、上海话基础上,新增了四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话。 | 2021-12-03 |
2021年02月
2021年01月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
语音识别支持音频格式全面升级 | 对录音文件识别、实时语音识别支持的格式进行了全面的升级丰富 | 2021-01-21 | |
实时语音识别 SDK 全面支持 websocket 协议 | 实时语音识别服务端、客户端、前端 SDK 都已支持 websocket 协议 | 2021-01-21 | |
语音流异步识别子产品发布 | 对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型,可用于直播流质检等场景 | 2021-01-15 | |
录音文件识别极速版子产品发布 | 对较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景 | 2021-01-15 |
2020年11月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持自动说话人分离 | 16k_zh_video 引擎模型支持说话人分离功能上线,电话场景和非电话场景均支持自动分离和指定说话人数分离 | 2020-11-27 |
2020年10月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
ASR 接入层支持 websocket 协议 | 本接口服务采用 websocket 协议,对实时音频流进行识别,同步返回识别结果,达到“边说边出文字”的效果。 | 2020-10-10 |
2020年09月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
ASR 访问控制 | 通过腾讯云的 CAM(访问控制)产品实现对 ASR 操作维度和资源维度的权限管理。 | 2020-09-16 | |
语音识别电话场景支持英语模型 | 语音识别新增电话 8k 英语模型,适用于英语电话场景的语音转文字 | 2020-09-09 | |
客户端 TRTC 接入实时语音识别技术指引上线 | 针对有实时音视频与语音识别需求的用户,可通过 TRTC 接入的实时语音识别的方式使用 | 2020-09-07 |
2020年08月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
语音识别产品支持上海话方言 | 语音识别产品提升语言和方言能力,新增支持上海话方言的能力 | 2020-08-21 | |
语音识别产品支持日语 | 语音识别产品提升语言和方言能力,新增支持日语的能力 | 2020-08-04 | |
语音识别产品返回结果中标点符号能力提升 | 语音识别产品返回结果中标点符号能力升级后增加顿号、问号和叹号的支持 | 2020-08-01 |
2020年07月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持3人及以上多说话人分离 | 电话场景支持单声道2人话者分离,非电话场景支持单声道2-10人话者分离 | 2020-07-28 | |
实时语音识别支持 OPUS 格式 | OPUS 是一个低延时、高保真的适合在网络中传输的开源的语音编码格式,也是目前比较主流的音频流格式,可更好的支持使用该格式的客户接入实时语音识别 | 2020-07-02 |
2020年06月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持时长能力提升 | 当采用上传音频 url 方式使用录音文件识别时,url 的时长限制由1小时放宽到5小时 | 2020-06-18 | |
实时语音识别支持词级别时间戳功能 | 实时语音识别支持词级别时间戳功能,该功能适用于通过语音识别加载字幕,并且对时延要求较高场景 | 2020-06-05 |
2020年04月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
支持用户自主对识别结果进行数字转换 | 支持用户自主选择转换为中文数字还是智能转换为阿拉伯数字 | 2020-04-24 | |
录音文件识别产品上线音视频领域模型 | 对于音视频领域(半远场、带背景音乐)的音频转写,有业界领先的识别精度 | 2020-04-07 |
2020年03月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
发布语音识别后脏词过滤、语气词过滤和句末标点过滤用户自主选择功能 | 支持用户根据使用场景自主选择是否过滤脏词、语气词和句末标点 | 2020-03-16 |
2020年02月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
语音识别产品支持通过控制台创建热词 | 添加热词可以显著提升专有词汇识别准确率 | 2020-02-25 |
2020年01月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
实时语音识别与一句话识别产品价格策略变更 | 变更后的计费策略是根据用量梯度决定产品价格,用量越多单价越低 | 2020-01-01 |
2019年12月
动态名称 | 动态描述 | 发布时间 | 相关文档 |
录音文件识别支持云函数接入方式 | 对于将音频文件存储在腾讯云 COS 上的用户,使用云函数方式接入的方法可明显减少前期的接入开发工作 | 2019-12-18 | |
语音识别产品上线 Beta 版本自学习模型 | 支持通过语言模型自学习工具进行定制优化,可有效提高专有领域或行业下的语音识别准确率 | 2019-12-10 | |
语音识别产品支持预付费的购买方式 | 腾讯云语音识别 ASR 提供预付费和后付费两种计费模式 | 2019-12-06 |
2019年11月