语音 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签语音

#语音

ChatGPT Voice，帮你接住那些还没整理好的想法

AI 生命克劳德 1天前2026-07-27 17:24:03

如果聊天已经通过其他模式开始，界面提供的是语音听写。以前用 Voice 创建的会话，则可以重新打开并继续语音交流。

4800

高校机构 AI 深度伪造语音钓鱼风险与全链路防御体系研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

2天前2026-07-27 09:35:50

生成式人工智能快速普及背景下，深度伪造（Deepfake）与语音克隆技术持续降低网络欺诈实施门槛，以高校、医疗机构为代表的公共服务机构频繁遭遇仿冒教职工、患者身...

5110

分裂团伙卧底反噬语音钓鱼黑产链条攻防与治理研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

3天前2026-07-25 20:19:15

跨境语音钓鱼（Vishing）犯罪已形成多层级、分工明确的产业化黑产网络，团伙内部利益冲突、分支分裂催生 “卧底反水、黑吃黑” 新型内部对抗模式。韩国中央日报披...

7400

深度解读：多模态测试的5大常见误区

顾翔 5天前2026-07-24 10:58:45

引言随着AIGC、智能座舱、具身智能机器人等技术爆发式发展，多模态AI系统（融合文本、图像、语音、视频、传感器信号等多源输入与输出）正加速落地。然而，传统软件...

10110

Voicebox：把 ElevenLabs 和 WisprFlow 合二为一的开源 AI 语音工作室

勇哥AI笔记 8天前2026-07-21 16:30:51

Voicebox 不训练新模型，它的核心价值是：把多个开源语音模型集成到一个统一的桌面应用中，覆盖"语音克隆 + 语音合成 + 口述输入 + Agent 语音输...

13110

Voicebox：把 ElevenLabs 和 WisprFlow 装进一个本地 App，44k Star 开源语音工作室拆解

阿特拉斯 8天前2026-07-21 16:02:20

ElevenLabs 把语音合成做到了行业标杆，WisprFlow 把语音听写做成了生产力工具。这两家云厂商正好卡在语音 I/O 回路的两端——一个管输出，一个...

15210

OpenAI 官方新手指南：从零开始用 ChatGPT

阿特拉斯 8天前2026-07-21 09:07:36

这份指南很短，但把新手最需要的几件事都串起来了：ChatGPT 到底是什么、第一句话该怎么发、什么样的任务适合先用起来、语音怎么用，以及下一步该去上哪门课。下面...

22110

Python 将文本内容转换为语音播放并保存为音频文件

用户11081884 8天前2026-07-20 18:51:36

文本转语音（Text-to-Speech, TTS）技术能够将书面文字转换为自然语音输出，广泛应用于辅助阅读、语言学习、无障碍服务等场景。Python py...

8110

IMA，这样用，为知识发声

用户11081884 8天前2026-07-20 17:12:44

IMA能存、能搜、能读、能写，能做数据分析和专业领域的AI知识库，越用越懂你。现在IMA支持生成双人自然对话播客，把知识发给IMA，它会自动生成普通话语音直接播...

16910

IMA，这样用，创作更容易了

用户11081884 8天前2026-07-20 17:10:51

在ima移动端的首页可以通过语音来输入问题，ima根据语音的输入帮助快速进行问答，创作等。

18000

干翻豆包！装上 OpenClaw 安卓端 + Claude 大模型，让老旧手机变身超级 AI 助手, 别让它再躺抽屉换不锈钢盆了

OpenNiuma 9天前2026-07-20 13:45:58

安卓端支持连续语音模式，加上 ElevenLabs 的 TTS 语音输出能力，让旧手机变成一个随身携带的语音交互终端。走在路上直接跟手机对话，让 AI 帮忙查资...

10510

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

杜金房 11天前2026-07-17 20:22:33

本文档涵盖 mod_audio_stream，这是一个 FreeSWITCH 模块，用于从活动通话信道捕获音频，并通过 WebSocket 或 TCP 连接将其...

11610

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

Amusi 12天前2026-07-17 10:49:41

本文介绍了武汉大学行为理解与视觉感知实验室（HUVPR-Lab）在ECCV2026上发表的研究成果。该工作针对以人为中心的音视频联合生成中长期存在的"语音-音...

9310

别再裸面了，搭个 AI 面试官先练一轮

王中阳AI编程 14天前2026-07-15 12:55:37

我没用豆包的语音功能——豆包模型不太行。方案是：龙虾 + 讯飞输入法语音输入。讯飞的语音识别准确率很高，技术术语识别也没问题。效果和豆包原生语音差不多，但模型用...

17910

视频推理框架进展I

用户10637292 15天前2026-07-13 18:45:17

摘要：近年来，测试时间优化的进步使得大模型（LLM）在推理能力方面取得了显著的提升，使它们能够解决数学和编码方面高度复杂的问题。然而，多模式大模型（MLLM）的...

9510

#语音

ChatGPT Voice，帮你接住那些还没整理好的想法

高校机构 AI 深度伪造语音钓鱼风险与全链路防御体系研究

分裂团伙卧底反噬语音钓鱼黑产链条攻防与治理研究

深度解读：多模态测试的5大常见误区

Voicebox：把 ElevenLabs 和 WisprFlow 合二为一的开源 AI 语音工作室

Voicebox：把 ElevenLabs 和 WisprFlow 装进一个本地 App，44k Star 开源语音工作室拆解

OpenAI 官方新手指南：从零开始用 ChatGPT

Python 将文本内容转换为语音播放并保存为音频文件

IMA，这样用，为知识发声

IMA，这样用，创作更容易了

干翻豆包！装上 OpenClaw 安卓端 + Claude 大模型，让老旧手机变身超级 AI 助手, 别让它再躺抽屉换不锈钢盆了

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

别再裸面了，搭个 AI 面试官先练一轮

视频推理框架进展I

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

张善友的专栏

TEG云端专业号的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐