首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#语音

ChatGPT-5更新大曝光!免费用户能升级GPT-4了?

用户11203141

AIPRM首席工程师Tibor Blaho最近在X上透露了ChatGPT即将推出的功能和界面更新。尽管Sam Altman曾明确表示GPT-5不会那么快推出,而...

6810

什么是DeepSeek-R1?如何入门DeepSeek-R1?手机端和网页端使用攻略

猫头虎

DeepSeek-R1是由中国人工智能公司深度求索(DeepSeek)推出的新一代AI智能助手,定位于多场景生产力工具。它基于自主研发的大语言模型(LLM),支...

17010

千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?

机器之心

两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?但当他们确认彼此的 AI 身份后,一切变得超乎想象了。

8700

微软发布Phi系列新成员:Phi-4-multimodal与Phi-4-mini,引领小型语言模型新潮流

GPUS Lady

本周,微软宣布推出Phi家族的最新成员——Phi-4-multimodal和Phi-4-mini,这两款小型语言模型(SLMs)旨在为开发者提供先进的AI能力,...

16510

微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

机器之心

2024 年底,微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型(SLM)。仅用了 40% 合成数据,140 亿参数的 Phi-4 就在数学性...

4100

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

新智元

首先,它能做到AI语音秒回。因为语音对话延迟低至650ms,全链路的深度优化,让对话无比流畅自然。

7000

解锁DeepSeek,未来为语音直播交友软件源码开发搭建注入新活力

用户10015986

近年来,人工智能技术的快速发展为互联网应用将会带来革命性变化。DeepSeek作为新一代人工智能技术,在语音识别、自然语言处理、情感计算等领域取得突破性进展,为...

11311

DeepSeek 点燃关键技术突破的科技引擎,驶向未来新航道

用户11458826

语音识别技术广泛应用于智能语音助手、语音交互系统、会议记录等领域。例如,智能语音助手可以通过语音识别技术理解用户的语音指令,提供相应的服务;在会议记录中,语音识...

17610

发布 3 天后,Grok 3 开放免费使用,马斯克:让你们用到服务器崩溃为止

深度学习与Python

北京时间 2 月 20 日,马斯克的 AI 公司 xAI 宣布,Grok 3 模型现已开放免费使用(直至服务器崩溃)。马斯克表示,在短时间内,Grok 3 将对...

13910

突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题

新智元

DeepSearch、Think两大模式,同时上线。唯独遗憾的是,Big Brain还在雪藏。

1.1K220

ToolBaz:自媒体创作的完全免费且无需登录的集成多种大模型的 AI 助手

程序那些事儿

ToolBaz 提供高质量的文本语音转换功能,支持多种语音和语调。自媒体创作者可以利用这一工具,将文字内容转化为语音,为听众提供更加丰富的体验。

9810

《揭秘AI语音助手:从“听”到“说”的智能之旅》

程序员阿伟

语音合成是核心步骤,基于声学模型和语音库生成语音信号。传统TTS有“拼接法”和“参数法”。拼接法从预先录制的语音库中选择所需语音单元拼接而成,语音质量高,但成本...

11210

AI大模型发展对语音直播交友系统源码开发搭建的影响

用户10015986

语音交互更自然流畅: 传统语音识别技术受限于模型规模和训练数据,难以准确识别方言、口语化表达和背景噪音。而AI大模型凭借海量数据和强大算力,能够实现更精准的语音...

6510

万字长文 | 让大模型“开口”说话:从ASR到端到端语音大模型的进化之旅

AI研思录

在我们日常生活中,语音助手已经变得越来越普遍。无论是苹果的Siri还是小米的小爱同学,它们都在以惊人的速度渗透到我们的日常生活中。这些语音助手不仅能够帮我们查询...

31920

微软又放大招了!MarkItDown:轻松转换为Markdown的神器

AI研思录

微软最新开源的 Python Markitdown 工具,能将 PDF、Office 文档(Word/PPT/Excel)、图片、音频等多种格式的文件智能转换为...

18210

清华团队新算法玩转频域时域,压缩95%计算量实现语音分离新SOTA!

机器之心

EchoSet 数据集的构建基于 SoundSpaces 2.0 平台 2 和 Matterport3D 场景数据集 3,能够模拟不同声学环境中的语音混响效果。...

10200

微信的 DeepSeek 也崩了....

小林coding

细心朋友肯定发现了,问小白 APP 输入框里有一个语音按钮,难道「问小白」可以语音提问?

9410

KT142C语音芯片内置的320Kbyte空间不够,还有其他方案吗?

清月电子

KT142C语音芯片内置的是320Kbyte的空间,详细可以看看芯片手册的4.3章节,如下图所示

4400

“新旗手”三星Galaxy S25系列,再次定义了AI手机的进化方向

Alter聊科技

有了Galaxy AI的跨应用执行,同样的需求被简化到了一步:只需要按下侧键,用语音、文本乃至图像表达自己的指令,三星Galaxy S25系列就能自动完成餐厅筛...

6500
领券