首页
学习
活动
专区
圈层
工具
发布

#音频

一个网站搞定视频音频处理,连软件都不用装

轻松玩K技

这些原本要靠软件完成的操作,tools.video 直接搬进了浏览器里。 不用注册,不用安装,打开网页就能用。

700

软件中的工具箱,62个AI功能,还觉的少?

搜罗万相

有很多去人声提取,图片高清放大,视频去水印的软件,特别是视频类的,当然也需要格式转换,视频压缩类的,这不刚好发现一款不错的工具。

1000

GitHub 11万星!微软开源神器MarkItDown:PDF/Word/PPT/图片/音频一键转干净Markdown

AiDBA宝典

还在为文档格式头疼? PDF复制乱码、Word表格错位、PPT图文乱飞、图片音频没法喂给AI? 今天给大家挖到微软官方开源的神器——MarkItDown,一行命...

1900

CANN加速下的AIGC“即时翻译”:AI语音克隆与实时变声实战

用户12298955

以语音克隆为例,传统方案需要3-5秒参考音频+2-3秒生成时间,而CANN优化方案可实现500ms参考音频+300ms实时生成,延迟降低85%以上。

4910

一文看懂:腾讯云天御内容安全全家桶(文本+图片+音频+视频)如何协同作战

gavin1024

内容安全不止审核图片,违规信息可能以文字、图片、音频、视频多种形式出现。本文解读腾讯云天御全模态审核的产品矩阵、协同机制和一站式接入方案。

13210

立个 Flag:2026 年春节前,我要用 AI 落地一个产品。

用户7912670

必须承认,在现在这个快节奏的时代,愿意沉下心看文字的人是最少的。站在用户的角度,大家更喜欢刷短视频,或者在通勤路上听音频。

9810

多模态开发踩坑实录

程序员NEO

如果你在跑 LangChain4j 的对话 Demo 时,控制台提示“找不到符号”的 Lombok 错误,通常是 IDEA 注解处理器没配好。

12510

NotebookLM:靠谱知识库

程序员NEO

Gemini 生态的另一个重要工具是 NotebookLM。如果你需要AI具有极低的幻觉率,或者需要整合散落在各种数据源(视频、音频、PDF、网页等)中的信息,...

21510

Graphify:为代码库构建知识图谱,以图遍历替代向量检索

deephub

把 Graphify 指向一个含有音频或视频的目录,它会用 faster-whisper 在本机完成转录,音频不上传到任何地方。这个 pass 是可选的,需要装...

31110

倒计时3天!白嫖 MiniMax Music 2.6 内测,每天 500 首额度承包你一年的曲库

程序那些事儿

MiniMax 悄悄开启的 Music 2.6 创作者内测,只剩最后 3 天。如果说 2.5 还在解决“好听”的问题,那么 2.6 解决的是 “好用”。

22410

免费但好用,两个极品多功能转换工具推荐!

搜罗万相

随便点击进入后,可以看到它的分类很清晰,操作也非常方便,比如我进入的是音频,可直接拖拽文件进行上传,也可以粘贴视频地址进行提取音频。

13410

OpenClaw智能家居+健康追踪:AI管空气净化+WHOOP数据,生活优化神器

不吃草的牛德

“老板,早安!基于你的手环数据(HRV 下降 15%,睡眠中断 3 次),我已启动空气净化器除霾模式,调整恒温器到 22°C,播放轻柔冥想音频。今日建议:推迟会...

9110

SenseVoice使用记录

软件测试大叔

16k中文通用VAD模型:可用于检测长语音片段中有效语音的起止时间点。FSMN-Monophone VAD是达摩院语音团队提出的高效语音端点检测模型,用于检测输...

17110

超强转换视频工具、音频工具、图片工具、水印工具、字幕工具

搜罗资料

UniFab Toolkit 你可以理解它是一个AI 影音工具箱,普通人也能用。软件支持转换视频格式、裁剪合并、调速旋转、画面去抖动修复;音频可以转换格式、裁剪...

15310

JL杰理AC696N开发板常见问题FAQ-问题15:在Code::Blocks编译下载程序时,点击SDK中的批处理文件 download.bat 后,如何判断程

用户12337444

用JL杰理AC696N开发板做开发,编译下载是家常便饭。有时候明明提示“下载成功”,但程序里新加的打印死活不出来,让人摸不着头脑。其实问题往往出在:程序根本没重...

5900

AC696N开发板常见问题FAQ-问题13:开发板的默认的输出打印是哪个引脚?打印默认的波特率是多少?能不能改成115200?按图配置后输出乱码怎么解决

用户12337444

客户拿到开发板后,关于串口打印调试的基础操作问题比较多,比如: 开发板的默认的输出打印是哪个引脚?

2300

1小时录音,3分钟出稿| 不用显卡不用会员,视频拖进去字幕直接出

轻松玩K技

网上那些语音识别工具: 要么收费, 要么要配环境, 要么本地跑模型——风扇直接起飞。

19610

1小时录音,3分钟出稿| 不用显卡不用会员,视频拖进去字幕直接出

轻松玩K技

网上那些语音识别工具: 要么收费, 要么要配环境, 要么本地跑模型——风扇直接起飞。

19610
领券