首页
学习
活动
专区
圈层
工具
发布

#音频

Unity教学 项目1 2D赛车小游戏

90后小陈老师

https://www.bilibili.com/video/BV1wT9rYZEKe?spm_id_from=333.788.videopod.section...

1100

LiveKit v1.9.2 发布:功能增强与多项优化修复详解

福大大架构师每日一题

本次 LiveKit v1.9.2 更新在功能扩展、性能优化以及稳定性方面都有显著提升,尤其是在音频分层传输支持、加密数据包类型引入、RPC API 完善以及节...

1200

mediamtx v1.15.2 更新详解:功能优化与问题修复

福大大架构师每日一题

mediamtx v1.15.2 已于 2025 年 10 月 14 日 发布,本次更新在功能、性能优化以及问题修复方面带来了多项改进,同时也更新了部分依赖库并...

2200

RustDesk 1.4.2 版本发布:新增增量文件传输与光标显示功能

福大大架构师每日一题

RustDesk 团队于2025年9月15日发布了1.4.2版本,这款开源的远程桌面客户端软件再次带来了一系列功能增强和问题修复。

3400

【大模型的底层逻辑】

贺公子之数据科学与艺术

大模型(如GPT、BERT等)的底层逻辑基于深度学习技术,核心是Transformer架构。其核心思想是通过大规模数据训练,学习语言或任务的通用表示,并利用自注...

2100

【接入多模态模型API的关键点】

贺公子之数据科学与艺术

多模态模型(如OpenAI的CLIP、GPT-4V,Google的Gemini等)能够处理文本、图像、音频等多种输入形式。接入时需注意以下关键点:

4110

HTML 音频(Audio)

用户11754185

下面的例子使用了两个不同的音频格式。HTML5 <audio> 元素会尝试以 mp3 或 ogg 来播放音频。如果失败,代码将回退尝试 <embed> 元素。

8010

HarmonyOS TTS(文本转语音)功能使用指南

红目香薰

TTS(Text-to-Speech)是HarmonyOS提供的重要语音服务能力,可以将文本内容转换为语音播放。本文基于实际项目经验,详细介绍如何在Harmon...

8810

干货分享|N8N一键将视频转为爆款文章!

磊哥

Hello,Old 铁。今天给大家分享一个,可能是全网最简洁、最好用的将本地视频转化为爆款文章的工作流!非常好用。

9810

在线随机图片img、视频MP4、音频MP3地址 接口、免费测试用

fruge365

在设计网站的时候,你可能没有太多时间设计样图。 Fakeimg.pl这个小工具,可生成占位图,并且拥有简单的API,自定义大小、颜色、文本,而且免费、开源。

15210

[开源]一款 AI 数字员工系统,让每个AI创业者,都有自己的AI品牌

艺齐飞

IMAI.WORK(又称 AI 员工、数字化工作者或非人类员工)是一种由软件驱动的实体,具备多领域技能组合,能够自主执行端到端的 AI 工作流。其任务职责根据岗...

26210

Claude Code 学习最佳实践:NotebookLM 生成全套学习视频+卡片+测试题

AI进修生

“ 他将36篇Claude Code相关内容“喂”给NotebookLM AI,生成了一套包含视频和音频的深度学习资料库 ?。整个过程耗时80分钟,浏览了440...

13510

Veo3.1 发布 ,附Gemini Pro免费使用教程。

AI进修生

你需要在flow中使用这个“extend” 的按钮,没升级之前,延长是没有音频的。只能使用veo2延长。

72110

Suno V5让整个B站开始文艺复兴了。

数字生命卡兹克

讲道理,作为一个13年开始用B站的用户,那个时候我的最爱,就是在B站上刷鬼畜视频,比如我最爱的伊丽莎白鼠。

20010

首个基于LLM的开源音频大模型!阶跃星辰重磅开源Step-Audio-EditX:P声音如此简单!

AI生成未来

文章链接:https://arxiv.org/pdf/2511.03601 开源链接:https://github.com/stepfun-ai/Step-Au...

25510

一部爆燃MV,窥见国产大模型的天花板:音乐界DeepSeek背后的“思维链”核心技术解读

AI生成未来

这两天发现一个超燃MV作品《Digital Heartbeat》,歌曲和画面的适配度非常高,一开始就被它震撼的音乐节奏和极具未来感的画面所吸引。其中最惊艳我的是...

19810

让虚拟人秒懂人类情感!多模态DiT架构炸裂升级:字节OmniHuman-1.5让Ta拥有灵魂!

AI生成未来

文章链接:https://arxiv.org/pdf/2508.19209 项目链接:https://omnihuman-lab.github.io/v1_5...

14210

AI的倾听艺术与语音交互温度教学——从语料清洗到唤醒响应的系统实践

安全风信子

四、系统拓扑(Mermaid) 引子:声音是一条不稳定的河流。我们在语料的沙砾间清洗、在唤醒的涟漪里判断,在ASR与NLU的桥上与人交谈,再用TTS把冷静而温...

16610

103_隐写术进阶:视频隐写技术深度解析——从帧操作到多媒体流数据隐藏的完整指南

安全风信子

视频隐写不仅可以隐藏在视频本身中,还可以结合音频隐写,实现多模态的数据隐藏。这一章我们将探讨音频隐写技术以及如何将视频隐写与音频隐写结合使用。

20110
领券