前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >音乐去除人声神器:精准分离,专业之选 | 开源日报 No.282

音乐去除人声神器:精准分离,专业之选 | 开源日报 No.282

作者头像
小柒
发布2024-06-25 08:43:38
1400
发布2024-06-25 08:43:38
举报
文章被收录于专栏:开源服务指南开源服务指南

Anjok07/ultimatevocalremoverguihttps://github.com/Anjok07/ultimatevocalremovergui

Stars: 15.8k License: MIT

ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面。 该项目提供了以下主要功能、关键特性和核心优势:

  • 使用最先进的源分离模型来从音频文件中去除人声
  • UVR 的核心开发者训练了所有在此软件包中提供的模型(除了 Demucs v3 和 v4 4-stem 模型)
  • 可以在 Windows 和 MacOS 系统上安装和运行
  • 不需要预先安装任何依赖项,软件包含 UVR 接口、Python、PyTorch 等必要组件

NVIDIA/TensorRThttps://github.com/NVIDIA/TensorRT

Stars: 9.7k License: Apache-2.0

TensorRT 是 NVIDIA GPU 上进行高性能深度学习推断的 SDK。

  • 包含 TensorRT 插件和 ONNX 解析器的开源软件组件
  • 提供示例应用程序,演示了 TensorRT 平台的使用和功能
  • 支持预构建的 TensorRT Python 包,方便安装
  • 提供了构建所需的先决条件,并提供容器化构建选项

pymc-devs/pymchttps://github.com/pymc-devs/pymc

Stars: 8.3k License: NOASSERTION

pymc 是一个用于在 Python 中进行贝叶斯建模和概率编程的工具。 该项目主要功能、关键特性、核心优势包括:

  • 直观的模型规范语法,易于使用
  • 强大的采样算法,支持复杂模型拟合
  • 变分推断:快速近似后验估计以及针对大数据集的小批量变分推断
  • 依赖 PyTensor 提供计算优化和动态 C 或 JAX 编译等功能
  • 透明地支持缺失值插补等操作

NVIDIA/warphttps://github.com/NVIDIA/warp

Stars: 2.7k License: NOASSERTION

warp 是一个用于高性能 GPU 模拟和图形处理的 Python 框架。 该项目主要功能、关键特性、核心优势包括:

  • 将常规的 Python 函数 JIT 编译成可在 CPU 或 GPU 上运行的高效内核代码
  • 适用于空间计算,提供丰富的原语,方便编写物理模拟、感知、机器人技术和几何处理程序
  • 内置微分功能,可与 PyTorch 和 JAX 等框架一起用作机器学习流水线中的一部分
  • 支持 CUDA-capable NVIDIA GPU,并提供了安装指南和示例代码以及 USD 文件生成等功能。

argmaxinc/WhisperKithttps://github.com/argmaxinc/WhisperKit

Stars: 2.6k License: MIT

WhisperKit 是一个用于 iOS 和 macOS 应用程序的 Swift 本地语音识别工具。

  • 使用 OpenAI 的 Whisper 语音识别模型
  • 集成了苹果的 CoreML 框架,可在 Apple 设备上进行高效、本地推理
  • 可以通过 Swift Package Manager 轻松集成到 Swift 项目中
  • 支持快速示例和模型选择功能
  • 提供了生成自定义模型和使用 Swift CLI 进行测试与调试的能力
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Anjok07/ultimatevocalremoverguihttps://github.com/Anjok07/ultimatevocalremovergui
  • NVIDIA/TensorRThttps://github.com/NVIDIA/TensorRT
  • pymc-devs/pymchttps://github.com/pymc-devs/pymc
  • NVIDIA/warphttps://github.com/NVIDIA/warp
  • argmaxinc/WhisperKithttps://github.com/argmaxinc/WhisperKit
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档