首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >音频转文字

音频转文字

作者头像
小小咸鱼YwY
发布于 2023-09-27 00:22:40
发布于 2023-09-27 00:22:40
83000
代码可运行
举报
文章被收录于专栏:python-爬虫python-爬虫
运行总次数:0
代码可运行

项目地址#https://github.com/openai/whisper

安装环境

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg

# on Arch Linux
sudo pacman -S ffmpeg

# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg

# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg

# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install -U openai-whisper
pip install git+https://github.com/openai/whisper.git 
pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust

示例代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import whisper
model = whisper.load_model("large")
prompt = f'提示内容'
result = model.transcribe(audio_save_path, initial_prompt=prompt)
print("result:",result["text"])
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
猫头虎分享:如何在本地使用 openai-whisper 实现音频转文本?
最近很多小伙伴咨询 如何在本地环境使用 OpenAI 的 Whisper 模型把音频文件转换成文本。今天,猫头虎就来给大家手把手教学,流程完整,保姆级教程🛠️!
猫头虎
2024/12/18
2K0
猫头虎分享:如何在本地使用 openai-whisper 实现音频转文本?
用谷歌Colab免费批量将本地电脑上的Mp3语音文件转文字
可以下载电脑版谷歌drive软件:Google Drive for desktop,使用更方便:
AIGC部落
2024/10/21
1.2K0
用谷歌Colab免费批量将本地电脑上的Mp3语音文件转文字
自媒体创作利器:混剪如何快速找到对应画面?(多套方案)
对于从事影视剪辑的同学来说,能快速通过一个画面找到原片中出现的位置,将大大提升视频剪辑的效率
AirPython
2023/12/14
4560
自媒体创作利器:混剪如何快速找到对应画面?(多套方案)
openai whisper 语音识别,语音翻译
Whisper 是openai开源的一个通用的语音识别模型,同时支持把各种语言的音频翻译为成英文(音频->文本)。
崔哥
2024/03/08
3.1K0
[1305]whisper(音转文)使用教程
Whisper提供了多种大小的模型,您可以根据需要下载。例如,要下载large-v2模型,可以使用以下命令:
周小董
2024/11/24
9860
发现一款好用到爆的Shell工具,被惊艳到了!
小二是公司新来的实习生,之前面试的过程中对答如流,所以我非常看好他。第一天,我给他了一台新电脑,要他先在本地搭建个 Java 开发环境。
沉默王二
2022/08/26
2.3K0
发现一款好用到爆的Shell工具,被惊艳到了!
闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)
    前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回文字,所谓闻其声而知雅意。
用户9127725
2023/02/01
3K0
一套框架测试全端,可还行?
众所周知,市面上有很多自动化测试工具,web自动化有selenium,robotframework,playwright等,接口自动化测试工具有httprunner,postman,jmeter等,性能测试有jmeter,loadrunner,locust,nGrinder等,移动端测试有appium,airtest等等。那有没有同时支持多端的工具呢?肯定是有的,airtest支持移动端和web测试,但不支持接口测试(当然可以自行编写脚本实现)。robotframework支持web端、移动端和接口测试,但不支持性能压测。另外,同类的测试工具,各个工具都有自身的特点,比如airtest支持图像识别控件,robotframework可以看成是selenium和appium的高级别封装,降低了代码编写成本,httprunner让接口测试用例通过配置化完成,降低了编写脚本的门槛,也可直接将接口用例转化为性能测试用例,利用locust实现性能测试。那有没有可能将这些工具都整合起来,放在一个框架里实现呢?基于此种构想,airobots诞生了。
归根落叶
2021/03/10
1.1K0
一套框架测试全端,可还行?
又发现一款吊炸天的终端工具,支持 Windows、Linux(WSL)、MacOS,有点牛逼!
Oh My Posh 是一款可深度定制的全平台终端工具,支持 Windows、GNU/Linux(WSL)、macOS 三个系统上的 PowerShell、bash、zsh 等终端。
民工哥
2023/10/27
3.5K0
又发现一款吊炸天的终端工具,支持 Windows、Linux(WSL)、MacOS,有点牛逼!
带小朋友体验语音识别大模型:Whisper
亲爱的小朋友们,大家好!欢迎来到有趣的语音识别大冒险!今天,我们将一起探索神奇的语音识别世界,就像是魔法一样,让机器能听懂我们说的话。
Yunjie Ge
2023/09/01
1.5K0
带小朋友体验语音识别大模型:Whisper
强!20K star!一款可替代 Postman 的API 测试工具,开源免费、完全离线、基于 Git 版本控制!
在软件开发和测试领域,API测试是确保软件接口稳定、可靠的重要一环。随着API的复杂性和数量的不断增加,对API测试工具的需求也日益增长。Postman作为一款广受欢迎的API测试工具,凭借其直观的用户界面和丰富的功能,赢得了大量开发者和测试人员的青睐。然而,随着技术的不断发展,市场上也涌现出了一些新兴的API测试工具,其中Bruno便是一款备受瞩目的新星。
测试开发技术
2024/05/17
4.2K0
强!20K star!一款可替代 Postman 的API 测试工具,开源免费、完全离线、基于 Git 版本控制!
AI超强语音转文本SenseVoice,本地化部署教程!
这里使用autodl 机器学习平台,官网地址:https://www.autodl.com/market/list
贾维斯Echo
2024/09/05
6.5K0
AI超强语音转文本SenseVoice,本地化部署教程!
FFmpeg完全指南:跨平台音视频处理利器
FFmpeg 是一个完整的跨平台音视频解决方案,用于记录、转换和流式处理音视频。它是目前最强大的音视频处理开源软件之一,被广泛应用于视频网站、播放器、编码器等多种场景中。
CoderJia
2024/12/05
8.9K0
FFmpeg完全指南:跨平台音视频处理利器
Theano 中文文档 0.9 - 6. 更新Theano
如果你用yum/apt-get安装NumPy/SciPy,用pip/easy_install更新NumPy/SciPy并不总是一个好主意。这可能使Theano因BLAS的问题而崩溃。发布中包含的NumPy/SciPy版本有时与更新版本的BLAS相关联。使用yum/apt-get/pip/easy_install安装NumPy/SciPy开发包时不会与新版本重新一起编译。要解决可能的崩溃,你可以按如下方式清除Theano缓存:
ApacheCN_飞龙
2022/12/01
5810
AIGC 办公自动化:智能会议记录与摘要助手完整教程
在现代办公环境中,会议记录是一项重要但繁琐的任务。手动记录会议内容不仅费时,还容易遗漏关键信息。借助 人工智能生成内容(AIGC)技术,我们可以自动转录语音、提取关键信息,并生成结构化的会议摘要,极大提高工作效率。
IT蜗壳-Tango
2025/03/27
8060
用于探索和测试API的开源IDE工具-Bruno
在进行软件开发与测试过程中,无论是开发人员还是测试人员,都会或多或少地进行接口调试与接口测试。尤其针对那种测试流程规范性很高的项目,测试人员进行接口测试是不可或缺的一部分。而这其中,大多数都会使用 Postman 作为接口测试的工具,无论从功能上还是使用上,大大提高了测试的工作效率。
wangmcn
2024/06/03
1K0
用于探索和测试API的开源IDE工具-Bruno
一条命令行打包一个网页为html 文件
这个工具不仅保存目标文档,还嵌入了 CSS、图像和 JavaScript 资源,生成一个单一的 HTML5 文档。与传统的“另存为”功能不同,Monolith 能够将所有资源嵌入为数据 URL,从而使浏览器在没有网络连接的情况下也能准确渲染保存的页面。
大侠之运维
2025/01/14
3110
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
Whisper 是由 OpenAI 开发的一种高效的语音识别(ASR)技术,旨在将人类的语音转换成文本。
李福春
2024/03/10
6670
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
AI办公自动化-用kimi将音频批量转换为文本
现在已经有很多非常不错的语音转文本的AI应用了,比如通义听悟、飞书妙记等。不过,对于大批量、多个文件夹的语音转文本,手工操作就比较麻烦了,还是有个程序自动化运行更方面。
AIGC部落
2024/06/24
6680
AI办公自动化-用kimi将音频批量转换为文本
AIGC10: AI转文服务器的搭建过程记录
上图是台风席卷城市,现在企业的服务基本都是混合部署,云计算厂商的机房往往可以提供比较好的保护,一般在地下,扛多少级地震,扛多少级台风,而自建机房,往往写字楼经常停电,网络运营上经常断网。
李福春
2025/07/01
1370
AIGC10:  AI转文服务器的搭建过程记录
推荐阅读
相关推荐
猫头虎分享:如何在本地使用 openai-whisper 实现音频转文本?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档