
通义听悟
通义听悟是阿里云通义家族新成员,是一款聚焦于音视频内容的工作学习AI助手。内置了通义千问大模型的理解与摘要能力,结合阿里云在音频AI领域深厚的积累,可帮助用户高效地完成对...
可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)
特征
使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型
加载完成后,就可以进行语音转文字了
夸克网盘: https://pan.quark.cn/s/6a7dc6288637
123云盘: https://www.123pan.com/s/RiyA-qSS03.html
百度网盘: https://pan.baidu.com/s/1MXHevSF_RuUOOGk6AToX6w?pwd=hjhj 提取码: hjhj
Github链接 Buzz: https://github.com/chidiwilliams/buzz
ggml-medium 语音模型(官方):
ggerganov/whisper.cpp at main
作者推荐ggml-medium.bin(大小为 1.42GB)
链接:https://pan.baidu.com/s/1vszwzTdPOfmd041ywbAFHQ?pwd=xnbc
提取码: xnbc