
CapsWriter-Offline 语音输入 字幕转录工具
CapsWriter 的离线版,一个好用的 PC 端的语音输入工具、字幕转录工具。
Whisper 是什么?
Whisper 是一种通用语音识别模型。它利用各种大型数据集上的音频进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
在第一次使用 Buzz 的时候,会下载 Whisper 的模型,根据不同的质量要求,模型尺寸也非常可观:
质量尺寸English-only modelMultilingual model必需的显存行对速度tiny39 Mtiny.entiny~1 GB~32xbase74 Mbase.enbase~1 GB~16xsmall244 Msmall.ensmall~2 GB~6xmedium769 Mmedium.enmedium~5 GB~2xlarge1550 MN/Alarge~10 GB1x
特征
模型存放在哪里?
Whisper模型存储在~/.cache/wilsper中。
Whisper.cpp模型存储在~/Library/Caches/Buzz(Mac OS)、~/.cache/Buzz(Unix)或C:\Users\<username>\AppData\Local\Buzz\Buzz\cache(Windows)中。
Hugging 模型存储在~/.cache/huggingface/hub中。
获取地址
https://github.com/chidiwilliams/buzz