最近几个月,一直在寻找能在本机运行、占用资源小、支持实时语音转录的开源工具,不过实测效果让人沮丧。
FastWhisper
https://github.com/FamousDirector/FastWhisper
-实测中文转换效果很差
WhisperLive
https://github.com/collabora/WhisperLive
-实测中文转换效果差
Faster-Whisper-Transcriber
https://github.com/BBC-Esq/Faster-Whisper-Transcriber
-没有测试,不过按照经验,基于Whisper的中文转文本效果都不好。
faster-whisper-webui
https://github.com/ycyy/faster-whisper-webui
-没有测试,不过按照经验,基于Whisper的中文转文本效果都不好。
whisper_streaming
https://github.com/ufal/whisper_streaming
-可能下载的模型不够大,中文语音转录一样是效果差
whisper.cpp
https://github.com/ggml-org/whisper.cpp
-比其他whisper效果稍好一点,但是一样不堪用
whisper-realtime-echo
https://gitlab.com/alouiadel/whisper-realtime-echo
-中文转录效果很差
buzz
https://github.com/chidiwilliams/buzz
-实测中文转换效果差
FunASR
SenseVoice
https://github.com/modelscope/FunASR/blob/main/README_zh.md
https://github.com/FunAudioLLM/SenseVoice/blob/main/README_zh.md
-阿里开源,中文效果好,本地版本没有实测,主要在用阿里云版本。
speakr
https://github.com/murtaza-nasir/speakr
-界面美观,是我心仪的版本,只是刚开发,提交频繁,下载到本地还没有运行起来。
Vosk-Speech-To-Text
https://github.com/Slav4ik555/Vosk-Speech-To-Text
-在本地成功运行起来,实测中文转录效果比上面whisper效果都好。
Azure
-microsoft 在线语音转录SDK,实测能用,只是延时有点大。