剪映是一款非常好用的视频编辑软件,但是字幕导出的功能却是收费的。前期字幕是明文存在电脑上的,可以借助我写的剪映字幕导出 - 字幕工具箱 进行导出。现在剪映升级了,6.0.1版本开始,项目的工程文件是加密的,无法直接导出。如果你不想为字幕识别功能付费,可以试试这些免费的字幕识别生成器。
剪映 5.9
当然,你也可以选择继续使用旧版本剪映,5.9版本的剪映是没有加密的,使用我写的剪映字幕导出 - 字幕工具箱 进行导出。
windows
链接:https://pan.baidu.com/s/16ZRgsu30lkXOMtdxtYcH9A
提取码:0qoz
windows版本里的5.9版本,解压缩就可以直接使用,不需要安装。
macOS
链接: https://pan.baidu.com/s/1eSJTg44HA6QTkqyVJkQ0sA?pwd=3s7w 提取码: 3s7w
必剪
必剪是哔哩哔哩推出的一款视频剪辑软件,支持字幕识别生成。你可以在必剪中导入视频,然后选择字幕识别生成,生成的字幕可以直接导出。
必剪跟剪映一样,都是大的视频平台推出的视频编辑软件,在功能上也有很多相似之处。如果你的视频主要发布在哔哩哔哩,那必剪比剪映更适合你。
同样,必剪生成的字幕也是明文存在电脑上的,可以借助我写的小工具B站必剪字幕导出 - 字幕工具箱导出字幕。
剪映国际版
剪映国际版是剪映的国际版,功能跟国内版基本一致。剪映国际版支持字幕识别生成,并且明文存储在电脑上。所以,可以借助我写的剪映字幕导出 - 字幕工具箱 进行导出。
照理说,剪映国际版是剪映最好的替代品,但是它有一个缺点,就是需国际网络
环境才能使用。如果你在国内,可以剪辑视频,但是无法识别生成字幕。
whisper
GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
Whisper是OpenAI推出的一种开源语音识别模型,能够自动识别多种语言,将音频转换文字。Whisper由python实现,同时拥有丰富的社区支持。除了原始的Whisper之外,还有一些相关的项目,有移植到 C/C++的whisper.cpp
和能使用 GPU加速
的 faster-whisper
。如果你不懂编程或者不熟悉命令行,也有也有很多开发者开发了图形界面,比如 buzz
、Const-me/Whisper
和FasterWhisperGUI
等。
buzz
Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具,支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。Buzz 也相当于是一个 Whisper 的可视化界面版本。
在第一次使用 Buzz 的时候,会下载 Whisper 的模型,质量越高模型越大,下载的时间也越长。
质量 | 尺寸 | English-only model | Multilingual model | 必需的显存 | 行对速度 |
---|---|---|---|---|---|
tiny | 39 M | tiny.en |
tiny |
~1 GB | ~32x |
base | 74 M | base.en |
base |
~1 GB | ~16x |
small | 244 M | small.en |
small |
~2 GB | ~6x |
medium | 769 M | medium.en |
medium |
~5 GB | ~2x |
large | 1550 M | N/A | large |
~10 GB | 1x |
Whisper 模型存储在电脑中:
~/.cache/whisper~/Library/Caches/Buzz
(macOS)~/.cache/Buzz
(Linux)C:\Users/<username>\AppData\Local\Buzz\Buzz\Cache
(Windows)
当卸载的时候,别忘记把模型也删掉。
whisper-desktop
模型下载
基于whisper的语音转写文本的软件,往往只提供调用界面,而训练模需要自行下载。
pyVideoTrans
pyVideoTrans
是一款视频翻译配音工具,可将一种语言的视频翻译为另一种语言配音和字幕的视频。免费开源、简单好用,功能强大。
pyVideoTrans
功能强大,它可以把一部外语片直接制作成国语片,可以说,它就是个线上的译制片工厂。而字幕生成仅仅是它一项非常基础的小功能。