Skip to content

Latest commit

 

History

History
11 lines (9 loc) · 352 Bytes

File metadata and controls

11 lines (9 loc) · 352 Bytes

video preprocessing before whisper

人声伴奏分离处理

执行

python video_process.py --input_file <input_file> --opt_vocal_root <opt_vocal_root> --opt_ins_root <opt_ins_root>

input_file: 输入媒体文件 opt_vocal_root: 输出音频说话人文件夹路径 opt_ins_root: 输出音频伴奏文件夹路径