Release preview: use gpu
Pre-release
Pre-release
更新内容
- 语音识别:标点恢复更换模型,速度大幅提升(采用 ASR-API v1.1.0)
- 离线翻译支持使用gpu(需要cuda环境)(采用 NLP-GPU-API v1.0.0)
- 支持长句分解、字幕相关自定义设置
之前的版本,对于演讲之类语速慢的视频来说,就还行。但是对于一些语速较快的视频,就不行了。
另外,综合下来,cpu占用,本机测试大概40~50%左右,不会再疯狂旋转。
演示
以下演示此次更新后,看语速较快视频的情况:(以下视频默认是静音的,需要自己点一下打开声音)
output.mp4
以及另外一例:
https://www.bilibili.com/video/BV1ks411J7Vn/?p=2&spm_id_from=pageDriver
output-2.mp4
安装
- 下载文末附件 echo-use-gpu.zip 并解压缩
- 语音识别:下载并解压缩:https://github.com/rerender2021/ASR-API/releases/download/1.1.0/asr-server-v1.1.0.zip
- 离线翻译:
- 下载链接中的2个压缩分卷并解压缩(文件太大,只能分卷压缩上传):https://github.com/rerender2021/NLP-GPU-API/releases/tag/1.0.0
- 安装cuda环境:注意版本:11.7:https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Windows&target_arch=x86_64
- 验证cuda安装成功:命令行输入nvcc -V,看输出:
Copyright (c) 2005-2022 NVIDIA Corporation Built on Tue_May__3_19:00:59_Pacific_Daylight_Time_2022 Cuda compilation tools, release 11.7, V11.7.64 Build cuda_11.7.r11.7/compiler.31294372_0
运行
下载的东西解压缩后,预期目录结构:
- nlp-gpu-server
- ...其它文件
- NLP-GPU-API.exe
- asr-server-v1.1.0
- ...其它文件
- ASR-API.exe
- echo-use-gpu.exe- 双击echo-use-gpu.exe运行
- 注意窗口标题是不是 Echo(GPU),以此判断是否成功使用GPU