본문 바로가기
IT 유용한 TIP

공짜로 동영상 자막 무한대로 만드는 법 Whisper-WebUI

by 이혁진 2023. 8. 16.

일반적인 어플리케이션은 아니고, Whisper-WebUI 라는 오픈 소스임 
게임을 스스로 설치할수 있다 수준이면 할만한 오픈소스라 포스팅 해봅니다.

 

오픈소스 링크 : https://github.com/jhj0517/Whisper-WebUI

 

Whisper-WebUI 설치 방법

 

0. git, python version 3.8 ~ 3.10 and FFmpeg 요 3가지 먼저 설치
다운로드 링크는
    git : https://git-scm.com/downloads
    python : https://www.python.org/downloads/
    FFmpeg : https://ffmpeg.org/download.html
    After installing FFmpeg, make sure to add the FFmpeg/bin folder to your system PATH!

무지성 설치하면 그냥 시스템 경로에 잡히는 듯
난 Error: [Errno 2] No such file or directory: 'ffmpeg' 이런 에러가 떠서 설치 ffmpeg 설치

난 리눅스에서 했는데, 난 aptitude라는 패키지 관리자로 설치 했음
프로그램에 관심이 없는데, 리눅스를 사용하지 않겠지

 

1. 그런 다음 프로그램은 다운 받아 보자

설치 되었으면 하는 폴더에서 https://github.com/jhj0517/Whisper-WebUI/archive/refs/heads/master.zip 을 다운 받아서 압축을 풀거나, cmd에서 git clone https://github.com/jhj0517/Whisper-WebUI.git

 

2. 설치는 간단하다.

내부 안에 Run Install.bat from Windows Explorer as a regular, non-administrator user.

 

3. 실행은

After installation, run the start-webui.bat.
(It will automatically download the model if it is not already installed.)

 

4. 사용은 Open your web browser and go to http://localhost:7860

 

5. 자막 결과물은 아까 "설치 되었으면 하는 폴더" 안에 아웃풋 폴더에 있다


사용법은

무지성 사용가능하다
동영상 파일이나, 유튜브 링크, 사용자 마이크 도 가능하다.

동영상 파일의 경우
파일을 올리고,
모델을 선택하면 나머지는 되었다.

단 모델의 경우 아래와 같은 제약이 있다.

Size
Parameters
English-only model
Multilingual model
Required VRAM
Relative speed
tiny
39 M
tiny.en
tiny
~1 GB
~32x
base
74 M
base.en
base
~1 GB
~16x
small
244 M
small.en
small
~2 GB
~6x
medium
769 M
medium.en
medium
~5 GB
~2x
large
1550 M
N/A
large
~10 GB
1x
3400G (내장그래픽 CPU)로 small 모델에서 해봤는데.......유튜브 자막 수준 전후 수준(?)은 나오는 듯
RTX3060 12G 정도 가지고 계시면 large모델로 하면 꽤 괜찮을 듯
자막 번역도 됨
무지성 사용가능하다위에서 번역된 자막 파일을 업로드 하고
모델 선택하고
언어 세팅 하면 끝
 

단, 그래픽카드 요구량이 좀 늘어 난다.

3400G (내장그래픽 CPU)로 도 ~4G 짜리가 돌아가긴 했다.

Model name
Required VRAM
nllb-200-3.3B
~16GB
nllb-200-1.3B
~8GB
nllb-200-distilled-600M
~4GB

Note: Be mindful of your VRAM! The table above provides an approximate VRAM usage for each model.

뭐 어찌 되었든

공짜로 동영상 자막 무한대로 만들기 바란다.

그 김에 그래픽카드도 좋은거 사시고 ㅎㅎㅎ