"https://archive.is/fgH8v"에서 관련 정보를 찾을 수 있었다. 



  • Subtitle Edit으로 MKV 파일에서 PGS(SUP) 자막파일 추출하고 SMI/SRT 변환하기 (1)


자막 편집 시 사용하는 Subtitle Edit을 이용해 MKV 파일에서 PGS(SUP) 한글/영문 자막을 추출할 수 있다.


한글도 OCR이 가능하다. 핵심만 요약하면 아래와 같다.



1. https://github.com/SubtitleEdit/subtitleedit/releases/latest/에서 Subtitle Edit 최신 버전을 다운로드한다. 

   아래와 같이 파일명에 따라 종류가 다르니, 필요한 것을 받자.

 종류

 파일명

 포터블 버전

 SE354.zip

 설치 버전

 SubtitleEdit-3.5.4-Setup.zip



2. 포터블 버전은 압축을 풀고, 설치 버전은 설치해 준다. 그 다음에 SubtitleEdit.exe를 실행시킨다.


3. 좌측 상단의 메뉴에서 "File" >> "Import subtitle from Matroska file…"을 눌러서 MKV 파일을 연다.


4. 그러면 자막이 있는 영상의 경우 원하는 언어의 자막 스트림을 선택할 수 있다. 선택해서 열어주자.


5. Parsing 작업이 모두 끝나면, OCR method에서 OCR via Tesseract를 선택하자.


6. 그 다음에 아래의 Language에서 원하는 언어를 선택하자. 필요한 언어가 없으면 "..."을 눌러 필요한 것을 다운로드하자.


7. 필요에 따라 "Italic"이나 "Music Symbol"을 체크하고, 오른쪽의 Dictionary도 인식할 언어로 설정하자. 없거든 다운하면 된다. 


8. 그다음 아래의 "Start OCR"을 누르자. 만약 여기서 아래와 같은 오류가 나면, 다음 포스트를 참조해 문제를 해결하자. 


Tesseract command line ocr engine has stopped working

Tesseract command line ocr engine의 작동이 중지되었습니다


9. OCR 인식 작업이 끝나면 OK를 눌러 작업을 완료하고, "File" >> "Save As…"를 눌러서 원하는 파일 형식으로 저장한다.


+ Recent posts