음성을 텍스트로 변환

브라우저 음성 인식 기능으로 오디오/비디오를 SRT, VTT, 일반 텍스트로 변환합니다 파일을 서버로 보내지 않고 브라우저 안에서 즉시 처리하는 무료 온라인 도구입니다.

사용 방법

  1. 음성의 언어를 선택합니다.
  2. 오디오 또는 비디오 파일을 선택합니다(최대 100MB).
  3. 파일이 한 번 재생되는 동안 실시간으로 텍스트가 만들어집니다.
  4. SRT, VTT, 일반 텍스트로 다운로드하세요.
  5. 기기의 다운로드 폴더에서 변환된 결과 파일을 확인합니다.
  6. 필요에 따라 설정을 조정하여 다른 파일도 제한 없이 즉시 변환할 수 있습니다.

모든 처리는 브라우저에서 이루어지며, 파일이 서버로 전송되지 않습니다.

자주 묻는 질문

브라우저의 Web Speech API에서 처리됩니다. 일부 구현은 클라우드 인식을 사용할 수 있으나(브라우저별 상이), ConvertBox 자체는 파일을 업로드하지 않습니다.
Web Speech API는 재생 중인 오디오 출력을 듣고 인식합니다. 스피커를 음소거해도 인식은 동작합니다.
단일 화자, 잡음 없는 녹음에서 가장 정확합니다. 잡음·억양·중첩 발화는 정확도를 떨어뜨립니다.
아니요. 모든 작업은 WebAssembly, pdf-lib, HTML5 Canvas 등 브라우저 자체 API를 통해 사용자 기기 로컬에서 100% 처리됩니다. 어떠한 데이터도 외부 서버로 업로드되지 않으므로 안심하고 사용하실 수 있습니다.
기본적으로 사용 횟수나 입력 제한은 없습니다. 다만 브라우저 메모리 내에서 연산이 이루어지므로, 브라우저의 안정성을 위해 파일 크기는 50MB 이하(특히 PDF나 비디오 같은 대용량 파일)로 유지하시는 것을 권장합니다.
아니요. ConvertBox의 모든 도구는 100% 무료입니다. 가입이나 결제 유도 없이 광고나 제한 없는 깨끗한 결과물을 무상으로 다운로드받으실 수 있습니다.
네, 가능합니다. 도구 페이지와 관련 라이브러리가 브라우저에 한 번 로드되고 나면, 실제 변환 작업은 네트워크 연결 없이 완전한 오프라인 상태에서도 원활하게 작동합니다.