ConvertBox Logo
ConvertBox

音声をテキストに変換

ブラウザの音声認識でオーディオ/動画をSRT・VTT・テキストに変換します。リアルタイム、プライベート、無料。

使い方

  1. 音声の言語を選択。
  2. オーディオまたは動画ファイルを選択(最大100MB)。
  3. 再生中にリアルタイム認識します。
  4. SRT/VTT/テキストでダウンロード。

すべての処理はブラウザで行われ、ファイルがサーバーに送信されることはありません。

よくある質問

ブラウザのWeb Speech APIで処理。一部の実装はクラウド認識を使用する可能性がありますが、ConvertBox自体はファイルをアップロードしません。
Web Speech APIは再生中の出力音声を聞き取って認識します。スピーカーをミュートしても動作します。
単一話者・ノイズの少ない録音が最も精度が高い。雑音・訛り・重複発話で低下します。