ConvertBox Logo
ConvertBox

PDF OCR — スキャンPDFからテキスト抽出

スキャンや画像化されたPDFから文字を抽出します。OCR処理は完全にブラウザ内で実行されるため、ファイルは外部に送信されません。

🔍

PDFファイルを選択

スキャンPDFをドロップまたはクリックして選択。最大50MB。

最大ファイルサイズ: 50MB

またはドラッグ&ドロップ · Enterキーで選択

使い方

  1. 文書の主要言語を選択します。
  2. 必要に応じて『検索可能なPDF』を有効化し、テキスト選択可能な複製を取得します。
  3. スキャンPDFをアップロードします。処理はすべてブラウザ内で完結します。
  4. 抽出されたテキストをコピーまたはTXT/PDFでダウンロードします。

すべての処理はブラウザで行われ、ファイルがサーバーに送信されることはありません。

よくある質問

いいえ。OCRはWebAssemblyを使ってブラウザ内で実行され、ファイルは端末から出ません。
英語・韓国語・日本語・中国語(簡体字)・スペイン語に対応しています。要望に応じて追加可能です。
スキャン品質に依存します。鮮明で高解像度なスキャンが最良の結果を生みます。傾きや低コントラストの画像はエラーが増える可能性があります。
OCRはCPUを多く使用します。ページごとに順次処理するため、10ページのPDFで30〜60秒程度かかります。