OCRを使用して画像をPDFに変換する方法

このチュートリアルでは、ラスタライズされたテキスト画像ファイル内に含まれるコンテンツ、例えばJPGまたはPNGこれを編集可能なプレーンテキストに変換し、次のような一般的な文書形式で使用できるようにします。PDFおよび DOCX。

OCRとは何ですか?

OCR（光学式文字認識）は、ラスター画像内に格納されたテキストを、DOCXファイルなどのテキストベースの文書内で編集可能なテキストに変換するプロセスです。OCRは、画像ファイル内に存在するピクセルを分析し、テキスト文字に似たピクセルパターンを探します。OCRの詳細な説明については、この素晴らしい記事をご覧ください。記事それはそれをよく説明しています。

画像ファイルに保存されたテキストの何が問題なのでしょうか?

テキストを含む画像ファイルを変更できるのは画像編集ソフトウェアだけですが、画像形式がレイヤーをサポートしていない場合は複雑になる可能性があります。さらに、画像ファイル内でテキストを検索できないため、キーワード検索でファイルを見つけるのは困難、あるいは不可能になります。OCR は、主にテキストを含む物理ドキュメントのスキャンなどの画像ファイルをドキュメント形式に変換するのに最適な方法です。

ツールを選択

画像を編集可能なドキュメント形式に変換する準備ができたので、ニーズに合った適切なツールを選択する必要があります。当社のツールは、次の 3 つのドキュメントファイルタイプに変換できます (これらのツールへのリンクは、新しいブラウザタブで開きます )。

正しいツールを選択したら、アップロードする画像の種類を選択できます。デフォルトでは、JPG ファイルの場合、これが選択されたソースファイル形式になります。ツールの左側にあるファイルソースファイルタイプセレクターを使用してこれを変更できます。

ファイルを選択

適切なツールと形式を選択したら、「ファイルのアップロード」ボタンをクリックして、変換する画像ファイルを選択します。また、必要に応じて、最大 50 個のファイルをツールにドラッグアンドドロップすることもできます。ツール表示内でサムネイルをドラッグすると、選択したファイルの順序を変更できます。各サムネイルには、アップロード前に画像を正しく配置できるように、左回転ボタンと右回転ボタンもあります。

以下は、4 つの JPG ファイルが選択され、編集可能な PDF ファイルに変換する準備が整ったマージツールの例です。

ツールの右側にはOCRオプションがあります。デフォルトでは、これは有効になっていません。このオプションを無効にしてファイルを送信した場合、作成されるドキュメントには、画像ファイルの埋め込みコピーのみが含まれます。このチュートリアルの目的と、 OCR設定によって提供されるプレーンテキスト抽出を示すために、これは有効にする必要があります。

ファイルを選択し、設定を変更したら、「結合」ボタンをクリックすると、OCR ツールによって画像ファイルがクリーンでプレーンな編集可能なテキストに変換されます。

以下は、マージツールに送信された 2 つのファイルの例です。最終画像には、最初の画像から抽出され、PDF ドキュメントとして保存されたプレーンな編集可能なテキストが含まれています。