光学式文字認識(OCR) テクノロジーを使用すると、グラフィック イメージまたはスキャンしたドキュメント内のテキストを編集できます。書籍や文書を電子ファイルに変換したり、オフィスの記録管理システムをコンピュータ化したり、Web サイトでテキストを公開したりするために広く使用されています。
OCR を使用すると、テキストの編集、単語や語句の検索、機械翻訳、音声合成、テキスト マイニングなどの技術の適用が可能になります。
Microsoft Office には Microsoft Document Imaging OCR が含まれています。ただし、スキャナーやオールインワン デバイスに付属のアプリケーション ソフトウェアなど、その役割を果たすフリーウェアの代替手段が他にもいくつか存在します。
基本的に、OCR を使用して画像をスキャンしてテキストに変換するには、次の標準手順に従う必要があります。
- 原稿をスキャナーベッドの上に置きます。
- パソコンではスキャナーのアプリケーションソフトとOCRをタイプとして使用します。
- OCRスキャンしたい範囲を選択し、プレビューを確認します。
- テキスト ファイルをスキャンして保存すると、任意のワードプロセッサ アプリケーションで同じ内容を編集できます。
無料のオンライン OCR サイトとサービス
ご利用いただけるうちにGoogle ドライブで画像をテキストに変換 (OCR)、Web 上の他のいくつかの無料オンライン OCR サービスを使用すると、ブラウザ内で画像またはスキャンしたドキュメントに対して OCR を実行できます。
- NewOCR.comは無料のオンライン OCR サービスです。 NewOCR.com は、アップロードされた画像ファイル内のテキストを分析し、画像のテキストをテキストに変換します。このサービスでは、無制限のアップロードとレイアウト分析 (複数列のテキスト認識) が可能です。フレンドリーなサービスは登録不要で、29 か国語をサポートしていますが、サイトは非常に基本的で素人っぽいものです。このサービスは、最大 5 MB の JPEG、PNG、GIF、BMP、および複数ページの TIFF と、最大 20 MB の複数ページの PDF ドキュメントを受け入れます。
- Free-OCR.comも無料のオンライン OCR ツールです。アップロードできる画像ファイル (JPG、GIF、TIFF BMP、または PDF) は 2MB 以下、幅が 5000 ピクセル以下であり、1 時間あたり 10 件の画像アップロードという制限があります。 Free-OCR は複数列のテキストを含む画像を処理でき、29 の言語もサポートします。奇妙な制限の 1 つは、OCR の実行中に PDF ドキュメントの最初のページのみが必要になることです。
- オンラインOCR.netこのサービスを使用すると、PDF でスキャンしたドキュメント (複数ページのファイルを含む)、写真、デジタル カメラでキャプチャした画像からテキストや文字を認識できます。ユーザーは 32 の言語を選択して多言語ドキュメントを認識でき、PDF、DOC、XLS、RTF、HTML、TXT などのいくつかの形式に直接変換できます。 ORed ファイルをオンラインの安全なワークスペースに保存するか、PC にダウンロードするかを選択できます。
他のサイトには次のようなものがあります。
- Totext.net
- ConvertImagetoText.net
- OCRconvert.com
- オクロンライン.com
- PDFをWordに変換.net
- I2ocr.com
- FineReaderOnline.com。
スキャナーのデフォルト プログラムの代わりに、OCR を実行するアプリケーションをインストールすることも選択できます。
無料OCRほとんどのものからスキャンできますトゥインおよび WIA スキャナーに対応しており、スキャンした PDF や複数ページの TIFF 画像を開くこともできます。 FreeOCR には、Tesseract GUI としても知られる Windows でコンパイルされた Tesseract 無料 OCR エンジンが含まれています。 FreeOCR は商用利用を含むフリーウェアです。 FreeOCR には .NET Framework v2.0 が必要です。からダウンロードできます。ペーパーファイル.net。
ヒント: 他にもありますWindows用の無料OCRソフトウェア利用可能。
このリストがすべてを網羅しているわけではないと思います。他にもそのようなサービスやアプリケーションをご存知の場合は、この投稿にコメントとして追加してみてはいかがでしょうか?