画像から英語、日本語などの文字を認識して抽出できる OCR ソフト

gttext のアイコン

gttext

ダウンロード支援

バージョン
2.0.2
更新日
2016/05/05
対応 OS
Windows XP/Vista/7/8/8.1/10
言語
英語
価格
無料
提供元

画像ファイルの範囲を指定すると、文字を認識して抽出します。
抽出した文字列はクリップボードに保存されるので、そのまま貼り付けて利用できます。
本ソフトはフォントの周りがざらざらしていない、フォントの背景が白い、場合に真価を発揮します。
それ以外の場合はそれほど高い精度は見込めません。
過剰な期待をせずに利用するのが良さそうです。

gttext の使い方

ダウンロード と インストール

  1. こちらへアクセスし、「32bit 版」リンク、または「64bit 版」リンクからダウンロードします。
    ※ お使いの OS が 32bit か 64bit かわからない場合は Windows バージョンの調べ方よりご確認ください。
  2. ダウンロードしたセットアップファイル(GTText_Setup_2.0.2_32.exe または GTText_Setup_2.0.2_64.exe)からインストールします。

使い方

日本語を認識できるように設定する

  1. 本ソフトを輝度するとメイン画面が表示されます。
    「Add languages」タブをクリックします。
    GT Text - メイン画面

    GT Text - メイン画面

  2. 「Choose Components(コンポーネントの追加)」画面が表示されます。
    「Language data」横の「+」ボタンをクリックして展開し、画面をスクロールして「Download and install Japanese language data」にチェックを入れ、「Install」ボタンをクリックします。
    Choose Components - 日本語コンポーネントの追加

    Choose Components - 日本語コンポーネントの追加

  3. インストールが終わったら「Close」ボタンをクリックして「Choose Components」画面を閉じます。
    メイン画面に戻り、「eng」をクリックして「jpn」を選択すると、日本語を解析できるようになります。
    「jpn」を選択して日本語解析モードに変更

    「jpn」を選択して日本語解析モードに変更


画像から文字を認識する

  1. メニューバーから「File」⇒「Open」とクリックして解析したい画像(BMP/JPEG/GIF/TIFF/PNG)を選択します。
    または、クリップボードにコピーした画像を貼り付けます。
  2. 画像が表示されたらスクロールバーを利用したり、Click here to select the mouse zoom アイコンをクリックして表示倍率を調整します。
  3. 解析したい場所をドラッグして選択すると、その場所を解析します。
    ※ 画像全体を解析したい場合は、OCR of all image をクリックします。
  4. 解析が終わると、解析したテキストがポップアップ表示されます。
    うまく認識できていない場合は「再実行」ボタンをクリックすると、再度解析を行います。
    ※ 画像の状態やフォントによって、解析精度が落ち、うまく認識できない場合があります。

    「続行」ボタンをクリックすると、解析した文字列をクリップボードにコピーします。
    日本語を解析

    日本語を解析


更新履歴

機械翻訳で日本語にしています。
Version 2.0.2
(2016/05/05)
  • バグ修正。
  • サポートとヘルプの改善。
  • シングル、マルチユーザーインストールオプション

Version 2.0.1
  • Tesseract OCR エンジン 3.04(より正確で高速)をベースとした新バージョン。
  • より多くの言語(Google Tesseract オープンソースの秀作から)。
  • より直感的になりました。
  • 画面から直接 OCR。
  • ドラッグアンドドロップのサポート。
  • マルチスクリーンスナップショットと OCR のサポート。
  • 画像の機能性を保存します。
  • 少ないリソースでシステムトレイ上でそれを実行し、任意の瞬間にテキストを猛烈な速さでコピーします。
  • 数回クリックするだけで、いつでも OCR 言語を変更します。
  • より簡単なツールチップのヒントと使用法。
  • ビデオチュートリアルやアップデートとオンラインヘルプ。
  • 32ビットと64ビットで利用可能なバージョン。
  • そして、あなたを待っている他の多くの改善。

Version 1.4.5
  • Tesseract 3.02
  • より優れた認識性能。
  • アラビア語、ヘブライ語など、より多くの言語を認識できるようになりました…
  • あなたが見ているもののスナップショットを取り、すぐにテキストをコピーし、コマンド プロンプト、OCR pdf ファイル、またはエンジン Tesseract OCR ソフトウェアを使用して OCR からテキストをコピーします。

ユーザーレビュー

  • 1

    英語を読み取ってみましたが、残念ながら全然正確に読み取れませんでし…

    枝豆
    枝豆
    19
    Windows 11

    英語を読み取ってみましたが、残念ながら全然正確に読み取れませんでした。
    アンインストーラーもついていないので、BCUninstallerなどをつかって強制削除しなければなりません。

    3人が参考になったと回答しています。
    このレビューは参考になりましたか?
  • 4

    使えそうです

    masuemon
    masuemon
    1
    Windows 10

    使えそうです。
    5列54行のExcelシートの印刷A4の用紙をグレースケールで読み込みました。
    表示を縮小して全体を選択した場合はできません。
    1列だけ選択するとできます。
    数字の1は漢数字の一になります。数字の0は大きい〇(たぶん漢数字のぜろ)になります。
    数値は言語を英語にすると大丈夫みたいです。”一”と”〇”は文字変換して使うつもりです。

    3人が参考になったと回答しています。
    このレビューは参考になりましたか?
  • コメント

    アンインストーラも整備出来ていません

    人柱2
    人柱2
    2
    Windows 7

    アンインストーラも整備出来ていません。
    インストールしてはダメです。

    8人が参考になったと回答しています。
    このレビューは参考になりましたか?