GPU を必要とせず、高速に OCR 処理できるソフト

NDLOCR-Lite のアイコン

NDLOCR-Lite

ダウンロード

バージョン
1.1.0
更新日
2026/02/25
OS
Windows 11, macOS 15, Linux (Ubuntu)
言語
日本語
【サポート言語】
日本語, 英語
価格
無料
提供元

画像ファイルやキャプチャー画像内のテキストを抽出できる OCR ソフトです。
国立国会図書館関連プロジェクトで開発された技術をベースとしており、信頼性の高い文字認識エンジンを採用。
OCR 処理に GPU を必要としない軽量設計のため、ノートパソコンなどの一般的な家庭用コンピューターでも高速に実行できるのが特徴です。
複数の画像ファイルの一括処理に対応しており、デジタル化されていない雑誌や資料などの画像データをまとめてテキスト化できます。
抽出したテキストは、TXT / JSON / XML / TEI 形式で保存可能です。

NDLOCR-Lite の使い方

ダウンロード と インストール

  1. GitHub へアクセスし、「ダウンロードページへ」ボタンをクリックしてダウンロードします。
  2. ダウンロードした圧縮ファイル(ndlocr_lite_v1.1.0_windows.zip)を展開し、ndlocr_lite_gui.exe から起動します。
    ※ 本ソフトはインストール不要で利用できます。

使い方

基本的な使い方

本ソフトを起動するとメイン画面が表示されます。
NDLOCR-Lite - メイン画面

NDLOCR-Lite - メイン画面



画像ファイルからテキストを抽出する
  1. 次のいずれかを選択して画像ファイルを選択します。
    • 画像ファイルを処理する」ボタン
      画像ファイルを選択する
    • フォルダ内の画像を処理する」ボタン
      画像ファイルが含まれているフォルダーを選択する
  2. 出力先を選択する」ボタンをクリックして OCR で抽出した内容を保存するフォルダーを選択します。
    画像ファイルを選択し、出力先フォルダーを選択

    画像ファイルを選択し、出力先フォルダーを選択

  3. OCR」ボタンをクリックすると画像ファイルを読み込み、画像ファイル内でテキストを認識した箇所に赤枠をつけたサムネイルを画面左下に表示し、認識したテキストを画面右下に表示します。
    ※ 「フォルダ内の画像を処理する」ボタンをクリックして複数の画像ファイルを OCR した場合は、「前の画像」ボタンまたは「次の画像」ボタンをクリックして処理結果を切り替えることができます。
    OCR 完了

    OCR 完了

  4. 画面右下のテキストを範囲選択した後、右クリックメニュー「コピー」をクリックしてクリップボードにコピーすることもできます。
    右クリックメニューからコピーすることも可能

    右クリックメニューからコピーすることも可能

  5. OCR した結果ファイルを「出力先を選択する」で選択したフォルダーに保存します。
    出力されたファイル

    出力されたファイル


処理結果の保存ファイル形式を選択する
OCR の結果を保存するファイル形式を選択したい場合は「出力形式の選択」ボタンをクリックして次の中から選択します。
  • TXT 形式
  • JSON 形式
  • XML 形式
  • TEI 形式
  • 透明テキスト付 PDF (ベータ)
  • PDF に青色で文字を重ねる
出力形式を選択

出力形式を選択


画像ファイル内の一部をテキスト抽出する
  1. 画像ファイル内の任意の箇所のみ OCR したい場合は、「Crop&OCR」ボタンをクリックします。
  2. 画像ファイルが表示されるので、OCR したい範囲をドラッグして選択し、「切り抜き OCR」ボタンをクリックします。
    「Crop & OCR」ボタンをクリックして表示される画面

    「Crop & OCR」ボタンをクリックして表示される画面

  3. 切り抜き OCR 結果」が表示されます。
    抽出されたテキストを選択して右クリックメニュー「コピー」からクリップボードにコピーすることができます。
    範囲選択した場所を OCR

    範囲選択した場所を OCR


画面キャプチャーからテキストを抽出する
現在の画面内のテキストを OCR できます。
  1. メイン画面上部の「キャプチャモード」ボタンをクリックします。
  2. キャプチャモードになるので画面内の OCR したい場所をドラッグして選択します。
    画面キャプチャー

    画面キャプチャー

  3. キャプチャ結果」画面が表示され、キャプチャーした内容が表示されるので「OCR 実行」ボタンをクリックします。
    ※ キャプチャーをやり直す場合は「再キャプチャ」ボタンをクリックします。「範囲固定」にチェックを入れてから「再キャプチャ」ボタンをクリックすると、前回選択した範囲を自動で再キャプチャーします。
    キャプチャー結果

    キャプチャー結果

  4. OCR 結果」画面が表示されます。
    抽出されたテキストを選択して右クリックメニュー「コピー」からクリップボードにコピーすることができます。
    読み取り結果のテキストを範囲選択してコピー

    読み取り結果のテキストを範囲選択してコピー


更新履歴

機械翻訳で日本語にしています。
Version 1.1.0
(2026/02/25)
  • #1
    #3
    #5
    に修正対応しました。
  • What's Changed
    • lxmlのバージョンアップ by @ndl-lab-staff in #6
    • Intel Macで起動しない不具合を修正 by @ndl-lab-staff in #8
    • Windowsにおいてまれにmain.pyが見つからなくなる不具合を修正 by @ndl-lab-staff in #11

Version 1.0.3-preview
(2026/02/25)
  • これはプレビュー版です
  • #1 への対応検討

Version 1.0.2-preview
(2026/02/25)
  • これはプレビュー版です
  • #4 および#5 の対応検討

ユーザーレビュー

  • まだレビューが投稿されていません。
    このソフトの最初のレビューを書いてみませんか?