画像ファイルやキャプチャー画像内のテキストを抽出できる OCR ソフトです。
国立国会図書館関連プロジェクトで開発された技術をベースとしており、信頼性の高い文字認識エンジンを採用。
OCR 処理に GPU を必要としない軽量設計のため、ノートパソコンなどの一般的な家庭用コンピューターでも高速に実行できるのが特徴です。
複数の画像ファイルの一括処理に対応しており、デジタル化されていない雑誌や資料などの画像データをまとめてテキスト化できます。
抽出したテキストは、TXT / JSON / XML / TEI 形式で保存可能です。

