画像からテキストに変換できる Linux 用の OCR リーダーは多数あります。次のオプションを見てください:
- GOCR:ウィキペディアのページ
- オクラッド:ウィキペディアのページ
- オクロプス:ウィキペディアのページ
- tesseract-ocr:ウィキペディアのページ
ocropus を除く上記のすべては、同じ名前のパッケージで Ubuntu リポジトリに存在します。
リーダーによってサポートされる画像形式が異なるため、ドキュメントのファイル形式によってオプションが制限される場合があります。または、特定の OCR リーダーを使用する場合は、ImageMagick の変換ツールを使用して形式を変更することもできます。
ここでの私の回答から適応。