Re: FLOSS-Anwendungen für OCR-Scan?

Dr. Michael Stehmann anwalt at rechtsanwalt-stehmann.de
Fr Okt 23 07:13:15 UTC 2020


Hallo,

sofern die Scans als PDF vorliegen, ist OCRmyPDF [0] ein hübsches Tool.
Es ist in Python(3) geschrieben und damit plattformunabhängig.

Es bettet einen "Textlayer" in das Dokument ein, sodass man anschließend
Copy-and-Paste machen kann.

Man kann sich auch den Text als solchen ausgeben bzw. in eine Datei
schreiben lassen. Auch der Erhalt des Originaldokuments ist möglich.

Auch dieses Tool nutzt tesseract.

Allerdings ist es ein Konsolentool. Ich habe hierzu auch ein GUI
(ebenfalls in Python3) geschrieben, allerdings, da noch nicht ganz
fertig, noch nicht veröffentlicht.

Der bisherige praktische Einsatz gab zu Klagen keinen Anlass.

Mit freundlichem Gruß
Michael (St.)

[0]
https://packages.debian.org/search?suite=all&searchon=names&keywords=ocrmypdf
https://www.heise.de/download/product/ocrmypdf

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 195 bytes
Beschreibung: OpenPGP digital signature
URL         : <http://lists.fsfe.org/pipermail/fsfe-de/attachments/20201023/f369ffc9/attachment.sig>


Mehr Informationen über die Mailingliste FSFE-de