Re: FLOSS-Anwendungen für OCR-Scan?

Henning Thielemann lemming at henning-thielemann.de
Do Okt 22 14:38:41 UTC 2020


On Thu, 22 Oct 2020, Roland Hummel wrote:

> ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an 
> OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde 
> fragen:
>
> "Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
> eingescannten Dokumenten
>
> a) Verzerrungen entfernt
> b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
> c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht 
> eingescannte Texte für einen Ausdruck vorbereitet werden können.

ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c).

Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente 
anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin 
ich ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden 
Fehler in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe 
ich aber noch keine Probleme beobachtet.


Mehr Informationen über die Mailingliste FSFE-de