Re: FLOSS-Anwendungen für OCR-Scan?
Michael Ebner
ebner at rosinak.at
Do Okt 22 15:13:26 UTC 2020
Am 22.10.20 um 16:38 schrieb Henning Thielemann:
>
> On Thu, 22 Oct 2020, Roland Hummel wrote:
>
>> ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde fragen:
>>
>> "Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
>> eingescannten Dokumenten
>>
>> a) Verzerrungen entfernt
>> b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
>> c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht eingescannte Texte für einen Ausdruck vorbereitet werden können.
>
> ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c).
>
> Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin ich ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden Fehler in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe ich aber noch keine Probleme beobachtet.
Zu b) verwende ich tesseract seit vielen Jahren.
--
Michael Ebner
Mehr Informationen über die Mailingliste FSFE-de