Re: FLOSS-Anwendungen für OCR-Scan?

Do Okt 22 15:13:26 UTC 2020

Am 22.10.20 um 16:38 schrieb Henning Thielemann:
> 
> On Thu, 22 Oct 2020, Roland Hummel wrote:
> 
>> ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde fragen:
>>
>> "Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
>> eingescannten Dokumenten
>>
>> a) Verzerrungen entfernt
>> b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
>> c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht eingescannte Texte für einen Ausdruck vorbereitet werden können.
> 
> ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c).
> 
> Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin ich ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden Fehler in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe ich aber noch keine Probleme beobachtet.

Zu b) verwende ich tesseract seit vielen Jahren.

-- 
Michael Ebner