FLOSS-Anwendungen für OCR-Scan?

Roland Hummel roland.hummel at student.hu-berlin.de
Do Okt 22 14:28:56 UTC 2020


Hallo,

ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an 
OCR-Software schlecht beantworten konnte, daher wollte ich mal in die 
Runde fragen:

"Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
eingescannten Dokumenten

a) Verzerrungen entfernt
b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht 
eingescannte Texte für einen Ausdruck vorbereitet werden können.

Für b) gibt es zumindest mit https://github.com/tesseract-ocr schon eine
Grundlage, die Zuverlässigkeit ist allerdings noch gering und es gibt
kein GUI."

Hat jemand für die genannten Kriterien vielleicht einen Hinweis?

Gruß und Danke
Roland
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : OpenPGP_0xBE135DCD5A22CEFB.asc
Dateityp    : application/pgp-keys
Dateigröße  : 7621 bytes
Beschreibung: nicht verfügbar
URL         : <http://lists.fsfe.org/pipermail/fsfe-de/attachments/20201022/ae6b05d6/attachment.key>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : OpenPGP_signature
Dateityp    : application/pgp-signature
Dateigröße  : 840 bytes
Beschreibung: OpenPGP digital signature
URL         : <http://lists.fsfe.org/pipermail/fsfe-de/attachments/20201022/ae6b05d6/attachment.sig>


Mehr Informationen über die Mailingliste FSFE-de