FLOSS PDF-Editor [siehe auch Linux Magazin 2/14, denke auch an OCR]

Thorsten Behrens thb at documentfoundation.org
Mo Jan 27 21:53:07 UTC 2014


theo.schmidt at wilhelmtux.ch wrote:
> Der Test deckt sich mit meinen Erfahrungen:
> 
> "Übliches" PDF aus Text mit Bitmap-Bildern geht befriedigend bis gut
> in LibreOffice Draw, bringt aber viel Arbeit ausser bei kleinen
> Änderungen, da alles zeilenweise.
>
Yup. Denn leider braucht man die höheren Ebenen einer OCR-Software, um
Layout zu erkennen (Mehrspaltensatz, Bildunterschriften, Tabellen
etc.).

Es ist ja bald wieder Google Summer of Code, ich wäre bereit, ein
entsprechendes Projekt bei LibreOffice als Mentor zu begleiten,
welches tesseract, ocropus oder CuneiForm als
Layout-Detektions-Backend anbindet - jetzt brauchen wir bloß noch
einen fähigen Studenten. ;)

Übrigens, bei der Gelegenheit habe ich unten bei den Verweisen einige
nette GUI-Programme für $subject gefunden:

 http://de.wikipedia.org/wiki/CuneiForm

Viele Grüße,

-- Thorsten
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 966 bytes
Beschreibung: Digital signature
URL         : <http://lists.fsfe.org/pipermail/fsfe-de/attachments/20140127/e88daa55/attachment.sig>


Mehr Informationen über die Mailingliste FSFE-de