FLOSS PDF-Editor [siehe auch Linux Magazin 2/14, denke auch an OCR]

theo.schmidt at wilhelmtux.ch theo.schmidt at wilhelmtux.ch
Mo Jan 27 10:21:47 UTC 2014


Am 25.01.2014 02:06, schrieb Robert Kehl:
...

> Gefordert ist eine Lösung, mit der bestehende PDFs geändert werden
> können wie es mit Adobe Acrobat möglich ist...

Ist ein grosses Thema, auch im aktuellen Linux Magazin 2/14, wo die 
PDF-Interoperabilität von Inkscape, LibreOffice Draw/Writer, Scribus mit 
Indesign getestet werden, und zudem einige Kommandozeilen Tools, um 
wahlweise Text, Bilder oder Schriftsätze zu extrahieren.

Der Test deckt sich mit meinen Erfahrungen:

"Übliches" PDF aus Text mit Bitmap-Bildern geht befriedigend bis gut in 
LibreOffice Draw, bringt aber viel Arbeit ausser bei kleinen Änderungen, 
da alles zeilenweise.

PDF aus Text mit Vektor-Bildern geht gut mit Inkscape, jedoch nur 
seitenweise und nur zum Extrahieren der Vektor-Bilder. (Die Texte sind 
auch vektorisiert und fast uneditierbar, dafür beliebig verformbar.)

Im Artikel wird darauf hingewiesen, dass es oft Probleme mit den 
Schriftsätzen gibt, die oft nicht vollständig (oder gar nicht) 
eingebettet sind.

Ein anderer Ansatz ist ein OCR-Programm zu verwenden. Eine FLOSS-Lösung 
habe ich nie probiert, aber eine frühe Version von Abby (oder so) 
Finereader unter Wine. Hier ist es auch egal, wenn das PDF selbst nur 
ein eingebettetes Bild ist. Das OCR-Programm erzeugt ein DOC mit 
demselben Layout. Allerdings ist das Layout fast nicht veränderbar, ohne 
es zu zerstören. Vermutlich gibt es heute gute solche Lösungen, auch 
FLOSS, da ein grosses Thema beim platzsparenden Speichern von 
Dokumenten. Ich habe auf einer FLOSS-Messe mal ein solches 
automatisiertes System gesehen.

Es gibt komplizierte Ghostview-Befehle, um die Auflösungen und/oder 
Farbräume von Bitmaps in PDFs zu reduzieren und/oder die Kompression zu 
erhöhen. Das geht sehr gut. Kann ich angeben.

Viele Grüsse,
Theo





Mehr Informationen über die Mailingliste FSFE-de