FLOSS PDF-Editor [siehe auch Linux Magazin 2/14, denke auch an OCR]
theo.schmidt at wilhelmtux.ch
theo.schmidt at wilhelmtux.ch
Mo Jan 27 10:21:47 UTC 2014
Am 25.01.2014 02:06, schrieb Robert Kehl:
...
> Gefordert ist eine Lösung, mit der bestehende PDFs geändert werden
> können wie es mit Adobe Acrobat möglich ist...
Ist ein grosses Thema, auch im aktuellen Linux Magazin 2/14, wo die
PDF-Interoperabilität von Inkscape, LibreOffice Draw/Writer, Scribus mit
Indesign getestet werden, und zudem einige Kommandozeilen Tools, um
wahlweise Text, Bilder oder Schriftsätze zu extrahieren.
Der Test deckt sich mit meinen Erfahrungen:
"Übliches" PDF aus Text mit Bitmap-Bildern geht befriedigend bis gut in
LibreOffice Draw, bringt aber viel Arbeit ausser bei kleinen Änderungen,
da alles zeilenweise.
PDF aus Text mit Vektor-Bildern geht gut mit Inkscape, jedoch nur
seitenweise und nur zum Extrahieren der Vektor-Bilder. (Die Texte sind
auch vektorisiert und fast uneditierbar, dafür beliebig verformbar.)
Im Artikel wird darauf hingewiesen, dass es oft Probleme mit den
Schriftsätzen gibt, die oft nicht vollständig (oder gar nicht)
eingebettet sind.
Ein anderer Ansatz ist ein OCR-Programm zu verwenden. Eine FLOSS-Lösung
habe ich nie probiert, aber eine frühe Version von Abby (oder so)
Finereader unter Wine. Hier ist es auch egal, wenn das PDF selbst nur
ein eingebettetes Bild ist. Das OCR-Programm erzeugt ein DOC mit
demselben Layout. Allerdings ist das Layout fast nicht veränderbar, ohne
es zu zerstören. Vermutlich gibt es heute gute solche Lösungen, auch
FLOSS, da ein grosses Thema beim platzsparenden Speichern von
Dokumenten. Ich habe auf einer FLOSS-Messe mal ein solches
automatisiertes System gesehen.
Es gibt komplizierte Ghostview-Befehle, um die Auflösungen und/oder
Farbräume von Bitmaps in PDFs zu reduzieren und/oder die Kompression zu
erhöhen. Das geht sehr gut. Kann ich angeben.
Viele Grüsse,
Theo
Mehr Informationen über die Mailingliste FSFE-de