http://daten.berlin.de/
Volker Grabsch
vog at notjusthosting.com
Mi Sep 14 15:18:26 UTC 2011
Christian Kalkhoff schrieb:
> ich habe gerade auf heise.de [1] gelesen, dass es in Berlin seit
> heute ein Datenportal [2] gibt.
Vielen Dank für den Hinweis! Das war mir noch gar nicht
aufgefallen.
> Kann jemand die Macher bitte auf freie Formate wie ODS oder ODT hinweisen?
>
> Wie gesagt, die Idee finde ich super, nur in der Umsetzung sollten
> die Daten auch frei sein.
Hier sollten wir vorsichtig sein mit dem was wir fordern.
Einerseits wollen wir offene Formate, klar. Aber andererseits
wollen wir auch Rohdaten.
Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein
Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet
ist oder gar zur Manipulation einlädt.
Wenn zum Beispiel die Forderung nach ODS-Dateien dazu führt,
dass die XLS-Dateien vor der Veröffentlichung einfach nochmal
durch OpenOffice gejagt werden, dann haben wir nichts gewonnen.
Das können wir auch selbst. Und wenn beim Export was schief
geht, haben wir am Ende sogar weniger als vorher.
Beispiele:
* Die Daten wurden direkt in Excel eingetippt. Wir erhalten
also genau die Excel-Datei, die in der Verwaltung auch intern
verwendet wird. In dem Fall hätte ich lieber genau diese
XLS(X)-Datei anstelle irgendeinen Exportes.
* Die Daten kommen aus einer SQL-Datenbank (z.B. PostgreSQL
oder Orcale). In dem Fall wäre natürlich ein SQL-Dump oder
CSV-Export deutlich sinnvoller. Da könnte man den Leuten in
der Tat sagen, dass sie uns nichts Gutes tun, wenn sie das
alles extra nochmal durch Excel durchjagen.
* Die Daten kommen aus einer proprietären Applikation, die
einen Excel-Export anbietet. In dem Fall kommen die Leute
vielleicht kaum an die Rohdaten heran. Da könnte man höchstens
fragen, ob die Applikation auch bessere Export-Formate anbietet.
Falls nicht, wäre XLS immer noch die beste Option, da alles
andere sowieso aus dieser XLS-Datei generiert werden würde.
Meiner Ansicht nach sollten wir grundsätzlich erst einmal in
Erfahrung bringen, wie die Daten intern vorliegen. Erst dann
können wir eine irgendeine Bewertung des Ausgabe-Formates
vornehmen.
Ach ja, und das allerwichtigste ist erst einmal die Lizenz, unter
der die Daten veröffentlicht sind (CC? gemeinfrei? OpenData? ...).
Das Dateiformat halte ich für drittrangig. Meine Rangliste wäre
also ganz klar:
* möglichst freie Lizenz
* möglichst nah an den Rohdaten
* möglichst freie Formate
YMMV. :-)
Gruß
Volker
--
Volker Grabsch
---<<(())>>---
Mehr Informationen über die Mailingliste FSFE-de