http://daten.berlin.de/

Volker Grabsch vog at notjusthosting.com
Mi Sep 14 15:18:26 UTC 2011


Christian Kalkhoff schrieb:
> ich habe gerade auf heise.de [1] gelesen, dass es in Berlin seit
> heute ein Datenportal [2] gibt.

Vielen Dank für den Hinweis! Das war mir noch gar nicht
aufgefallen.

> Kann jemand die Macher bitte auf freie Formate wie ODS oder ODT hinweisen?
> 
> Wie gesagt, die Idee finde ich super, nur in der Umsetzung sollten
> die Daten auch frei sein.

Hier sollten wir vorsichtig sein mit dem was wir fordern.
Einerseits wollen wir offene Formate, klar. Aber andererseits
wollen wir auch Rohdaten.

Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein
Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet
ist oder gar zur Manipulation einlädt.

Wenn zum Beispiel die Forderung nach ODS-Dateien dazu führt,
dass die XLS-Dateien vor der Veröffentlichung einfach nochmal
durch OpenOffice gejagt werden, dann haben wir nichts gewonnen.
Das können wir auch selbst. Und wenn beim Export was schief
geht, haben wir am Ende sogar weniger als vorher.

Beispiele:

* Die Daten wurden direkt in Excel eingetippt. Wir erhalten
  also genau die Excel-Datei, die in der Verwaltung auch intern
  verwendet wird. In dem Fall hätte ich lieber genau diese
  XLS(X)-Datei anstelle irgendeinen Exportes.

* Die Daten kommen aus einer SQL-Datenbank (z.B. PostgreSQL
  oder Orcale). In dem Fall wäre natürlich ein SQL-Dump oder
  CSV-Export deutlich sinnvoller. Da könnte man den Leuten in
  der Tat sagen, dass sie uns nichts Gutes tun, wenn sie das
  alles extra nochmal durch Excel durchjagen.

* Die Daten kommen aus einer proprietären Applikation, die
  einen Excel-Export anbietet. In dem Fall kommen die Leute
  vielleicht kaum an die Rohdaten heran. Da könnte man höchstens
  fragen, ob die Applikation auch bessere Export-Formate anbietet.
  Falls nicht, wäre XLS immer noch die beste Option, da alles
  andere sowieso aus dieser XLS-Datei generiert werden würde.

Meiner Ansicht nach sollten wir grundsätzlich erst einmal in
Erfahrung bringen, wie die Daten intern vorliegen. Erst dann
können wir eine irgendeine Bewertung des Ausgabe-Formates
vornehmen.

Ach ja, und das allerwichtigste ist erst einmal die Lizenz, unter
der die Daten veröffentlicht sind (CC? gemeinfrei? OpenData? ...).
Das Dateiformat halte ich für drittrangig. Meine Rangliste wäre
also ganz klar:

* möglichst freie Lizenz
* möglichst nah an den Rohdaten
* möglichst freie Formate

YMMV. :-)


Gruß
Volker

-- 
Volker Grabsch
---<<(())>>---



Mehr Informationen über die Mailingliste FSFE-de