http://daten.berlin.de/

walter harms wharms at bfs.de
Mi Sep 14 16:33:15 UTC 2011



Am 14.09.2011 17:18, schrieb Volker Grabsch:
> Christian Kalkhoff schrieb:
>> ich habe gerade auf heise.de [1] gelesen, dass es in Berlin seit
>> heute ein Datenportal [2] gibt.
> 
> Vielen Dank für den Hinweis! Das war mir noch gar nicht
> aufgefallen.
> 
>> Kann jemand die Macher bitte auf freie Formate wie ODS oder ODT hinweisen?
>>
>> Wie gesagt, die Idee finde ich super, nur in der Umsetzung sollten
>> die Daten auch frei sein.
> 
> Hier sollten wir vorsichtig sein mit dem was wir fordern.
> Einerseits wollen wir offene Formate, klar. Aber andererseits
> wollen wir auch Rohdaten.
> 
> Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein
> Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet
> ist oder gar zur Manipulation einlädt.
> 
> Wenn zum Beispiel die Forderung nach ODS-Dateien dazu führt,
> dass die XLS-Dateien vor der Veröffentlichung einfach nochmal
> durch OpenOffice gejagt werden, dann haben wir nichts gewonnen.
> Das können wir auch selbst. Und wenn beim Export was schief
> geht, haben wir am Ende sogar weniger als vorher.
> 
> Beispiele:
> 
> * Die Daten wurden direkt in Excel eingetippt. Wir erhalten
>   also genau die Excel-Datei, die in der Verwaltung auch intern
>   verwendet wird. In dem Fall hätte ich lieber genau diese
>   XLS(X)-Datei anstelle irgendeinen Exportes.
> 
> * Die Daten kommen aus einer SQL-Datenbank (z.B. PostgreSQL
>   oder Orcale). In dem Fall wäre natürlich ein SQL-Dump oder
>   CSV-Export deutlich sinnvoller. Da könnte man den Leuten in
>   der Tat sagen, dass sie uns nichts Gutes tun, wenn sie das
>   alles extra nochmal durch Excel durchjagen.
> 
> * Die Daten kommen aus einer proprietären Applikation, die
>   einen Excel-Export anbietet. In dem Fall kommen die Leute
>   vielleicht kaum an die Rohdaten heran. Da könnte man höchstens
>   fragen, ob die Applikation auch bessere Export-Formate anbietet.
>   Falls nicht, wäre XLS immer noch die beste Option, da alles
>   andere sowieso aus dieser XLS-Datei generiert werden würde.
> 
> Meiner Ansicht nach sollten wir grundsätzlich erst einmal in
> Erfahrung bringen, wie die Daten intern vorliegen. Erst dann
> können wir eine irgendeine Bewertung des Ausgabe-Formates
> vornehmen.
> 
> Ach ja, und das allerwichtigste ist erst einmal die Lizenz, unter
> der die Daten veröffentlicht sind (CC? gemeinfrei? OpenData? ...).
> Das Dateiformat halte ich für drittrangig. Meine Rangliste wäre
> also ganz klar:
> 
> * möglichst freie Lizenz
> * möglichst nah an den Rohdaten
> * möglichst freie Formate
> 

CSV sollte für die machbar sein. Das kann sogar E. (fast jedenfalls)

re,
 wh





Mehr Informationen über die Mailingliste FSFE-de