guide

Wie kann ich (als Behörde, Verwaltung, Organisation, ...) eigentlich Daten öffnen?

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 

Dieser Abschnitt ist der Kern des Handbuchs. Hier werden konkrete, detaillierte Hinweise gegeben wie datenhaltende Stellen ihren Datenbestand öffnen können.

Folgende Punkte wollen wir Ihnen besonders ans Herz legen:

  • Halten sie es einfach. Fangen sie klein, einfach und schnell an. Niemand verlangt Vollständigkeit am ersten Tag. Es ist völlig in Ordnung, wenn sie mit einem Datensatz oder nur einem einzigen Teil einer großen Datensammlung anfangen. Längerfristig sollte es natürlich das Ziel sein, mehr und vollständigere Daten zu veröffentlichen.

Denken sie daran, dass es hier um Innovation geht. Schnelles Handeln ist gut, denn es ermöglicht das Entstehen einer Eigendynamik und erleichtert das Lernen aus Erfahrung. Innovation bedeutet auch, dass nicht nur Erfolge zu erwarten sein werden. Nicht jedes Datenangebot, dass sie der Öffentlichkeit anbieten können, wird auf große Nachfrage stoßen oder gleichermaßen großen Nutzen bringen.

  • Schalten sie sich ein. Treten sie in Kontakt mit den tatsächlichen und potenziellen Nutzern ihrer Daten, so oft und so früh wie möglich. Egal, ob es Bürger, Unternehmen oder Entwickler sind.

Behalten sie im Hinterkopf, dass ihre Daten häufig auf indirektem Weg an die Endnutzer gelangen, über Vermittler, die diese zur Darstellung oder Auswertung aufbereiten. Beispielsweise lesen wir als Endkonsumenten von Daten typischerweise ungerne Längen- und Breitengrade, sondern wünschen uns Kartendarstellungen. Behalten sie daher die Vermittler als wichtigste Nutzergruppe ihrer Daten besonders im Blick.

  • Sprechen sie typische Ängste und Missverständnisse direkt an - das ist besonders wichtig, wenn sie Teil einer großen Institution oder einer Regierung sind. Mit der Offenlegung von Daten werden sie zahlreiche Fragen (und Ängste) aufwerfen. Es ist wichtig, (a) die wichtigsten zu identifizieren und (b) sie so früh wie möglich offen zu adressieren.

Die Offenlegung von Daten umfasst hauptsächlich 4 Schritte, die weiter unten im Einzelnen beschrieben werden. Die Reihenfolge spielt eine untergeordnete Rolle, einige der Schritte können gleichzeitig erfolgen.

  1. Wählen sie die Daten aus. Entscheiden sie, welche Daten sie veröffentlichen wollen. Bedenken sie, dass es möglich (und in Einzelfällen auch nötig) sein wird, dass sie diesen Schritt mehrmals durchlaufen.
  2. Vergeben sie eine offene Lizenz.
    1. Stellen sie fest, wer das Urheberrecht an den Daten besitzt, um die es geht.
  1. Stellen sie die Daten unter eine geeignete Lizenz, die den Nutzern größtmöglichen Spielraum beim Umgang mit den Daten einräumt und den Anforderungen an Offenheit genügt. Mehr dazu erfahren sie im Abschnitt ‘What Open Data’
  2. Falls das nicht möglich ist, gehen sie zurück zu Schritt 1 und suchen sie eine andere Datensammlung.
  1. Machen sie die Daten verfügbar - als Massen-Download und in nützlichen Formaten. Bedenken sie auch die Veröffentlichung auf alternativen Wegen wie z.B. über eine API.
  2. Machen sie die Daten auffindbar - verlinken sie im Web auf ihre Daten. Ziehen sie die erstellung eines zentralen Datenkatalogs in Betracht, in dem alle Datenangebote gelistet werden.

Such dir ein Datenset!

Suchen Sie sich einen geeigneten Datensatz zur Veröffentlichung aus. Schauen Sie, ob es bereits Anfragen nach bestimmten Daten gegeben hat, oder werden Sie selber kreativ!

Wenn Sie bereits wissen, welche Datensätze sie ‘öffnen’ wollen können Sie gleich im nächsten Abschnitt weiterlesen. Bedenken Sie aber, dass in vielen Behörden die Auswahl der geeigneten Datensätze zu den größten Herausforderungen zählt!

Eine Liste mit den in Frage kommenden Datensätzen zu erstellen sollte kein großes Problem sein und in ist in der Regel in einem kurzen Prozess zu erreichen.

Es ist nicht unbedingt nötig eine vollständige Liste aller Datensätze anuzufertigen. Hauptsächlich sollte Klarheit darüber bestehen, ob es sinnvoll und wünschenswert ist diese Daten zu veröffentlichen. - Mehr Informationen dazu gibt es in diesem Abschnitt.

Frag die Community!

Am Anfang sollten Sie relevante Communities ansprechen und dort nachfragen welche Datensätze interessant und relevant sind. Diese Leute arbeiten täglich mit Daten und sind eine der Hauptnutzer staatlicher Open Data Sammlungen - sie sollten also in die Planungen unbedingt mit einbezogen werden.

  1. Bereiten Sie eine kurze Liste von Datensätzen vor und holen Sie Feedback ein. Das sollte ein gutes Gefühl für die Nachfrage nach Daten geben. Eine gute Richtschnur dafür können auch die Datenkataloge anderer Länder sein.
  2. Erstellen Sie eine einfache Website zu ihren Fragestellungen
  3. Veröffentlichen Sie diese Liste auf ihrer Website. Wählen Sie eine eindeutige und prägnante URL, damit die Seite über soziale Medien beworben werden kann!
  4. Geben sie den Nutzern die Möglichkeit, direkt über die Website Daten-Anfragen an sie zu richten, beispielsweise über E-Mail oder über ein einfaches Formular.
  5. Posten Sie diese Liste auch auf relevanten Mailinglisten, Foren und so weiter. Bitten Sie auch verschiedene Organisationen die Anfrage weiterzuverbreiten
  6. [Optional] Laden sie zu einer Veranstaltung ein, bei der sie Nutzer persönlich treffen können. Achten sie dabei darauf, dass auch berufstätige eine Möglichkeit haben, daran teilzunehmen.
  7. Bitten SIe auch Politiker an der Veranstaltung teilzunehmen. Offene Daten sind immer auch eine politische Entscheidung.

Kosten

Wie teuer ist die Datenhaltung? Kostet die Pflege eines bestimmten Datensatzes viel Geld, ist es wahrscheinlich, dass dieser auch andere Personen interessieren könnte!

“Warum sollten Menschen kostenlos an Informationen gelangen, die so umständlich und teuer zu beschaffen sind?” ist sicherlich eine Frage in vielen Behörden. Die Antwort ist relativ einfach: die Bürgerinnen und Bürger haben diese Daten bereits durch ihre Steuergelder bezahlt!

Einfachheit der öffnung

Manchmal ist es besser, mit den Datensätzen anzufangen die am einfachsten zu veröffentlichen sind. Diese mögen nicht die gleiche Aufmerksamkeit bekommen wie die ‘großen’ und ‘wichtigen’ Datensätze, aber stellen sicher eine gute Übung dar.

Seien Sie jedoch vorsichtig mit diesem Ansatz. Es kann sein, dass diese kleinen Datensätze von so geringem Wert sind, dass daraus keine guten Beispiele entstehen. Wenn dies geschieht, könnte der Glaube an das gesamte Projekt untergraben werden.

Schau dich um.

Die Open Data Bewegung wächst! Fragen Sie Vertreter von NGOs oder Mitarbeiter aus Verwaltungen die schon Erfahrungen mit Open Data gesammelt haben, Ihnen zu helfen.

Nutze eine offene Lizenz (juristische Offenheit)

In den meisten Gesetzgebungen gibt es Urheberrechte auf Daten, die Dritte daran hindern, sie ohne ausdrückliche Erlaubnis zu nutzen, zu verarbeiten und weiterzugeben. Selbst wenn es unklar ist, ob solche Schutzrechte anwendbar sind, ist es wichtig, eine Lizenz anzugeben, um Klarheit zu schaffen. Wenn Du also Deine Daten verfügbar machst, solltest Du eine Lizenz angeben. - und wenn Du willst, daß Deine Daten offen_ sind, ist es um so wichtiger.

Welche Lizenzen kannst Du dafür verwenden? Wir empfehlen, daß du für “offene” Daten eine der Lizenzen benutzt, die mit der Open Definition konform sind und zur Anwendung auf Daten verwendet werden können. Diese Liste (und Benutzungshinweise) findest Du auf:

Eine kurze einseitige Anleitung für ‘Open Data Lizenzen’ findet sich auf der Seite von Open Data Commons [in englischer Sprache]

Machen sie die Daten verfügbar (technische Offenheit)

‘Open Data’ muss sowohl in technischer wie in rechtlicher Hinsicht ‘offen’ sein. Die Daten sollten insbesondere in maschinenlesbarer Form vorliegen.

Available

Verfügbar - zu einem höchstens geringen Kostenaufwand, der die Reproduktionskosten deckt, bevorzugt als kostenloser Download über das Intenet. Grundsätzlich gilt: Veröffentlichen sie ihre Daten im Internet, wenn immer möglich.

In bulk

Machen sie die Daten verfügbar - als Massen-Download und in nützlichen Formaten. Bedenken sie auch die Veröffentlichung auf alternativen Wegen wie z.B. über eine API.

In an open, machine-readable format

Eine Weiterverarbeitung von Daten des öffentlichen Sektors sollte keinen Patentschutz oder anderen Schutzrechten unterliegen. Ebenso wichtig: stellen Sie sicher, dass die maschinenlesbare Formate verwenden um die bestmögliche Weiterverwendung zu gewährleisten. Statistiken die als ‘PDF (Portable Document Format’) veröffentlicht werden sind meistens auf eine gute Druckqualität hin optimiert. Diese Dateien können von Menschen sehr gut gelesen werden, doch Computer können in der Regel nur wenig damit anfangen. Dies schränkt die Möglichkeiten der Weiterverwendung deutlich ein.

Die Hauptsache sollte sein:

  • Halten Sie es einfach!
  • Seien Sie schnell!
  • Seien Sie pragmatisch!

Es ist besser, heute Rohdaten zu veröffentlichen, als perfekte Daten erst in sechs Monaten.

Es gibt viele Möglichkeiten, um Daten verfügbar zu machen. Im Zeitalter des Internets ist es naheliegend, das Internet als Weg für die Verteilung zu wählen. Je nachdem, wie umfangreich die Daten sind, die sie zur Verfügung stellen wollen, könnten jedoch auch andere Wege wie DVDs oder USB-Speicher eine Rolle spielen.

Bei besonders großen Datensätzen oder schlechten Internetverbindungen sollte über alternative Verteilungsformen nachgedacht werden, um die Kosten niedrig zu halten und gleichzeitig eine große Verbreitung sicherzustellen.

Online methods

Über die bestehende Website

Genau wie herkömmliche Dokumente können Sie auch größere Dateien zum einfachen Download auf ihrer Seite anbieten.

Das einzige Problem bei dieser Vorgehensweise: für ‘Outsider’ kann es schwierig sein an neue Informationen zu gelangen.

Über Seiten dritter

Viele Verzeichnisse haben sich zu ‘Datenhubs’ in ihrem Bereich entwickelt. Seiten wie Infochimps.com oder Talis.com erlauben es öffentlichen Verwaltungen große Mengen an Daten kostenlos zu hosten.

Solche Seiten können sehr sinnvoll sein. Insbesondere wenn sich dort schon Communities zu bestimmten Themen gebildet haben, sollten Sie darüber nachdenken Ihre Daten dort zur Verfügung zu stellen.

Umfassende Datenplattformen stellen eine Infrastruktur bereit die dem Bedarf gerecht werden kann. Oftmals werden auch Statistiken und Hilfen für die Nutzung der Daten bereit gestellt.

Plattformen anderer können, gerade für Ministerien, Probleme bergen. Es wird ein Stückweit die eigene Kompetenz bzw. Handlungsfähigkeit aufgegeben, was gerade bei Ministerien zu Problemen führen kann. Es sollte immer sichergestellt werden, dass die Plattform auf offenen Standards basiert, damit möglichst viele Menschen darauf zugreifen können.

Über FTP-Server

Eine weniger moderne Art der Bereitstellung von Daten ist das ‘File-Transfer-Protocol (FTP)’. FTP ist geeignet für die bedürfnisse technisch versierter Nutzer wie Software-Entwickler und Wissenschaftler.

Aber FTP ist nicht beliebt. Statt Informationen auf einer Website abzurufen, müssen Nutzer sich durch Daten- und Ordnerwüsten kämpfen - wie auf ihrem alten PC. Auch wenn es also technisch durchaus geeignet ist hat FTP nicht das Potenzial zu einer beliebten Datenplattform zu werden.

als Torrents

{term:’BitTorrent’} ist ein System, dass Politikern und Verwaltungen vor allem wegen seiner Verbindung zu Urheberrechtsverstößen bekannt ist. Bit Torrent verteilt Daten zwischen den verschiedenen Nutzern, jeder ist gleichzeitig Up- und Downloader von Daten. Das System ist sehr einfach aufgebaut und wunderbar geeignet um große Datenpakete zu versenden.

Als API

Daten können über eine API veröffentlicht werden. APIs sindSchnittstellen, die es Programmierern erlauben gezielt auf bestimmte Datenbestände zuzugreifen. APIs sind in der Regel mit Datenbanken verbunden, die Informationen in Echtzeit zur Verfügung stellen.

Offene Daten möglichst unverarbeitet zum Download anzubieten sollte die höchste Priorität aller Open Data Initiativen sein. Eine API ist interessant und nützlich, hat aber ihre eigenen Herausforderungen:

  1. Die Kosten: Eine API erfordert mehr Entwicklungsaufwand und regelmäßige Wartung und Pflege.
  2. Die Erwartungen: Um eine aktive Community zu pflegen ist es wichtig Sicherheit und Verlässlichkeit zu geben. Wenn etwas schief geht erwartet die Community, dass diese Probleme möglichst schnell behoben werden. In vielen Fällen werden Mitglieder der Community bereit sein zu helfen.

Zugang zu Datenrepositories stellt sicher, dass:

  • es keine Abhängigkeit zum ursprünglichen Bereitsteller der Daten gibt, d.h. Daten auch bei Restrukturierungen oder Finanzierungsengpässen weiterhin verfügbar bleiben.
  • jeder sich eine Kopie der Daten beschaffen und weiterverteilen kann. Dies reduziert die Kosten der Weiterverteilung für die ausgebende Behörde, außerdem gibt es keinen “single point of failure” mehr.
  • andere können neue Dienstleistungen mit den Daten entwickeln, da sichergestellt ist, dass die Daten nicht von heute auf morgen wieder verschwinden.

Daten als Komplettpaket zum Download anzubieten erlaubt es anderen, diese Daten abseits ihrer ursprünglichen Zwecke zu nutzen. Daten können z.B. in ein anderes Format gebracht oder mit anderen Daten zusammengestellt werden.

Die Server von Eurostat <http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/> bieten mehr als 4000 Dateien zum Download an. Diese werden zweimal täglich aktualisiert und bieten Daten im Tab-separated values (TSV) Format an. Außerdem ist eine umfangreiche Dokumentation beigefügt.

Ein anders Beispiel ist der Datenkatalog von Washington D.C. <http://octo.dc.gov/DC/OCTO/>, der die Daten neben CSV und XLS auch als Live-Feed zum Download anbietet.

Daten werden auffindbar

:term:’Open data’ funktioniert nicht ohne Nutzer, ohne eine aktive und kreative Community. Es muss sichergestellt werden, dass potenzielle Nutzer das Quellen-Material finden können. Dieser Abschnitt stellt einige Informationen dazu bereit.

Am wichtigsten ist es jedoch einen neutralen Platz zu schaffen, der sowohl interministerielle wie auch geographische Grenzen überwindet. Daten aus verschiedenen Einrichtungen zu kombinieren mag große Herausforderungen bringen, doch die Chancen für interessante Anwendungen steigen.

Existierende Tools:

Es gibt bereits eine Reihe von Werkzeugen im Internet um Daten auffindbar und nutzbar zu machen.

Einer der bekanntesten ist der DataHub. Dieser ist ein Katalog für Datensätze aus der ganzen Welt. Die Website ermöglicht es Datensätze zu veröffentlichen und wiederzufinden.

Außerdem gibt es dutzende von spezialisierten Datenkatalogen. Viele wissenschaftliche communities haben ein Katalogsystem für ihren Bereich eingerichtet, da Daten häufig für die Publikation notwendig sind.

Für Regierungen:

Es hat sich bewährt, dass eine Organisation innerhalb der Regierung eine Führungsrolle übernimmt und einen Datenkatalog anlegt. Dieser sollte so strukturiert sein, dass viele Ministerien und andere staatliche Stellen ihre Daten einfach einstellen und aktualisieren können.

Versuchen Sie nicht, das Rad noch einmal zu erfinden! Es gibt freie und offene Software für Datenkataloge (wie z.B. CKAN) die bereits von vielen Regierungen verwendet werden.

Es gibt wenige Dinge, die den meisten Open Data Katalogen fehlen. Ihr Programm sollte folgendes beachten:

  • Eine Schnittstelle für Firmen und Bürger schaffen, um Ihre Daten dem Katalog hinzuzufügen. So entsteht ein regionaler Datenkatalog anstatt eines regionalen Regierungsdatenkatalogs.
  • Die Weiterentwicklung von Daten unterstützen indem Änderungen an den Daten erlaubt werden. So kann z.B. jemand Adressen öffentlicher Ämter in einem Verzeichnis Geokodieren und so diese Ämter auf einer Karte darstellen. Wird die Bearbeitung von Daten unterbunden bleiben solche Verbesserungen aus.
  • Erheben Sie keinen Einzelveröffentlichungsanspruch. Es ist gut möglich, das Daten die zunächst auf ihrer Plattform eingestellt wurden auch in anderen Katalogen auftauchen. Wasserstandsdaten könnten z.B. in speziellen Katalogen von Hydrologen auftauchen.
  • Stellen Sie einen gleichberechtigten Zugang sicher. Vergeben Sie keine exklusiven Zugangsrechte für Verwaltungsmitarbeiter oder bekannte Wissenschaftler, da dies zivilgesellschaftlichem Engagement schaden kann.

Für die Zivilgesellschaft

Seid bereit einen ergänzenden Katalog für nicht-offizielle Daten aufzubauen.

Es ist sehr selten, dass Regierungen und ihre Beamten ihre Daten mit inoffziellen und nicht-autorisierten Daten verknüpfen. Sie sind meist sehr darauf bedacht sicherzustellen, dass kein Mißbrauch der Daten stattfindet und keine politischen Skandale entstehen können.

Außerdem sind viele Regierungen skeptisch gegenüber Bestrebungen ihre Daten mit Geschäftsinformationen zu mischen. Ein unabhängiger Katalog könnte diese Probleme lösen.