guide

Was ist Open Data?

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  my  ne  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 

Dieses Handbuch beschreibt offene Daten, aber was genau bedeutet das? Insbesondere, was macht offene Daten offen, und über welche Art von Daten reden wir?

Was ist Open?

Dieses Handbuch beschreibt offene Daten - aber was genau sind offene Daten? In unserem Zusammenhang sind offene Daten definiert durch die Open Definition:

offene Daten sind Daten, die von jedermann frei benutzt, weiterverwendet und geteilt werden können - die einzige Einschränkung betrifft die Verpflichtung zur Nennung des Urherbers

Die full Open Definition beschreibt im Detail, was das bedeutet. Die wichtigsten Punkte zusammengefasst:

  • Verfügbarkeit und freier Zugang: die Daten müssen als Ganzes verfügbar sein und zu nicht mehr als zumutbaren Vervielfältigungsunkosten, idealerweise als Download im Internet. Die Daten müssen weiterhin in einem zweckmäßigen und edierbaren Format vorliegen.
  • Wiederverwendung und Weitergabe: die Daten müssen unter Bedingungen zur Verfügung gestellt werden, die eine Wiederverwendung und Weitergabe ermöglichen, inklusive einer Verwendung der Daten zusammen mit Datensätzen aus anderen Quellen.
  • Universelle Beteiligung: Jeder muß in der Lage sein, die Daten zu nutzen, zu verarbeiten und weiterzuverteilen - es darf keine Benachteiligung von einzelnen Personen, Gruppen, oder Anwendungszwecken geben. Zum Beispiel Einschränkungen in der kommerziellen Nutzung, oder Beschränkung auf bestimmte Nutzungszwecke (z.B. nur für Bildungseinrichtungen), sind nicht erlaubt.

Es gibt eine einfache Antwort auf die Frage, warum eine klare Definition so wichtig ist, und warum wir genau diese Definition formuliert haben: Kompatibilität.

Interoperabilität bezeichnet die Fähigkeit verschiedener Systeme und Organisationen zusammen zu arbeiten. In unserem Fall heißt das, dass verschiedene Datensätze zusammen genutzt und miteinander verquickt werden können, ohne dass dies durch unterschiedliche Lizenzvorgaben oder nicht zusammenpassende Formate erschwert oder verhindert wird.

Interoperabilität ist wichtig, weil es verschiedenen Komponenten die Zusammenarbeit erlaubt. Diese Fähigkeit, einzelne Bausteine zusammensetzen zu können, ist wichtig, um große, komplexe Systeme zu bauen. Ohne Interoperabilität wird dies nahezu unmöglich - als veranschaulichendes Beispiel sei hier der berühmte Mythos des Turmbau zu Babels herangezogen, wo die Unfähigkeit zu kommunizieren den kompletten Zusammenbruch der gemeinsamen Arbeit am gemeinsamen Turmbauprojekt nach sich gezogen hat.

Im Hinblick auf Daten stehen wir vor einer ähnlichen Situation. Der Kern einer notwendigen gemeinsamen Basis für eine ‘Zusammenarbeit’ bei Daten (oder auch Programmiercode) ist, dass Teile dieses “offenen” Rohmaterials hierbei frei mit anderen Daten vermischt (aggregiert, verknüpft, kontextualisiert, etc.) werden können. Diese Interoperabilität ist der Schlüssel, um die wesentlichen praktischen Vorteile von “Offenheit” zu erschließen: die dramatisch verbesserte Möglichkeit, verschiedene unterschiedliche Datensätze zu kombinieren und so bessere Produkte und Dienste zu schaffen (diese Vorteile werden im Detail diskutiert im Abschnitt ‘Warum Open Data?’).

Eine klare Definition von Offenheit stellt sicher, daß zwei Datensätze von verschiedenen Quellen kombiniert werden können, und es verhindert einen “Turmbau zu Babel”: Viele Datensätze, die nicht oder kaum erlauben, in größeren Systemen miteinander kombiniert zu werden - genau dort, wo der größte Nutzen liegt.

Welche Daten wollt ihr eigentlich?

Wir haben bereits Beispiele von Daten angeführt, die offen sind oder offen werden können - und werden weitere geben. Allerdings ist es an dieser Stelle nützlich, einige Richtlinien zu nennen, welche Art von Daten offen sind, sein können, und - genauso wichtig - welche nicht offen sein werden.

Der Kernpunkt ist, daß der Fokus bei der Offenlegung von Daten auf nicht-personenbezogenen Daten liegt - d.h. Daten, die keine Informationen über einzelne Personen enthalten.

Gleiches gilt für sicherheitsrelevante Daten von Regierungen und Behörden. Trotzdem gilt unsere Forderung: ‘public by default’, d.h. dass Daten immer öffentlich sind, es sei denn die oben genannten Ausnahmen treffen zu. Ausnahmen von der öffentlichkeit der Daten müssen im Einzelfall begründet werden.