guide

什麼是開放資料?

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  my  ne  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 

這是一本關於開放資料的手冊,但是到底什麼是開放資料?尤其是,是什麼讓「開放資料」真的開放?而我們所說的資料又是指什麼資料?

開放是在說什麼?

這是一本關於開放資料的手冊 – 但是到底什麼是「開放資料」?在這裡,當我們提到「資料開放」時,我們將使用 Open Definition 中的定義 :

Open data is data that can be freely used, reused and redistributed by anyone - subject only, at most, to the requirement to attribute and sharealike. (開放資料指的是資料能被任何人自由地使用,重新使用與散佈 – 我們至多只能要求來源標示,與以相同方式分享)

關於「開放資料」的定義在 Open Definition (full Open Definition) 內有更詳細的說明。在這我們列出其中最重要的幾點:

  • Availability and Access / 可得性與可讀性 : 資料必須完整釋出,同時只能依照再製的成本徵收適當的費用。最好能提供網路下載。同時提供的資料格式必須是適用和可被修改的。
  • Re-use and Redistribution / 重新使用與散播 : 資料釋出時必須採用允許資料的重新使用和散播的授權聲明。並允許與其他資料混合使用。
  • Universal Participation/ 分享的普遍性 : 任何人都可使用,重新使用和散佈這些資料 - 不能限制資料使用的範圍,或是使用者的資格。例如,「非商業使用」將禁止資料在所有「商業性質」的使用,或是限制資料只能使用在某個範圍內 (例如,只能作為教育上使用)。這些限制都是不被允許的。

如果你對於為什麼我們如此執著在「開放」的定義和為什麼會如此定義感到疑惑,最簡單的答案就是: interoperability – 可互通 (用) 性

可互通性指的是不同的系統與組織可以共同運作 (inter-operate) 的能力。在這裡,可互通性意味著讓不同的資料集 (datasets) 可以彼此引用或是相互混用的能力。

可互通性的重要性在於,這是讓不同的元件可以一起共同運作的條件。這種將所有事物元件化和讓他們可以彼此 嵌合 的能力,對於建立一個更大更複雜的系統來說是絕對必要的。如果沒有這個可互通性,那就完全不可能達到這樣的結果。一個眾所皆知的例子就是巴別塔的神話故事,因為缺乏彼此溝通(互用)的能力(無能力),最後的結果就是整個塔的崩潰。

面對資料我們也有類似的問題。當我們提到資料 (或著程式碼) 共用 (commons) 時,我們指的是「開放」資料中的一部分,可以自由地與其他「開放」資料相互混用。而可互通性就是達到「開放性」(openness) 所帶來的最大好處時最重要條件 : 因為當不同資料集可以更容易地組合在一起,我們就能更容易地發展出更多和更好的產品與服務(這些好處將在「為什麼要開放資料」一章中有更詳細的說明)

對「開放性」提出一個清楚的定義可以讓我們在使用資料時,只要所用的資料符合這個開放定義,就能確定資料彼此可混和使用。同時也能確定我們不需面對另一座「巴別塔」 ‘tower of babel’ : 雖然擁有很多資料集,但是只有一小部分可以彼此互用。或更慘的是資料完全無法相互混和來建立一個更大的系統。當然也沒辦法將資料的價值呈現出來。

你所說的資料是?

讀者到目前為止已經看到許多範例,以及許多可以開放或是已經開放出來的資料類別。接下來我們將提到更多的例子。但是,為了方便接下來的說明,讓我們先快速的將已經開放出來的,或是可以被開放出來的資料做一個整理。在這,我們也會提到很重要的一點:什麼資料是不適合被開放出來的。

在開放資料時,重點是「非個人」的資料,也就是不包含關於特定人士的資訊。

相同地,對於一些受到國家安全管制的政府資料,也一樣不在我們討論的範圍內。