guide

열린 데이터란 무엇인가?

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  my  ne  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 

본 핸드백은 열린 데이터에 대한 것인데 그렇다면 열린 데이터는 정확히 무엇인가? 특히 무엇이 열린 데이터를 공개하게 만드나? 어떤 형태의 데이터에 대해 논의하는가?

공개란 무엇인가?

본 핸드북은 열린 데이터에 것인데 - 그런데 열린 데이터는 정확히 무엇인가? 우리의 목적을 위해 열린 데이터는 Open Definition:에 정의된 그대로이다.

열린 데이터는 모든 사람이 자유롭게 사용 및 재사용이 가능하며 재배포할 수 있는 데이터이다 - 저작권 표시 및 동일조건 변경 허락의 조건에서.

완전한 오픈 정의_ 는 열린 데이터의 의미에 대한 상세한 설명을 제공한다. 가장 중요한 것을 정리하면:

  • 이용성 및 접근: 전체 데이터가 이용가능해야 하며, 합리적인 재생산 비용으로, 가능하면 인터넷에서 다운로드되어야 한다. 데이터는 편리하고 수정 가능한 형태로 제공되어야 한다.
  • 재사용과 재배포: 데이터는 서로 다른 데이터와 결합되는 것을 포함하여 재사용과 재배포를 허용하는 조건으로 제공되어야 한다.
  • 보편적 참여: 누구나 데이터를 사용, 재사용 및 재배포할 수 있어야 한다 -  활동 분야, 특정한 사람이나 그룹에 대한 차별이 없어야 한다. 예를 들어, ‘비상업적’ 제한조건은 ‘상업적’ 사용을 제한할 수 있으며, 특정한 목적에 한정된 사용조건은 (예: 교육적 목적에 한정)은 허용되지 않는다.

공개라는 의미와 이러한 정의가 사용된 이유의 중요성이 명확하지 않다면, 간단한 답은: 상호운용성이다.

상호운용성은 다양한 시스템과 조직이 함께 동작할 수 있는 (상호 정보 교환이 가능한) 능력을 뜻한다. 여기서는 서로 다른 데이터셋 사이의 상호 운용 - 또는 혼합할 수 - 있는 능력을 말한다.

상호운용성은 서로 다른 컴포넌트들이 함께 동작할 수 있게 한다는 점에서 그 중요성이 있다. 컴포넌트를 구성하고 컴포넌트를 ‘함께 연결하는’ 능력은 광범위하고, 복잡한 시스템을 구축하기 위해 필수적이다. 상호운용성 없이 이런 시스템을 구축하는 것은 거의 불가능하다 - 가장 유명한 신화인 바벨탑에서 증명되었듯이, 상호소통 (상호운용을 위한) (무)능력은 탑을 건축하는 노력의 완벽한 붕괴에 영향을 주었다.

우리는 데이터와 관련하여 비슷한 상황에 직면하고 있다. 데이터 ‘공유’ (또는 코드)의 핵심은 그 안에 포함된 한 조각의 “공개된’ 자료가 “공개된” 다른 자료와 자유롭게 상호 결합될 수 있는 것이다. 이러한 상호운용성은 “공개성”의 핵심적이며 실용적인 혜택을 실현하는 핵심이다: 서로 다른 데이터셋을 극적으로 연결하고 조금 더 향상된 제품과 서비스를 개발하기 위한 강화 능력 (이러한 혜택은 ‘왜’ 데이터를 공개하나 섹션에서 자세히 다룬다).

공개성의 명확한 정의가 제공하는 것은 서로 다른 두 개의 데이터 소스가 공개되었을 때, 데이터를 상호 결합하는 것이 가능한 것이며, 동시에 **스스로만을 위한 ‘바벨탑’을 피할 수 있다는 것을 보장하는 것이다: 수많은 데이터셋이 있으나 실제 가치가 있는 규모가 큰 시스템에 데이터셋을 결합시키지 못하는 경우

어떤 데이터를 말하는 것인가?

여러분은 이미 공개되거나 공개될 가능성이 있는 데이터의 사례를 살펴보았다 - 보다 다양한 예를 아래에서 볼 수 있다. 그러나 어떤 종류의 데이터가 오픈되었는지 또는 오픈될 것인지 요약하는 것이 도움이 될 것이다 – 어떤 것이 공개되지 않는지도 마찬가지로 중요하게.

가장 중요한 점은 데이터를 공개할 때 초점이 개인적이지 않은 데이터에 있다는 것이다. 즉, 데이터는 특정한 개인에 대한 정보를 포함하지 않아야 한다.

유사하게, 정부 데이터 중에 국가 보안 제안 조건이 적용될 수 있다.