guide

Cara Membuka Data

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 

Bagian ini merupakan inti dari buku pegangan ini. Ia akan memberikan hal yang konkrit, saran yang merinci tentang bagaimana para pemegang data dapat membuka data-datanya. Kita akan melakukannya secara mendasar, tetapi juga mencakup masalah-masalah yang tersembunyi dan menjebak. Terakhir, kita akan membahas isu-isu halus yang dapat timbul.

Terdapat tiga aturan kunci yang kami rekomendasikan saat membuka data:

  • Jadikan lebih praktis. Mulailah dengan kecil, sederhana dan cepat. Tidak ada ketentuan bahwa setiap kumpulan data harus dibuat terbuka sekarang. Memulai dengan hanya membuka satu kumpulan data saja, atau bahkan satu bagian dari kumpulan data besar, tidak mengapa - tentunya, makin banyak kumpulan data yang anda buka, maka akan lebih baik.

Ingat ini tentang inovasi. Bergerak secepat mungkin adalah bagus karena itu berarti anda dapat membangun momentum dan belajar dari pengalaman – inovasi adalah sebuah proses di mana kegagalan adalah jalan menuju kesuksesan dan tidak setiap kumpulan data dapat berguna.

  • Terlibat dari awal dan melibatkan diri sesering mungkin. Melibatkan diri sesering mungkin dengan para pengguna aktual dan yang potensial serta dengan pengguna yang menggunakan ulang data, jadilah warga mereka, bisnis mereka atau menjadi pengembang mereka. Ini akan memastikan bahwa pada siklus berikutnya dari layanan anda menjadi lebih relevan lagi.

Sangat penting untuk diingat bahwa banyak data tidak akan menjangkau pengguna akhir secara langsung, melainkan melalui ‘mediator-info’. Mereka ini adalah orang-orang yang mengambil data dan mentransformasinya atau meramunya untuk dipresentasikan. Sebagai contoh, kebanyakan dari kita tidak ingin atau butuh dengan sebuah basisdata yang besar dari koordinat GPS, melainkan kita lebih memilih sebuah peta. Oleh karena itu, awali berhubungan dengan para mediator info ini. Mereka akan menggunakan ulang dan mendaur guna material tersebut.

  • Mengatasi kekhawatiran umum dan kesalahpahaman. Hal ini terutama penting jika anda bekerja dengan institusi besar seperti pemerintahan. Ketika membuka data anda akan dihadapkan pada banyak pertanyaan dan kekhawatiran. Hal ini penting untuk (a) mengidentifikasi hal-hal yang paling penting (b) dan mengarahkan mereka ke tahap awal sedini mungkin.

Ada empat langkah utama dalam membuat data terbuka, yang masing-masing akan dibahas secara rinci di bawah ini. Langkah-langkah tersebut adalah yang paling memungkinkan - banyak dari langkah-langkah tersebut dapat dilakukan secara bersamaan.

  1. Memilih kumpulan data(s) anda. Pilih kumpulan data(s) yang akan anda rencanakan untuk dibuka. Perlu diingat bahwa anda bisa (dan mungkin memang diperlukan) kembali ke langkah ini bila anda menemui kendala di kemudian hari.
  2. Menerapkan lisensi terbuka.
    1. Tentukan hak kekayaan intelektual yang ada dalam data.
  1. Terapkan lisensi ‘terbuka’ yang tepat yang dapat melisensi semua hak dan mendukung diskusi definisi tentang keterbukaan pada seksi ‘Apakah Data Terbuka’ di atas.
  2. NB: bila anda tidak dapat melakukan ini maka kembalilah ke langkah 1 dan cobalah dengan kumpulan data berbeda.
  1. Menjadikan data tersedia - secara masal dan format yang berguna. Anda mungkin juga mempertimbangkan cara alternatif untuk membuatnya menjadi tersedia misalnya seperti melalui sebuah API.
  2. Jadikan hingga mudah untuk ditemukan - terbitkan di web dan mungkin kelola sebuah pusat katalog untuk membuat daftar dari kumpulan data terbuka anda.

Pilih Kumpulan data(s)

Pemilihan kumpulan-kumpulan data(s) yang anda rencanakan untuk menjadikannya terbuka merupakan langkah pertama – meskipun perlu diingat bahwa seluruh proses pembukaan data akan berulang dan anda dapat kembali ke langkah ini bila anda mengalami masalah di kemudian hari.

Jika memang anda sudah mengetahui persis kumpulan-kumpulan data(s) apa yang anda rencanakan untuk dibuka, maka anda dapat langsung ke bagian berikutnya. Bagaimanapun juga, dalam banyak kasus, terutama untuk lembaga-lembaga yang besar, untuk berfokus pada memilih kumpulan data menjadi sebuah tantangan. Bagaimana seharusnya untuk melanjutkan dalam kasus seperti ini?

Pembuatan daftar ini harus menjadi proses cepat yang mengidentifikasi kumpulan data mana saja yang dapat mulai dijadikan terbuka. Akan ada waktu berikutnya untuk memeriksa secara rinci apakah setiap kumpulan data cocok atau tidak.

Tidak ada keharusan untuk membuat daftar yang komprehensif dari kumpulan data anda. Titik utama untuk diingat adalah apakah layak untuk mempublikasikan data ini sama sekali (baik secara terbuka atau sebaliknya) - lihat bagian sebelumnya.

Meminta komunitas

Kami merekomendasikan anda untuk meminta kepada masyarakat sebagai contoh pertama. Yaitu mereka yang akan mengakses dan menggunakan data tersebut, karena mereka cenderung memiliki pemahaman yang baik tentang data mana yang bermanfaat.

  1. Siapkan daftar singkat dari potensi kumpulan data yang akan anda beri umpan balik. Bukanlah hal yang esensial bila daftar ini ternyata sesuai dengan harapan anda, tujuan utamanya adalah untuk dapat merasakan akan adanya suatu kebutuhan. Ini bisa merujuk pada katalog {term:data terbuka} negara lainnya.
  2. Membuat permintaan untuk komentar.
  3. Mempublikasikan permintaan anda melalui sebuah halaman web. Pastikan bahwa dimungkinkan untuk mengakses permintaan tersebut melalui URL-nya sendiri. Dengan demikian, ketika berbagi melalui media sosial, permintaan tersebut dapat dengan mudah akan ditemukan.
  4. Menyediakan cara mudah untuk mengirimkan respon. Menghindarkan dari keharusan mendaftar, karena itu akan mengurangi jumlah respon.
  5. Edarkan permintaan tersebut ke mailing list, forum dan individu yang relevan, lalu merujuk kembali ke halaman web utama.
  6. Gelar sebuah acara konsultasi. Pastikan anda menyelenggarakannya pada waktu yang nyaman bagi umumnya para pelaku bisnis, pengolah data dan para petugas resmi dapat menghadirinya.
  7. Meminta politisi untuk berbicara atas nama lembaga anda. Data terbuka dapat menjadi bagian dari sebuah kebijakan luas dalam meningkatkan akses ke informasi pemerintahan.

Basis cost

Berapa banyak uang yang dibelanjakan oleh lembaga-lembaga dalam pengumpulan dan pemeliharaan data yang mereka pegang? Jika mereka menghabiskan banyak biaya dalam kumpulan data tertentu, maka sangat mungkin bahwa orang lain ingin mengaksesnya.

Argumen ini mungkin cukup rentan terhadap keprihatinan akan kebebasan yang berlebihan. Pertanyaan yang perlu anda respon adalah, “Mengapa orang-orang dalam mendapatkan informasi secara gratis harus bergitu mahalnya?”. Jawabannya terletak pada biaya yang harus diserap oleh sektor publik untuk melakukan fungsi tertentu. Biaya pengiriman data, setelah dikumpulkan, kepada pihak ketiga rata-rata tidak ada. Oleh karena itu, mereka pun tidak harus dibebankan apa-apa.

Kemudahan rilis

Terkadang, daripada memutuskan data mana yang paling berharga, maka akan lebih berguna untuk melihat data mana yang paling mudah untuk masuk ke tangan publik. Kecil, mudah dirilis dapat menjadi katalis untuk perubahan perilaku yang lebih besar dalam organisasi.

Bagaimanapun, tetap berhati-hati dengan pendekatan ini. Itu mungin bisa terjadi di mana rilis kecil ini akan juga sedikit nilai-nilainya yang tidak ada untuk dapat dibangun darinya. Bila ini terjadi, kepercayaan pada seluruh proyek bisa terganggu.

Amati rekan

Data Terbuka adalah gerakan yang berkembang. Ada kemungkinan akan banyak orang di daerah yang memahami apa yang dilakukan daerah lainnya. Merumuskan sebuah daftar berdasarkan apa yang dilakukan oleh lembaga-lembaga.

Menerapkan sebuah Lisensi Terbuka (Keterbukaan Resmi)

Di kebanyakan yurisdiksi terdapat hak kekayaan intelektual di dalam data yang mencegah pihak ketiga dari penggunaannya, penggunaan ulang dan pendistribusian data tanpa izin eksplisit. Bahkan di tempat di mana keberadaan hak hukum serba tidak pasti, penting untuk menerapkan lisensi demi sebuah kejelasan. Dengan demikian, * jika anda berencana untuk membuat data anda tersedia, anda harus menaruh lisensi di atasnya* - dan jika anda ingin data anda menjadi terbuka _ ini bahkan lebih penting lagi.

Lisensi apa yang dapat anda gunakan? Kami rekomendasikan untuk data ‘terbuka’ anda dapat menggunakan salah satu dari lisensi yang sesuai dengan _ Definisi Terbuka dan telah ditandai cocok untuk data. Daftar ini (beserta petunjuk penggunaannya) dapat ditemukan di:

Panduan singkat 1-halaman instruksi penerapan lisensi open data dapat ditemukan situs Open Data Commons:

Menjadikan Data Tersedia (Teknis Keterbukaan)

{term:Data terbuka} membutuhkan keterbukaan secara teknis sebagaimana keterbukaan yang resmi secara hukum. Khususnya, data harus bisa tersedia secara masal dalam format {term:yang dapat dibaca mesin}.

Available

Data seharusnya dihargai tidak lebih dari biaya reproduksi yang wajar, sebaiknya dijadikan sebagai unduhan gratis dari internet. Model penghargaan ini dapat dicapai karena lembaga anda tidak perlu menangani biaya apapun saat menyediakan data untuk digunakan.

In bulk

Data harus tersedia dalam kumpulan yang lengkap. Jika anda memiliki daftar yang dikoleksi di bawah aturan undang-undang, seluruh daftar tersebut harus tersedia untuk diunduh. Sebuah API web atau layanan serupa juga dapat menjadi sangat berguna, tetapi peran mereka bukan sebagai sebuah pengganti untuk akses masal.

In an open, machine-readable format

Penggunaan-ulang data yang disediakan oleh sektor publik tidak seharusnya tunduk pada pembatasan paten. Lebih penting lagi, pastikan bahwa anda telah menyediakan format yang dapat dibaca mesin yang memungkinkan untuk penggunaan-ulang yang lebih luas lagi. Untuk mengilustrasikannya, anggaplah statistik yang dipublikasikan sebagai dokumen PDF (Portable Document Format), daripada digunakan untuk kepentingan pencetakan yang berkualitas tinggi. Sementara statistik ini dapat dibaca oleh manusia, namun sangat sulit bagi komputer untuk menggunakannya. Hal ini akan sangat membatasi kemampuan yang lainnya untuk menggunakan ulang data.

Berikut ini beberapa kebijakan yang akan sangat menguntungkan:

  • Buat seringkas mungkin,
  • Bergerak cepat
  • Jadilah pragmatis.

Secara khusus akan lebih baik memberikan data mentah sekarang daripada data yang sempurna dalam waktu enam bulan.

Terdapat banyak cara yang berbeda untuk menjadikan data tersedia bagi yang lain. Yang paling alami di era internet adalah publikasi secara daring. Terdapat banyak variasi dari model ini. Yang paling mendasar, lembaga-lembaga telah membuat data mereka tersedia melalui situs web mereka sendiri dan sebuah katalog sentral mengarahkan pengunjung ke sumber yang tepat. Namun, terdapat pula alternatifnya.

Ketika {term:konektivitas} menjadi terbatas atau ukuran data menjadi sangat besar, maka pendistribusian dengan menggunakan format lain dapatlah dibenarkan. Bagian ini juga mendiskusikan beberapa alternatif, yang dapat dilakukan untuk menjaga beban biaya tetap kecil.

Metode daring

Melalui situs anda yang telah ada

Sistem yang paling mudah dikenali tim konten web anda adalah dengan menyediakan beberapa file untuk diunduh dari halaman web. Sama seperti anda saat ini yang menyediakan akses ke dokumen diskusi, file-file data lebih disukai menjadi tersedia dengan cara ini.

Salah satu kesulitan dalam pendekatan ini adalah sangat sulit bagi orang luar untuk menemukan keberadaan informasi yang telah diperbarui. Pilihan ini menambah beban pada orang-orang untuk menciptakan perangkat tambahan pada data Anda.

Melalui situs pihak ke-3

Banyak repositori telah menjadi pusat data dalam bidang tertentu. Sebagai contoh, pachube.com didesain untuk menghubungkan orang-orang dengan sensor bagi mereka yang berharap untuk mengakses data darinya. Situs seperti Infochimps.com dan Talis.com memperkenankan lembaga sektor publik untuk menyimpan data raksasa untuk digratiskan.

Situs pihak ketiga bisa sangat berguna. Alasan utama untuk hal ini adalah mereka telah dikumpulkan bersama-sama dengan sebuah komunitas dari orang-orang yang berminat dan bersama kumpulan-kumpulan data lainnya. Ketika data anda menjadi bagian dari platform ini, bentuk ketertarikan yang positif diciptakan.

Platform grosir data sudah menyediakan infrastruktur yang dapat mendukung kebutuhan. Mereka bahkan menyediakan informasi analisis dan penggunaannya. Untuk lembaga sektor publik, mereka secara umum gratis.

Platform ini dapat mempunyai dua beban. Yang pertama adalah kebebasan. Lembaga anda harus mampu menghasilkan kendali kepada orang lain. Hal ini seringkali membuat sulit secara politik, hukum atau operasionalnya. Beban kedua mungkin adalah keterbukaan. Pastikan bahwa platform data anda tidak mempedulikan tentang siapa yang dapat mengaksesnya. Para pengembang perangkat lunak dan para ilmuwan menggunakan banyak sistem operasi, mulai dari ponsel pintar hingga superkomputer. Mereka semuanya harus dapat mengakses data tersebut.

Melalui server FTP

Sebuah metode yang kurang modis dalam penyediaan akses adalah melalui File Transfer Protocol (FTP). Ini mungkin cocok bila pemirsa anda adalah teknisi, seperti pengembang perangkat lunak dan ilmuwan. Sistem FTP berjalan dalam kerangka HTTP, tetapi ia secara khusus didesain untuk mendukung transfer file.

FTP jauh dari kenikmatan. Daripada menyediakan sebuah situs, melihat melalui sebuah server FTP mirip seperti melihat folder pada komputer. Oleh karena itu, meskipun itu sesuai dengan tujuan, ada kapasitas yang jauh lebih sedikit bagi perusahaan pengembang web untuk membebankan biaya penyesuaian.

Sebagai torrent

BitTorrent adalah sebuah sistem yang telah menjadi akrab bagi para pembuat kebijakan karena korelasinya dengan isu pelanggaran hak cipta. BitTorrent menggunakan file-file yang disebut torrent, yang bekerja dengan memisahkan biaya distribusi file-file di antara orang-orang yang mengakses file-file tersebut. Alih-alih, server menjadi kelebihan beban, pasokan menjadi meningkat seiring dengan meningkatnya permintaan. Hal inilah yang menjadi alasan sistem ini menjadi sangat sukses dalam berbagi film. Ini adalah cara yang luar biasa efisiennya untuk mendistribusikan volume data yang sangat besar.

Sebagai sebuah API

Data dapat dipublikasikan melalui Application Programming Interface (API). Antarmuka ini telah menjadi sangat populer. Ia memungkinkan para pemrogram untuk memilih secara spesifik jumlah datanya, daripa menyediakan semua data secara masal dengan sebuah file yang besar. API biasanya terhubung ke basisdata yang terus diperbarui secara aktual. Hal ini berarti membuat informasi menjadi tersedia melalui API dapat memastikan data itu selalu terperbarui.

Mempublikaskan data mentah secara masal harus menjadi perhatian khusus dari semua inisiatif data terbuka. Terdapat jumlah biaya untuk menyediakan sebuah API:

  1. Harga. Mereka membutuhkan lebih banyak pengembangan dan pemeliharaan daripada menyediakan file.
  2. Harapan. Dalam rangka mendorong komunitas pengguna di balik sistem, sangatlah penting untuk memberikan kepastian. Ketika terjadi sesuatu yang buruk, anda akan diharapkan menanggung biaya untuk memperbaikinya.

Akses ke data masal dapat memastikan bahwa:

  • tidak ada ketergantungan dengan penyedia data orisinal, yang berarti sekalipun terjadi restrukturisasi atau siklus anggaran yang mengubah situasi, namun data masih tetap tersedia.
  • Siapapun bisa mendapatkan sebuah salinannya dan mendistribusikannya. Hal ini akan menekan biaya distribusi pada lembaga sumber dan dapat memastikan tidak akan ada kegagalan sedikitpun.
  • lainnya dapat membangun layanan mereka sendiri menggunakan data tersebut, karena mereka punya keyakinan bahwa data tersebut tidak akan diambil dari mereka.

Menyediakan data secara masal memungkinkan orang lain untuk menggunakan data di luar tujuan awalnya. Misalnya, hal itu dapat memungkinkan untuk diubah menjadi format baru, terkait dengan sumber daya lainnya, atau diversi dan arsiparis di banyak tempat. Sedangkan versi terbaru dari data dapat dibuat tersedia melalui API, data mentah harus disediakan dalam jumlah besar secara berkala.

Sebagai contoh, Eurostat statistical service mempunyai fasilitas pengunduhan masal yang menawarkan lebih dari 4000 file data. Selalu diperbarui dua hari sekali, menawarkan data dalam format Tab-separated values (TSV), dan termasuk dokumentasi mengenai fasilitas pengunduhan sebagaimana dokumentasi tentang file datanya.

Contoh lainnya adalah District of Columbia Data Catalog, yang memungkinkan data untuk diunduh dalam format CSV dan XLS dan sebagai tambahannya feeds langsung dari data.

Jadikan data mudah ditemukan

{term:Data terbuka} tidak berarti tanpa para pengguna. Anda perlu untuk memastikan bahwa orang-orang dapat dengan mudah menemukan sumber material tersebut. Seksi ini akan mencakup beberapa pendekatan yang berbeda.

Yang paling penting adalah menyediakan ruang netral yang dapat mengakomodasi baik politik antar-lembaga maupun siklus anggaran di masa depan. Perbatasan yurisdiksi, baik sektoral maupun geografis, dapat membuat kerjasama menjadi hal yang sulit. Namun, ada manfaat yang signifikan ketika bergabung. Semakin mudah bagi orang luar untuk menemukan data, maka perangkat-perangkat akan semakin cepat dibangun dan semakin meningkat kegunaannya.

Perangkat tersedia

Terdapat banyak perangkat yang tersedia secara langsung di web yang didesain secara khusus untuk membuat data menjadi lebih mudah ditemukan.

Salah satu yang paling menonjol adalah DataHub yang berbentuk sebuah katalog dan penyimpanan data dari seluruh dunia. Situs ini memudahkan para individu dan organisasi untuk mempublikasikan material dan membantu para pengguna data untuk menemukan material yang mereka butuhkan.

Sebagai tambahan, terdapat lusinan spesialis katalog untuk sektor dan tempat yang berbeda. Banyak dari komunitas ilmu pengetahuan telah membuat sebuah sistem katalog untuk bidang mereka, sebagaimana data yang sering dibutuhkan untuk publikasi.

Untuk pemerintahan

Seperti yang telah muncul, praktik ortodoks adalah untuk lembaga utama yang membuat katalog untuk data pemerintah. Saat menetapkan katalog, cobalah untuk membuat beberapa struktur yang memungkinkan banyak departemen dapat dengan mudah menyimpan informasi mereka sendiri.

Menahan diri dari tergesa-gesa untuk membangun dari awal perangkat lunak pendukung katalog. Ada banyak solusi perangkat lunak yang bebas dan open source (seperti CKAN) yang telah banyak diadopsi oleh pemerintah. Dengan demikian, investasi di platform lain mungkin tidak akan diperlukan lagi.

Ada beberapa hal yang sering diabaikan oleh katalog data terbuka. Program Anda sebaiknya mempertimbangkan hal-hal berikut ini:

  • Memberikan sebuah jalan yang dapat memungkinkan sektor swasta dan masyarakat untuk menambahkan data mereka. Hal ini mungkin dapat bermanfaat untuk mulai mempertimbangkan katalog tersebut sebagai sebuah katalog daerah, bukan sebagai katalog pemerintah daerah.
  • Peningkatan fasilitas dari data dengan memperkenankan derivatif dari kumpulan data untuk dikatalogkan. Sebagai contoh, seseorang mentransformasikan alamat menjadi kode geo dan mungkin hasilnya dibagikan ke setiap orang. Bila anda hanya memperkenankan versi tunggal kumpulan-kumpulan datanya, peningkatan-peningkatan ini hanya akan menjadi tersembunyi.
  • Berilah toleransi pada data anda agar bisa muncul di tempat lain. Ini artinya, konten anda mungkin akan digandakan untuk kepentingan masyarakat. Jika anda memiliki data tentang pemantauan ketinggian debit sungai yang sudah siap tersedia, maka data anda mungkin muncul dalam katalog untuk hidrologis.
  • Pastikan setiap akses diperlakukan dengan adil. Cobalah untuk menghindari pembuatan tingkat akses istimewa yang ditujukan bagi para pejabat atau peneliti punya kedudukan penting karena hal ini akan melemahkan partisipasi dan hubungan dengan masyarakat.

Untuk masyarakat sipil

Jadilah pihak yang bersedia membuat katalog tambahan untuk data yang bersifat tidak-resmi.

Adalah sangat jarang bagi pemerintah untuk mengasosiasikannya dengan sumber-sumber yang bersifat tidak resmi atau non-otoritatif. Para pejabat seringkali mengeluarkan biaya besar untuk memastikan bahwa tidak akan ada rasa malu masalah politik atau ancaman lain yang disebabkan dari penyalahgunaan atau kepercayaan yang berlebih pada data.

Selain itu, pemerintah tampaknya tidak akan bersedia untuk mendukung kegiatan yang berpotensi dapat mengacaukan informasi mereka dengan informasi dari bisnis. Pemerintah berhak skeptis terhadap segala motif yang berlatar keuntungan. Oleh karena itu, katalog independen untuk masyarakat, usaha kelompok dan lainnya dapat dibenarkan.