Πώς μπορεί κανείς να «ανοίξει» τα δεδομένα;
Αυτή η ενότητα αποτελεί τον πυρήνα του εγχειριδίου. Προσφέρει συγκεκριμένες, λεπτομερείς συμβουλές σχετικά με το πώς οι κάτοχοι δεδομένων μπορούν να «ανοίξουν» τα δεδομένα τους. Θα καλυφθούν τα βασικά σημεία, αλλά και οι «παγίδες» που κρύβει η διαδικασία. Τέλος, θα ακολουθήσει συζήτηση σχετικά με πιο περίπλοκα ζητήματα που μπορεί να προκύψουν.
Υπάρχουν τρεις βασικοί κανόνες που συνιστώνται κατά το «άνοιγμα» των δεδομένων:
- Απλότητα. Ξεκινήστε με ένα μικρό σύνολο δεδομένων, απλά και γρήγορα. Δεν είναι προαπαιτούμενο ότι κάθε σύνολο δεδομένων πρέπει να γίνει άμεσα ανοιχτό. Είναι αρκετό να αρχίσετε ανοίγοντας μόνο ένα μέρος του μεγαλύτερου συνόλου. Φυσικά, όσο περισσότερα σύνολα δεδομένων μπορούν να «ανοιχτούν», τόσο το καλύτερο.
Να θυμάστε ότι πρόκειται για καινοτομία. Είναι σημαντικό να εξελίσσεστε το γρηγορότερο δυνατόν. Όσο πιο γρήγορα κινηθείτε, τόσο καλύτερα, γιατί αυτό σημαίνει ότι δίνετε ώθηση και μαθαίνετε καθώς εξασκείστε. Η καινοτομία αφορά τόσο την αποτυχία όσο και την επιτυχία και αυτό σημαίνει πως κάθε σύνολο δεδομένων δεν θα είναι απαραίτητα χρήσιμο.
- Εμπλακείτε νωρίς και συχνά. Εμπλακείτε με πραγματικούς και δυναμικούς χρήστες των δεδομένων, συμπεριλαμβανομένων και αυτών που επαναχρησιμοποιούν τα δεδομένα, όσο γίνεται νωρίτερα κι όσο γίνεται συχνότερα, είτε αυτοί είναι πολίτες, επιχειρηματίες ή προγραμματιστές. Αυτό εξασφαλίζει ότι η επόμενη έκδοση της υπηρεσίας σας θα είναι όσο το δυνατόν πιο στοχευμένη.
Είναι ουσιαστικό να θυμάστε ότι πολλά δεδομένα δε θα καταφέρουν να προσεγγίσουν άμεσα τους τελικούς χρήστες, παρά μόνο μέσω ενδιάμεσων συντακτών πληροφορίας. Αυτοί είναι άνθρωποι που παίρνουν τα δεδομένα και τα μετατρέπουν ή τα αναμειγνύουν, για να μπορούν να δημοσιοποιηθούν. Για παράδειγμα, οι περισσότεροι άνθρωποι δεν επιθυμούν ένα μεγάλο σύνολο δεδομένων με συντεταγμένες για GPS, θα προτιμούσαν όμως ένα χάρτη. Έτσι, εμπλέκεται κανείς με τους ενδιαμέσους, αφού αυτοί θα χρησιμοποιήσουν και θα επανεξετάσουν το υλικό.
- Διευθετήστε κοινές φοβίες και παρανοήσεις. Αυτό είναι ιδιαίτερα σημαντικό, αν κάποιος εργάζεται σε κάποιο μεγάλο οργανισμό, όπως μία κυβέρνηση. Όταν «ανοίξουν» τα δεδομένα, θα βρεθείτε αντιμέτωποι με πολλές ερωτήσεις και φοβίες. Είναι σημαντικό (α) να αναγνωρίζετε τις πιο σημαντικές και (β) να τις διευθετήσετε σε όσο το δυνατόν πιο πρώιμο στάδιο.
Υπάρχουν τέσσερα κύρια στάδια στη μετατροπή των δεδομένων σε ανοιχτά, καθένα από τα οποία καλύπτεται λεπτομερώς παρακάτω. Η σειρά έχει οριστεί κατά προσέγγιση αφού πολλά από τα βήματα αυτά μπορούν να καλυφθούν ταυτόχρονα.
- Επιλέξτε το σύνολο των δεδομένων σας. Επιλέξτε το σύνολο των δεδομένων που πρόκειται να «ανοίξετε». Έχετε κατά νου ότι μπορεί (και ίσως χρειαστεί) να επιστρέψετε σε αυτό το βήμα αν αντιμετωπίσετε προβλήματα σε επόμενο στάδιο.
- Εφαρμόστε μια ανοιχτή άδεια.
- Προσδιορίστε τι πνευματικά δικαιώματα ενυπάρχουν στα δεδομένα.
- Εφαρμόστε μια κατάλληλη «ανοιχτή» άδεια που καλύπτει όλα τα δικαιώματα και υποστηρίζει τον ορισμό της «ανοικτότητας», όπως συζητήθηκε στην προαναφερθείσα ενότητα «Τι είναι τα ανοιχτά Δεδομένα»
- Αν δεν μπορείτε να ολοκληρώσετε το δεύτερο βήμα, επιστρέψτε στο 1ο βήμα και προσπαθήστε με ένα διαφορετικό σύνολο δεδομένων.
- Καταστήστε τα δεδομένα σας διαθέσιμα, τόσο συνολικά στην αρχική τους μορφή, όσο και σε κάποια πιο χρήσιμη μορφή. Θα μπορούσατε επίσης να φροντίσετε, ώστε να είναι διαθέσιμα και σε περισσότερες εναλλακτικές μορφές, όπως μέσω ενός API.
- Καταστήστε το σύνολο των δεδομένων σας εντοπίσιμο – δημοσιοποιήστε τα στο Διαδίκτυο και οργανώστε κεντρικούς καταλόγους, όπου θα καταγράψετε την πλήρη λίστα με όλα τα ανοιχτά σύνολα δεδομένων που διαθέτετε.
Επιλέξτε τα σύνολα των δεδομένων
Η επιλογή των συνόλων των δεδομένων που επιθυμείτε να «ανοίξετε» είναι το πρώτο βήμα. Μην ξεχνάτε ότι όλη η διαδικασία του ανοίγματος των δεδομενών είναι επαναληπτική και μπορεί να χρειαστεί να επιστρέψετε σε αυτό το βήμα εάν αντιμετωπίσετε κάποιο πρόβλημα αργότερα.
Εάν γνωρίζετε ήδη ποια ακριβώς δεδομένα σκοπεύετε να «ανοίξετε», μπορείτε να προχωρήσετε απευθείας στην επόμενη ενότητα. Ωστόσο, σε πολλές περιπτώσεις, ειδικά σε μεγάλους οργανισμούς, η επιλογή των δεδομένων, στα οποία θα επικεντρωθείτε, είναι πρόκληση. Πώς θα πρέπει να προχωρήσει κανείς σε τέτοιες περιπτώσεις;
Η ανάπτυξη μιας λίστας συνόλων δεδομένων θα πρέπει να είναι μια γρήγορη διαδικασία, που θα αναγνωρίζει ποια σύνολα δεδομένων θα ήταν προτιμότερο να γίνουν πρώτα «ανοιχτά». Αργότερα, θα υπάρχουν τα περιθώρια να ελέγξετε αν κάθε σύνολο δεδομένων είναι κατάλληλο ή όχι, για να γίνει «ανοιχτό»
**Δεν είναι προαπαιτούμενο να αναπτυχθεί μια διεξοδική λίστα με όλα τα σύνολα δεδομένων σας. Ο κεντρικός στόχος είναι η δημοσιοποίηση αυτών των δεδομένων (είτε «ανοιχτά» είτε όχι) – δείτε την ενότητα «Τι είναι τα Ανοιχτά Δεδομένα» παραπάνω.
Επικοινωνώντας με την κοινότητα
Η επικοινωνία με την κοινότητα συνίσταται από την πρώτη στιγμή. Επικοινωνήστε με τους ανθρώπους που πρόκειται να χρησιμοποιήσουν τα δεδομένα και είναι σε θέση να κατανοούν καλύτερα ποια δεδομένα είναι πολύτιμα.
- Προετοιμάστε μία σύντομη λίστα με πιθανά σύνολα δεδομένων για τα οποία θα σας ενδιέφερε να έχετε ανάδραση (feedback). Δεν είναι απαραίτητο η λίστα αυτή να συμφωνεί με τις προσδοκίες σας. Η κύρια πρόθεσή σας είναι να κατανοήσετε τις ανάγκες. Η λίστα θα μπορούσε να βασιστεί και σε καταλόγους {term:«ανοιχτών» δεδομένων} από άλλες χώρες.
- Σχεδιάστε μια πρόσκληση για σχόλια.
- Δημοσιοποιήστε την πρόσκλησή σας σε μία ιστοσελίδα. Φροντίστε η πρόσκληση να είναι προσβάσιμη με το δικό της URL. Με αυτόν τον τρόπο, όταν διαμοιράζεται από τα social media, το URL είναι εύκολο να βρεθεί.
- Προσφέρετε εύκολους τρόπους υποβολής απαντήσεων. Αποφύγετε την απαίτηση εγγραφής, καθώς αυτό μειώνει των αριθμό των απαντήσεων.
- Διανέμετε την πρόσκληση σε σχετικές mailing lists, forums και μεμονωμένα άτομα, επισημαίνοντας την κύρια ιστοσελίδα.
- Οργανώστε μία συνάντηση για διαβούλευση. Βεβαιωθείτε ότι το οργανώσατε σε κατάλληλη ώρα, ώστε να μπορεί να το παρακολουθήσει ο μέσος επιχειρηματίας, ο ειδικός στα δεδομένα (data wrangler) ή ο υπάλληλος κτλ.
- Ζητήστε συνάντηση με κάποιον πολιτικό, για να μιλήσετε εκ μέρους της υπηρεσίας σας. Τα ανοιχτά δεδομένα είναι πολύ πιθανό να αποτελούν μέρος μιας ευρύτερης πολιτικής για αυξανόμενη πρόσβαση στις κυβερνητικές πληροφορίες.
Βάση κόστους
Πόσο κόστος έχει για τις υπηρεσίες να συλλέξουν και να συντηρήσουν τα δεδομένα που κατέχουν; Αν όντως το κόστος για ένα συγκεκριμένο σύνολο δεδομένων είναι υψηλό, τότε είναι πολύ πιθανόν υπάρχουν τρίτοι που επιθυμούν να το χρησιμοποιήσουν.
Αυτό το επιχείρημα μπορεί να είναι αρκετά ευάλωτο στις ανησυχίες για καιροσκοπική εκμετάλλευση. Η ερώτηση που ενδεχομένως να χρήζει απάντησης είναι: «Γιατί τρίτοι θα πρέπει να μπορούν να έχουν δωρεάν πρόσβαση σε πληροφορίες που είναι τόσο ακριβές;». Η απάντηση έχει ως εξής: Η δαπάνη καλύπτεται από το δημόσιο τομέα για να εκτελεστει κάποια ειδική λειτουργία. Το κόστος της αποστολής των δεδομένων σε τρίτους, όταν πια έχουν συλλεχθεί, είναι σχεδόν μηδαμινό. Συνεπώς, δε θα έπρεπε να έχουν κάποια χρέωση.
Εύκολη διανομή
Ορισμένες φορές, αντί να αποφασισθεί απευθείας ποια δεδομένα είναι πιο πολύτιμα, θα ήταν χρήσιμο να επικεντρωθείτε στα δεδομένα που είναι ευκολότερο να βρεθούν σε «δημόσια χέρια». Οι περιορισμένες αλλά εύκολες διανομές θα μπορούσαν να παίξουν καταλυτικό ρόλο στην αλλαγή της νοοτροπίας σε έναν οργανισμό.
Παραμείνετε προσεχτικοί, ωστόσο, σε αυτήν την περίπτωση. Μπορεί αυτές οι περιορισμένες διανομές να έχουν τόσο μικρή αξία, που εν τέλει να μη δομηθεί τίποτα πάνω σε αυτές. Αν συμβεί αυτό, η πίστη στο σχεδιασμό σας θα μπορούσε να υπονομευθεί.
Παρατηρώντας τους εμπλεκόμενους
Τα Ανοιχτά Δεδομένα είναι ένα ανερχόμενο ρεύμα. Είναι πιθανό να υπάρχουν πολλοί άνθρωποι στον τομέα σας που να μπορούν να κατανοήσουν με τι ασχολούνται άλλοι τομείς. Αναπτύξτε μία λίστα με βάση τις δραστηριότητες αυτών των υπηρεσιών.
Εφαρμόστε μία «Ανοιχτή» Άδεια (νομική ανοικτότητα)
Στους περισσότερους τομείς, τα δεδομένα προστατεύονται από δικαιώματα περί πνευματικής ιδιοκτησίας, αποτρέποντας τη χρήση, επαναχρησιμοποίηση και αναδιανομή από τρίτους, χωρίς ρητή άδεια. Ακόμα και στις περιπτώσεις όπου η ύπαρξη σχετικών δικαιωμάτων είναι αβέβαιη, είναι σημαντικό να εφαρμοστεί κάποια άδεια απλά και μόνο για λόγους σαφήνειας. Συνεπώς, αν σκοπεύετε να καταστήσετε τα δεδομένα σας διαθέσιμα, θα πρέπει να εφαρμόσετε κάποια άδεια σε αυτά και αν επιθυμείτε τα δεδομένα σας να είναι ανοιχτά, αυτό είναι ακόμα πιο σημαντικό.
Τι είδους άδειες μπορείτε να χρησιμοποιήσετε; Συνίσταται για Ανοιχτά Δεδομένα να χρησιμοποιήσετε μία από τις άδειες που συμμορφώνεται με το “Open Definition” και είναι καταγεγραμμένη ως κατάλληλη για δεδομένα. Η λίστα (μαζί με τις οδηγίες χρήσης) μπορεί να βρεθεί στην ακόλουθη διεύθυνση:
Σύντομες, μονοσέλιδες οδηγίες για την εφαρμογή μίας άδειας για Ανοιχτά Δεδομένα μπορούν να βρεθούν στην ιστοσελίδα του Open Data Commons:
Καταστήστε διαθέσιμα τα Δεδομένα (Τεχνικό «Άνοιγμα»)
Τα {term:Ανοιχτά Δεδομένα} πρέπει να είναι ανοιχτά τόσο από νομικής άποψης, όσο και από τεχνικής. Ειδικότερα, τα δεδομένα πρέπει να είναι διαθέσιμα αυτούσια στο σύνολο τους, αλλά και σε μορφή αναγνωρίσιμη από τις μηχανές.
Available
Τα δεδομένα δε θα πρέπει να τιμολογούνται πάνω από ένα κόστος λογικό για την αναπαραγωγή τους, προτιμότερη, δε, είναι η ελεύθερη λήψη τους από το Διαδίκτυο. Αυτή η τιμολογιακή πολιτική ακολουθείται επειδή η υπηρεσία σας δε θα πρέπει να αναλαμβάνει κανένα επιπλέον κόστος όταν παρέχει δεδομένα για χρήση.
In bulk
Τα δεδομένα θα πρέπει να είναι διαθέσιμα ως ένα πλήρες σύνολο. Εάν διαθέτετε ένα μητρώο που συλλέγεται βάσει καταστατικού, ολόκληρο το μητρώο θα πρέπει να είναι διαθέσιμο για λήψη. Ένα API διαθέσιμο στο Διαδίκτυο ή κάποια παρόμοια υπηρεσία θα μπορούσε επίσης να φανούν χρήσιμα, αλλά σε καμία περίπτωση δεν μπορούν να υποκαταστήσουν την εξολοκλήρου πρόσβαση στο σύνολο δεδομένων.
In an open, machine-readable format
Η επαναχρησιμοποίηση των δεδομένων που ανήκουν στο δημόσιο τομέα δε θα πρέπει να υπόκειται σε περιορισμούς ευρεσιτεχνίας. Ακόμα πιο σημαντικό είναι να φροντίσετε ώστε τα δεδομένα να είναι διαθέσιμα σε μορφή αναγνωρίσιμη από τις μηχανές, κάτι το οποίο επιτρέπει ακόμα μεγαλύτερη επαναχρησιμοποίηση. Συγκεκριμένα, έστω ότι υπάρχουν κάποια στατιστικά στοιχεία δημοσιοποιημένα, σε μορφή PDF (Portable Document Format) που χρησιμοποιείται συχνά για εκτυπώσεις υψηλής ποιότητας. Ενώ αυτά τα στατιστικά στοιχεία μπορούν να αναγνωστούν από τους ανθρώπους, καθίσταται πολύ δύσκολη η προσπέλαση τους από μία μηχανή. Αυτό έχει ως αποτέλεσμα τον έντονο περιορισμό της επαναχρησιμοποίησης των δεδομένων.
Οι τακτικές που πρέπει να ακολουθήσετε συνοψίζεται στα εξής:
- απλά
- γρήγορα
- ρεαλιστικά
Ιδιαίτερα σημαντικό είναι να προσφέρετε άμεσα ακατέργαστα δεδομένα, αντί για άψογα δεδομένα, αλλά σε έξι μήνες.
Υπάρχουν πολλοί διαφορετικοί τρόποι να καταστήσετε τα δεδομένα διαθέσιμα σε άλλους. Το πιο φυσιολογικό στην εποχή του Διαδικτύου είναι η Διαδικτυακή δημοσιοποίησή τους. Υπάρχουν πολλές παραλλαγές σε αυτό το πρότυπο. Στην πιο βασική εκδοχή τους, οι υπηρεσίες καθιστούν τα δεδομένα τους διαθέσιμα μέσω της ιστοσελίδας τους και ένας κεντρικός κατάλογος κατευθύνει τους επισκέπτες στις αντίστοιχες πηγές. Ωστόσο, υπάρχουν και εναλλακτικές προσεγγίσεις.
Όταν η {term:διασυνδεσιμότητα} είναι περιορισμένη ή το μέγεθος των δεδομένων είναι εξαιρετικά μεγάλο, ενδείκνυται η διανομή μέσω εναλλακτικών μορφών. Σε αυτήν την ενότητα, θα συζητηθούν εναλλακτικές προσεγγίσεις που μπορεί να λειτουργήσουν καθοριστικά στη διατήρηση του κόστους σε χαμηλό επίπεδο.
Διαδικτυακές μέθοδοι
Μέσω της υπάρχουσας ιστοσελίδας
Ο πιο οικείος τρόπος για να παρέχετε τα δεδομένα στην ομάδα για το Διαδικτυακό περιεχόμενο είναι σε αρχεία προς λήψη, διαθέσιμα στην ιστοσελίδα. Ακριβώς όπως, επί του παρόντος, προσφέρετε πρόσβαση σε έγγραφα αναφορών, τα αρχεία δεδομένων μπορούν να καταστούν διαθέσιμα με τον ίδιο τρόπο.
Μία δυσκολία που συναντάται σε αυτήν την περίπτωση είναι η δυσχέρεια που συχνά αντιμετωπίζουν οι χρήστες στο να ανακαλύψουν ενημερωμένες πληροφορίες. Το επιπλέον πρόβλημα που προκύπτει με αυτή τη προσέγγιση είναι ότι προστίθεται επιπλέον φόρτος σε αυτούς που προσπαθούν να δημιουργήσουν εργαλεία χρησιμοποιώντας τα δεδομένα σας.
Μέσω τρίτων, συμβαλλόμενων ιστοσελίδων
Πολλά αποθετήρια δεδομένων μετατράπηκαν σε κομβικά σημεία αναφοράς για ορισμένους τομείς. Για παράδειγμα, το pachube.com σχεδιάστηκε για να φέρνει σε επαφή τους ανθρώπους με αισθητήρες, εφόσον επιθυμούν να έχουν πρόσβαση σε δεδομένα που προέρχονται από αυτούς. Άλλες ιστοσελίδες, όπως η Infochimps.com και η Talis.com, επιτρέπουν σε υπηρεσίες του δημοσίου τομέα να αποθηκεύουν μαζικές ποσότητες δεδομένων, χωρίς χρέωση.
Οι Ιστοσελίδες τρίτων συμβαλλομένων μπορεί να αποδειχθούν χρήσιμες. Ο κύριος λόγος που συμβαίνει αυτό είναι ότι έχουν ήδη καταφέρει να συγκεντρώσουν, σε κοινότητες, τα ενδιαφερόμενα άτομα μαζί με πολλά άλλα σύνολα δεδομένων. Όταν και τα δικά σας δεδομένα γίνονται μέρος αυτών των πλατφορμών, αναπτύσσεται μια μορφή θετικού ενδιαφέροντος για αυτά.
Οι πλατφόρμες δεδομένων παρέχουν ήδη την υποδομή που μπορεί να υποστηρίξει τη ζήτηση. Συχνά προσφέρουν αναλύσεις και στατιστικές πληροφορίες σχετικά με τη χρήση τους. Η χρησιμοποίηση τέτοιων πλατφορμών από το δημόσιο τομέα γίνεται, συνήθως, δωρεάν.
Όμως, αυτού του είδους οι πλατφόρμες μπορεί να έχουν διπλό κόστος. Το πρώτο είναι η ανεξαρτησία. Η υπηρεσία μπορεί να επιθυμεί να είναι σε θέση να αποδίδει έλεγχο σε άλλους. Αυτό πολλές φορές είναι πολιτικά, νομικά ή λειτουργικά δύσκολο. Το δεύτερο κόστος μπορεί να είναι η «Ανοιχτότητα». Επιβεβαιώστε ότι η πλατφόρμα δεν κάνει διακρίσεις στις συσκευές που έχουν πρόσβαση σε αυτήν. Οι προγραμματιστές λογισμικού και οι επιστήμονες χρησιμοποιούν πολλά λειτουργικά συστήματα, από smart phones μέχρι υπερυπολογιστές. Όλοι θα πρέπει να είναι σε θέση να έχουν πρόσβαση στα δεδομένα.
Μέσω FTP διακομιστών
Ένας λιγότερο δημοφιλής τρόπος για την παροχή πρόσβασης στα αρχεία σας είναι μέσω του FTP πρωτοκόλλου. Αυτό μπορεί να είναι κατάλληλο αν το κοινό σας είναι τεχνικά καταρτισμένο, όπως προγραμματιστές εφαρμογών και επιστήμονες. Το σύστημα FTP λειτουργεί στη θέση του HTTP, αλλά είναι ειδικά σχεδιασμένο ώστε να υποστηρίζει μεταφορές αρχείων.
Το πρωτόκολλο FTP έχει παγιωθεί και δεν αναπτύσσεται. Σε αντίθεση με την παροχή μίας ιστοσελίδας, η χρήση ενός FTP διακομιστή θυμίζει περισσότερο την όψη των φακέλων στους υπολογιστές. Συνεπώς, αν και είναι κατάλληλο για το σκοπό που χρησιμοποιείται, υπάρχει πολύ χαμηλότερη δυνατότητα για εταιρείες ανάπτυξης Διαδικτυακών εφαρμογών να χρεώσουν επιπλέον για την παραμετροποίησή του.
Ως torrents
Το BitTorrent είναι ένα σύστημα που έχει γίνει οικείο στους φορείς χάραξης πολιτικής λόγω της σύνδεσής του με την καταπάτηση των πνευματικών δικαιωμάτων. Το BitTorrent χρησιμοποιεί αρχεία που λέγονται torrents, και η λειτουργία του βασίζεται στον καταμερισμό του κόστους της διανομής των αρχείων, μεταξύ των ανθρώπων που έχουν πρόσβαση σε αυτά. Οπότε, αντί για διακομιστές που υπερφορτώνονται, σε αυτήν την περίπτωση, αυξάνεται η προσφορά με την αύξηση της ζήτησης. Αυτός είναι ο λόγος που αυτό το σύστημα είναι πολύ δημοφιλές για το διαμοιρασμό ταινιών. Είναι ένας αποτελεσματικός τρόπος για τη διανομή πολύ μεγάλων όγκων δεδομένων.
Ως ένα API
Τα δεδομένα πρέπει να είναι δημοσιοποιημένα μέσω ενός Application Programming Interface (API). Αυτές οι διεπαφές έχουν γίνει πολύ διάσημες. Επιτρέπουν στους προγραμματιστές να επιλέγουν συγκεκριμένες ποσότητες δεδομένων, αντί να τους παρέχουν όλα τα δεδομένα μαζικά, σε μεγάλα αρχεία. Τα APIs είναι συνήθως διασυνδεδεμένα με μία βάση δεδομένων η οποία ενημερώνεται σε πραγματικό χρόνο. Αυτό σημαίνει ότι, όταν οι πληροφορίες παρέχονται μέσω ενός API, μπορεί να είναι κανείς σίγουρος ότι έχει πρόσβαση στα πιο ενημερωμένα δεδομένα.
Η δημοσιοποίηση ακατέργαστων δεδομένων θα πρέπει να είναι πρωταρχικής σημασίας για όλες τις πρωτοβουλίες για τα Ανοιχτά Δεδομένα. Άλλωστε, υπάρχουν κάποια κόστη που σχετίζονται με την παροχή ενός API:
- Η τιμή: Απαιτεί πιο περίπλοκη ανάπτυξη εφαρμογών και συντήρηση από ότι η παροχή απλών αρχείων.
- Οι προσδοκίες: Για να ενθαρρυνθεί η κοινότητα χρηστών ενός σύστηματος, είναι σημαντικό να παρέχεται βεβαιότητα. Όταν κάτι σταματήσει να λειτουργεί σωστά, τότε το κόστος της διόρθωσης δε θα πρέπει να επιβαρύνει την κοινότητα.
Η πρόσβαση σε μαζικά δεδομένα εξασφαλίζει ότι:
- Δεν υπάρχει εξάρτηση από τον αρχικό πάροχο των δεδομένων, με την έννοια ότι, αν συμβεί κάποια αναδιάρθρωση ή ο οικονομικός προυπολογισμός αλλάξει την κατάσταση, τα δεδομένα θα είναι ακόμα διαθέσιμα.
- Ο καθένας μπορεί να έχει ένα αντίγραφο και να το αναδιανείμει. Αυτό μειώνει το κόστος διανομής πέρα από την υπηρεσία που λειτουργεί σαν πηγή και σημαίνει πως δεν υπάρχει μοναδικό σημείο αποτυχίας.
- Οι άλλοι μπορούν να αναπτύξουν τις δικές τους υπηρεσίες χρησιμοποιώντας τα δεδομένα, επειδή έχουν τη βεβαιότητα ότι δε θα τα στερηθούν.
Η προσφορά μαζικών δεδομένων επιτρέπει σε τρίτους να τα χρησιμοποιήσουν πέρα από τον αρχικό τους σκοπό. Για παράδειγμα, επιτρέπει τη μετατροπή σε νέα μορφή, τη διασύνδεση με άλλες πηγές ή άλλες εκδόσεις και την αποθήκευσή τους σε περισσότερες τοποθεσίες. Ενώ η νεότερη έκδοση των δεδομένων μπορεί να καταστεί άμεσα διαθέσιμη από το ΑΡΙ, τα ακατέργαστα δεδομένα θα πρέπει να είναι μαζικά διαθέσιμα ανά τακτά χρονικά διαστήματα.
Παράδειγμα αποτελέι η περίπτωση της ευρωπαικής στατιστικής υπηρεσίας (Eurostat) που προσφέρει μαζική λήψη 4000 αρχείων δεδομένων. Ενημερώνεται δύο φορές την ημέρα, ενώ παρέχει τα δεδομένα σε μορφή Tab-separated values (TSV), περιλαμβάνοντας και έγγραφα σχετικά με την υπηρεσία λήψης και τα ληφθέντα αρχεία.
Ένα άλλο παράδειγμα αποτελεί το District of Columbia OCTO’s Data Catalogue που επιτρέπει στα δεδομένα να ληφθούν σε CSV και XLS μορφή και επιπλέον σε ζωντανή ρόη.
Καταστήστε τα δεδομένα εύκολα εντοπίσιμα
Τα «Ανοιχτά Δεδομένα» δεν είναι τίποτα χωρίς τους χρήστες. Χρειάζεται να φροντίσετε ώστε το πρωτογενές υλικό να μπορεί να εντοπιστεί από τους χρήστες. Αυτή η ενότητα θα καλύψει κάποιες εναλλακτικές προσεγγίσεις.
Το πιο σημαντικό είναι να παρέχετε έναν ουδέτερο χώρο, που μπορεί να αντέξει τόσο σε αντικρουόμενες πολιτικές μεταξύ των υπηρεσιών, όσο και σε σκαμπανεβάσματα του προϋπολογισμού. Τα όρια των δικαιοδοσιών, είτε τομεακά είτε γεωγραφικά, μπορεί να καταστήσουν δύσκολη την συνεργασία. Ωστόσο, υπάρχουν αξιοσημείωτα πλεονεκτήματα στη συνένωση των δυνάμεων. Όσο πιο εύκολο είναι για τρίτους να ανακαλύψουν κάποια δεδομένα, τόσο γρηγορότερα θα αναπτυχθούν νέα και χρήσιμα εργαλεία.
Υπάρχοντα εργαλεία
Υπάρχουν αρκετά εργαλεία που είναι διαθέσιμα στο Διαδίκτυο και είναι ειδικά σχεδιασμένα ώστε να κάνουν τα δεδομένα πιο εντοπίσιμα.
Ένα από τα εξέχοντα είναι το CKAN.net. Το CKAN είναι αρκτικόλεξο του Comprehensive Knowledge Archive Network και αποτελεί τον κατάλογο όλων των συνόλων δεδομένων στον κόσμο. Η ιστοσελίδα καθιστά δυνατό για τους προγραμματιστές εφαρμογών να βρούν εύκολα το υλικό που αναζητούν.
Επιπλέον, υπάρχουν δεκάδες ειδικοί κατάλογοι για διαφορετικούς τομείς και περιοχές. Πολλές επιστημονικές κοινότητες έχουν δημιουργήσει ένα σύστημα καταλόγου για τα πεδία τους, δεδομένου ότι οι πληροφορίες απαιτούν συχνά δημοσιοποίηση.
Για τις κυβερνήσεις
Όπως αποδείχθηκε, είναι ορθολογική πρακτική για μια υπηρεσία να δημιουργήσει έναν κατάλογο για τα κυβερνητικά δεδομένα. Όταν θα καθιερωθεί ο κατάλογος, φροντίστε να οργανώσετε μία δομή που να επιτρέπει στα τμήματα να διατηρούν εύκολα τις δικές τους πληροφορίες ενημερωμένες.
Αντισταθείτε στον πειρασμό να αναπτύξετε εκ του μηδενός λογισμικό που να υποστηρίζει τον κατάλογο. Υπάρχουν πολλά δωρεάν και ανοιχτά πακέτα λογισμικού που υιοθετήθηκαν ήδη από πολλές δεκάδες κυβερνήσεων. Η επένδυση σε μία άλλη πλατφόρμα, θα είναι σπατάλη πόρων.
Υπάρχουν κάποια στοιχεία που οι περισσότεροι κατάλογοι Ανοιχτών Δεδομένων δεν έχουν. Το πρόγραμμά σας θα μπορούσε να εξετάσει τα ακόλουθα:
- Προσφέρετε ένα τρόπο ώστε να διευκολύνετε τον ιδιωτικό τομέα και τις κοινότητες να προσθέσουν τα δεδομένα τους. Μπορεί να αξίζει να σκεφτείτε τον κατάλογο ως «κατάλογο της περιφέρειας», παρά σαν κατάλογο της «περιφερειακής διοίκησης».
- Διευκολύνετε τη βελτίωση των δεδομένων, επιτρέποντας τα παράγωγα υποσύνολα να καταχωρούνται στον κατάλογο. Για παράδειγμα, μπορεί κάποιος να διαθέτει διευθύνσεις γεωκωδικοποίησης και να επιθυμεί να μοιραστεί αυτά τα δεδομένα με όλους. Αν δημοσιεύετε μια και μοναδική έκδοση των συνόλων δεδομένων, αυτές οι βελτιώσεις παραμένουν «θαμμένες».
- Παραμείνετε ανεκτικοί αν τα δεδομένα σας εμφανίζονται αλλού. Αυτό σημαίνει ότι το περιεχόμενο μπορεί να επαναχρησιμοποιηθεί από άλλες κοινότητες, οι οποίες ενδιαφέρονται για αυτό. Αν διαθέτετε δεδομένα σχετικά με τον έλεγχο της στάθμης των ποταμών, τότε τα δεδομένα σας μπορεί να εμφανιστούν και σε κατάλογο που διατίθεται από υδρολόγους.
- Βεβαιωθείτε ότι η πρόσβαση είναι δίκαιη. Μην δημιουργείτε πλεονεκτήματα στο επίπεδο της πρόσβασης για υπαλλήλους ή μόνιμους ερευνητές. Αυτό θα προκαλέσει δυσαρέσκεια και τελικά θα υπονομεύσει τους στόχους που επιθυμείτε να επιτύχετε.
Για την κοινωνία των πολιτών
Να είστε πρόθυμοι να αναπτύξετε ένα συμπληρωματικό κατάλογο για μη κυβερνητικά δεδομένα.
Είναι σπάνιο κυβερνητικές πηγές να συνδέονται με ανεπίσημες ή με μη εξουσιοδοτημένες πηγές. Οι υπεύθυνοι έχουν πολλές φορές επωμιστεί μεγάλη προσπάθεια για να διασφαλίσουν οτι δεν θα υπάρξει πολιτικό κόστος από κακοδιαχείριση η υπέρμετρη εμπιστοσύνη στα δεδομένα αυτά.
Εκτός αυτού, οι κυβερνήσεις είναι απίθανο να επιθυμούν να υποστηρίξουν δραστηριότητες που αναμειγνύουν τις πληροφορίες τους με πληροφορίες από επιχειρήσεις. Οι κυβερνήσεις, δικαιωματικά, παραμένουν σκεπτικές όσον αφορά τα κίνητρα κέρδους. Ως εκ τούτου, ένας ανεξάρτητος κατάλογος για κοινότητες, επιχειρήσεις και άλλες ομάδες μπορεί να αποδειχθεί χρήσιμος.
- Improve this page Edit on Github Help and instructions
- Translate this page Translation guide
-
Donate
If you have found this useful and would like to support our work please consider making a small donation.