Glossario

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 
API [Permalink]

Application Programming Interface. Nel caso dei dati, queste sono solitamente una via per offrire i dati del fornitore a programmi o {apps} in modo da essere letti direttamente via web. L’app invia la query API chiedendo il dato specifico da usare per la relativa esigenza, es. il tempo di attesa del prossimo autobus in una fermata particolare. Questo permette all’app di utilizzare i dati senza scaricare l’intero dataset, di salvare banda e di garantire che il dato utilizzato è il più aggiornato disponibile.

Anonimato [Permalink]

vedi anonimato.

Anonimizzazione [Permalink]

L’elaborazione dei dati che comprende informazioni personali in modo che le persone non siano più identificabili dai dati risultanti. L’anonimizzazione consente ai dati di essere pubblicati senza violare il principio della protezione dei dati. Le tecniche principali sono l’aggregazione e de-identificazione. Si deve prestare attenzione per evitare la fuga di dati che si potrebbe tradurre nel fatto che venga compromessa la vita privata delle persone. {UKAN} studia le migliori pratiche in anonimizzazione dei dati.

App / Applicazione [Permalink]

Un pezzo di software (abbreviazione per ‘app’), disegnato in particolar modo per essere eseguito via web o da un dispositivo mobile o piattaforme analoghe. Una app è in grado di collegarsi verso grandi banche data e quindi essere un potente modo per consuming dati aperti, che possono essere {real-time}, personalizzati, e (attraverso l’uso di un telefono cellulare dotato di GPS, fornire informazioni specifiche sulla posizione. Le applicazioni di crowdsourcing possono essere anche usate per costruire o migliorare dataset.

App challenge [Permalink]

Una formula particolare di A popular form of community engagement usata da chi pubblica dati per invitare gli sviluppatori a creare application che risolvono un problema o che forniscono un servizio di pubblicazione dati.

Application Programming Interface - API [Permalink]

Un modo attraverso cui un software è in grado di comunicare con un altro. Le API possono essere interpretate come i termini attraverso cui uno sviluppatore invia istruzioni fra programmi.

Attribuzione [Permalink]

Il riconoscimento dell’origine dei dati durante l’utilizzo o ri-pubblicazione. Una licenza dati permette che i dati siano utilizzati con l’obbligo di attribuire la sorgente. I dati soggetti a questa restrizione possono ancora essere considerati open data secondo i termini della Open Definition.

Big Data [Permalink]

Una collezione di dati così enorme che non può essere archiviata, trasmessa o elaborata con i sistemi tradiazionali. La crescita della disponibilità di dati e la necessità di elaborarli (es. grande quantità di dati meteo o di dati scientifici ), ha portato allo sviluppo di tecnologie informatiche specializzate, architetture e linguaggi di programmazione.

BitTorrent [Permalink]

BitTorrent è un protocollo per distribuire il peso della banda nel trasferimento di file particolarmente grandi fra computer che a loro volta partecipano ad offrirne il download. Piuttosto che scaricare un file da una sorgente specifica, BitTorrent permette un download fra pari.

Bulk [Permalink]

L’insieme completo di un set di dati. I dati sono disponibili in massa (bulk) se l’intero insieme può essere scaricato per ulteriori elaborazioni sull’hardware dell’utente. I bulk download devono quasi sempre essere offerti in open data, ma può essere poco pratico in caso di {big data} o di dati in tempo reale.

CKAN [Permalink]

Una piattaforma {open-source} per creare portale di dati creata e mantenuta da Open Knowledge. CKAN è utilizzata come la piattaforma di pubblicazione ufficiale in circa 20 nazioni e diverse altre realtà locali, comunità, gruppi di ricerca e molti altri portale per i dati. Di particolare interessa le funzionalità di configurazione dei metadati, una interfaccia web user-friendly per pubblicatori ed utenti di dati, anteprime dei dati, livelli di autorizzazione basati su organizzazioni e {APIs} per accedere a tutte le funzioni ed anche i dati.

CSV [Permalink]

‘Comma-separated values’ (valori separati da virgola) e`un formato standard per i dati tabellari. I dati sono rappresentati in un file di testo dove ogni record corrisponde ad una nuova riga i cui valori sono separati da una virgola per ogni colonna. Si tratta di un formato aperto particolarmente semplice da [utilizzare]{../consume} e ampiamente utilizzato per pubblicare dati aperti.

Civic Hacking [Permalink]

La creazione di strumenti e di comunità, generalmente online, che hanno particolare interesse a risolvere problemi sociali o civici. Gli esempi possono essere da strumenti che aiutano gli utenti ad incontrare persone che la pensano allo stesso modo o hanno interessi particolari, reporistiche di infrastrutture rotte da segnalare all’ente pubblico locale, o la collaborazione per eliminare rifiuti nel proprio quartiere. A livello locale l’open data è particolarmente utile per i progetti di hacking civico.

Cloud [Permalink]

I dati memorizzati ‘nel cloud’ sono gestiti da una azienda di hosting, alleggerendo così al titolare dei dati la gestione dell’archiviazione. I dati, invece che essere memorizzati su una singola macchina, possono essere conservati o spostati fra più macchine in luoghi diversi. Il proprietario dei dati e gli utenti non hanno bisogno di conoscere i dettagli del funzionamento. La società di hosting è responsabile della messa a disposizione e della accessibilità via internet.

Codice sorgente [Permalink]

File di codice informatico scritti da programmatori che vengono utilizzati per produrre un pezzo di software. Il codice sorgente è di solito convertito o ‘compilato’ in una forma che può essere eseguita dal computer dell’utente. L’utente pertanto non vede mai il codice sorgente originale, a meno che questo non venga pubblicato come open source.

Collezioni di dati [Permalink]

I dataset sono creati raccogliendo dati in diversi modi: manualmente o da misure automatiche (es. dati meteo), indagini (dati del censimento), registrazioni di decisioni (dati di bilancio) o transazioni in uscita (dati della spesa), aggregazioni da registrazioni diverse (dati del crimine), modelli matematici (proiezioni di popolazione), ecc..

Connettività [Permalink]

Connettività riguarda la possibilità per le comunita` di collegarsi a Internet, in particolar modo al World Wide Web.

Conoscenza - Knowledge [Permalink]

La somma delle informazioni di una persona - o dell’umanità - delle capacità di comprendere il mondo. Vedi anche dati

Conversione [Permalink]

Il processo automatico di letture dei dati da un formato file per la scrittura degli stessi in un formato diverso, rendendo così i dati accessibili a una gamma più ampia di applicazioni.

Copyright / Diritto d'autore [Permalink]

Un diritto legale sviluppato dove la proprietà intellettuale (es. un libro) appartiene al creatore dell’opera. Mentre i dati singoli (fatti) non possono avere un diritto d’autore, una banca dati puo` essere coperto dal copyright, proteggendo la selezione e la disposizione dei dati al suo interno. All’interno dell’Unione Europea una banca dati può essere protetta attraverso un diritto sulla banca dati (database rights) come riconoscimento del lavoro svolto per ‘ottenere’ i dati. Chi detiene un copyright può utilizzare una licenza per permettere ad altre persone il riuso del materiale protetto, soggetto però a specifiche restrizioni.

Corruzione [Permalink]

Abuso di posizioni o di fondi pubblici come, ad esempio, essersi appropriati di denaro o estorcere tangenti, sostenendo spese irragionevoli, favorendo illecitamente gli amici o particolari gruppi in servizi pubblici o nomine pubbliche, ecc.. Open Data e, più in generale, l’open government è uno strumento importante nella lotta contro la corruzione.

Costo marginale [Permalink]

Si tratta del costo aggiuntivo sostenuto fornendo una singola copia di una risorsa, ad esempio, dati. Per i dati da aprire secondo la Open Definition, essi devono essere caricati non oltre il costo marginale. Qualora i dati sono disponibili per il download su Internet il costo marginale di solito è pari a zero. Ci può essere un piccolo costo marginale in casi eccezionali. Ad esempio le dimensioni dei dati necessitano di essere messi su un disco pubblicato. Confronta cost recovery.

Creative Commons [Permalink]

Una organizzazione no-profit creata nel 2001 che promouove il ri-uso di contenuti e la pubblicazione attraverso una serie di licenze standard aperte (alcune delle quali includono la clausola non commerciale, che possono essere utilizzate per rilasciare contenuti per il ri-uso assieme ad una chiara spiegazione del loro significato.

Crowdsourcing [Permalink]

Si tratta di una raccolta di molti dati in maniera collaborativa. Il lavoro viene diviso in tanti piccoli compiti che possono essere svolti da volontari. Alcuni esempi: Wikipedia è una enciclopedia basata sul crowdsourcing, Galaxy Zoo è un recente esempio di raccolta di dati scientifici dove si chiede ai volontari non-esperti di classificare le galassie in base a come a loro appaiono. NOVAM era un servizio che permetteva di verificare o correggere le posizioni delle fermate degli autobus in Inghilterra. Il crowdsourcing ha corretto circa 18.000 posizioni.

DOI [Permalink]

Digital Object Identifier, un identificatore di un oggetto digitale (come un documento o dataset) che è stato assegnato da un ente centrale di registrazione e che quindi ne garantisce globalmente un identificatore univoco: non esistono due oggetti digitali nel mondo che hanno lo stesso DOI.

Data wrangler [Permalink]

Una persona che converte dei dati in una forma utilizzabile in modo che possano essere facilmente utilizzati con strumenti automatizzati o semi-automatici. Il data wrangler dei dati può comprendere una pulizia più approfondita dei dati.

Database / Banca Dati [Permalink]

(i) Una qualsiasi collezione di dati può essere considerata un database. In questo senso la parola è anche sinomimo di dataset.

(ii) Un sistema sofware per elaborare e gestire dati, che include funzionalità per l’estensione o l’aggiornamento o la trasformazione e l’interrogazione di dati. Esempi sono il prodotto {open-source} PostgreSQL, e il software proprietario Microsoft Access.

Dataset - insieme di dati [Permalink]

Una qualsiasi collezione di dati organizzata. ‘Dataset’ è un termine flessibile e può fare riferimento o ad una intera banca dati, o ad un foglio di calcolo o ad altri dati su file, oppure ad un insieme correlato di risorse di dati.

Dati [Permalink]

I dati possono essere pensati come dichiarazioni atomiche di fatti non elaborati. Ci si riferisce molto spesso a raccolte sistematiche di informazioni numeriche in tabelle di numeri, come i fogli di calcolo o i database. Quando i dati sono strutturati e presentati in modo da essere utili e pertinenti per uno scopo particolare, diventano informazioni disponibili per essere capiti dalle persone. Vedi anche conoscenza.

Dati della Pubblica Amministrazione - Government Data [Permalink]

Il lavoro della pubblica amministrazione consiste nel raccogliere una grande quantità di dati, molti dei quali non sono confidenziali (dati economici, demografici, di spesa, dei crimini, di trasporto, ecc..). Il valore di ciascuno di questi dati può essere migliorato se questi sono open data, quindi liberandoli per ogni tipo di ri-uso: impreditoriale, di ricerca, ad uso della società civile, per i giornalisti, ecc..

Dati della ricerca - research data [Permalink]

La ricerca sperimentale nel campo delle scienze e delle scienze sociali produce grandi quantità di dati. La gestione dei dati di ricerca (RDM) è una disciplina emergente che ne individua le migliori pratiche. Tradizionalmente i dati sono mantenuti dai ricercatori e resi pubblici solo alla fine sotto forma di pubblicazione scientifica (per esempio un paper di analisi dati). L’Open Science invece propone che i dati debbano essere pubblicati per aumentare la verificabilità del lavoro e per consentire di essere utilizzati in altre ricerche. Lo spirito di collaborazione scientifica aperta richiede che la pubblicazione dei dati avvenga ancora nelle prime fasi del progetto, ma per ottenere questo occorre che la cultura della ricerca subisca dei cambiamenti affinchè questa diventi una pratica diffusa.

Dati di Trasporto [Permalink]

I percorsi del trasporto pubblico, le tabelle orarie di attesa e i dati in tempo reale sono dati di forte valore ma difficilmente diventano open data. Anche quando vengono pubblicati, spesso i dati delle autorità o aziende di trasporto vengono rese disponibili con formati non compatibili, il che rende difficile per terzi fornire informazioni di trasporto integrato. I lavori per la standardizzazione e per rendere i dati aperti sono attualmente in corso.

Dati grezzi - Raw data [Permalink]

I dati originali, in formato {machine-readable}, utilizzati in una qualsiasi applicazione, visualizzazione, ricerca scientifica o interpretazione, ecc..

Dati strutturati [Permalink]

Tutti i dati hanno alcune forme di struttura, ma ‘dati strutturati’ si riferisce ai dati in cui la relazione strutturale tra gli elementi è esplicita nel modo in cui i dati sono memorizzati su un computer. XML e JSON sono i formati più comuni che permettono di rappresentare molte tipologie di struttura. Ad esempio, la rappresentazione interna di formati di file di elaborazione testi o PDF PDF rappresentano la posizione delle entità nella pagina e non la loro struttura logica, rendendo così difficile l’estrazione automatica dei contenuti.

Dati trapelati / Data leakage [Permalink]

Se i dati personali non sono stati anonimizzati perfettamente, può essere possibile, mettendo insieme pezzi (magari provenienti da altre fonti) di ricostruire l’identità o alcune informazioni personali. I dati personali, che non avrebbero dovuto essere pubblicati (vedi protezione dei dati, posso essere detti ‘trapelati’ dalla loro ‘anonimizzazione’. Altri tipi di dati riservati possono essere soggetti a perdite, per esempio, per scarse misure di [sicurezza sui dati] (../data-security/). Vedi de-identificazione.

Dimensione [Permalink]

Una tabella ordinaria o un foglio di calcolo possono rappresentare facilmente due dimensioni di dati: ogni punto di dati ha una riga e una colonna. Molti dati reali hanno più dimensioni, tuttavia, per esempio, un dataset sulla temperatura della superficie terrestre varia con la posizione e il tempo (due coordinate sono necessarie per specificare la posizione sulla terra, ad esempio latitudine e longitudine, e uno per specificarne il tempo).

Direttiva Europea PSI [Permalink]

La Direttiva nel ri-uso dell’informazione del settore pubblico, 2003/98/EC. “tratta come gli enti pubblici dovrebbero migliorare il riutilizzo delle proprie risorse informative.” Azioni legislative - direttiva PSI

Diritti di proprietà intellettuale [Permalink]

Monopoli concessi a individui per creazioni intellettuali.

Diritto sulle banche dati [Permalink]

Un diritto per impedire agli altri di estrarre e riusare contenuti da una banca dati. Questo diritto esiste nella maggior parte delle giurisdizioni europee.

Engagement dei cittadini [Permalink]

Nel coinvolgimento attivo del pubblico nelle politiche e nei processi decisionali, l’engagement dei cittadini è un obiettivo centrale del open government. Il fine è quello di migliorare il processo decisionale e di ottenere o mantenere il consenso e il sostegno dei cittadini. Gli open data sono uno strumento essenziale per garantire un engagement.

Formato Aperto [Permalink]

Un formato di file la cui struttura è definita seguendo uno standard, sorvegliato e pubblicato ad un ente esperto non commerciale. Un file in un formato aperto offre la garanzia che può essere letto correttamente da una serie di software diversi o utilizzato per trasmettere informazioni fra loro. Confronta con proprietario.

Formato di file [Permalink]

La descrizione di come un {file} è rappresentato sul disco di un computer. Il formato generalmente corrisponde all’ultima parte del nome del file (‘estensione’), es. un archivio in un file in un formato CSV potrebbe essere chiamato lista-delle-scuole.csv. Il formato di file fa riferimento al formato interno del file, non come invece mostrato rispetto agli utenti. Es. file CSV e {XLS} hanno una struttura molto diversa, ma appaiono molto simili se non identici se aperti in un foglio di calcolo come Excel.

Freedom of Information - libertà di informazione [Permalink]

Noto anche come FOI. Un requisito di legge, come ad esempio il Freedom of Information Act 2000 in Inghilterra o il Right to Information Act 2005 in India, che prevede che enti pubblici forniscano, su richiesta, i dati in loro possesso ai cittadini, a meno che non si applichi una deroga specifica come nel caso dei dati che sono riservati. Il fatto che le informazioni debbano essere fornite ai sensi delle legge di un FOI non implica però che questi poi siano open data, o redistribuibili con una licenza aperta, ecc…

GIS [Permalink]

Geographical Information System - Sistemi Informativi Geografici, in qualsiasi sistema informatico creato per leggere, rappresentare, analizzare e manipolare dati geografici.

GPS [Permalink]

Il GPS - Global Positioning System, è un sistema satellitare che permette di ottenere un’ informazione esatta di una posizione attraverso un dispositivo in grado di riceverla (ormai incluso negli smartphone moderni). Il GPS è uno strumento prezioso in molte applicazioni basate sulla localizzazione, permettendo agli utenti funzionalità come, ad esempio, il calcolo di percorsi o le informazioni meteo della posto dove ci si trova. La tecnologia GPS è inoltre un esempio lampante di open data di successo, in quanto è gestito dal governo degli Stati Uniti ed è fornito gratuitamente a chiunque abbia un ricevitore.

GeoJSON [Permalink]

Un dialetto del JSON con caratteristiche specifiche per descrivere dati geografici e pertanto anche un popolare formato per il loro interscambio.

Geodata, geodati / Dati geografici [Permalink]

Un qualsiasi dataset dove i dati includono informazioni di localizzazione come, ad esempio, la latitudine o longitudine di un’altra codifica standard. Mappe, percorsi di trasporto, dati ambientali, dati catastali e molti altri tipi di dati possono essere pubblicati come geodati.

Gestione dei dati [Permalink]

Le politiche, le procedure e le scelte tecniche utilizzate per gestire i dati nel loro intero ciclo di vita dalla collezione dei dati all’archiviazione, preservazione e uso. Un politica di gestione dei dati deve tenere conto di tutte le necessità per la qualità dei dati, la disponibilità, la protezione dei dati e la preservazione dei dati, ecc…

Giornalismo dai dati / Data journalism [Permalink]

La capacità di lavorare con i dati è una parte sempre più importante nel bagaglio di conoscenza di un giornalista. Le competenze necessarie per la ricerca e per raccontare una buona storia basata sui dati includono la capacità di sapere cercare di dati rilevanti, la pulizia dei dati, l’esplorazione o estrazione dei dati per capire quale storia si sta raccontando, e la creazione di buone visualizzazioni

Hackathon [Permalink]

Un evento, solitamente di uno o due giorno, dove sviluppatori di software, esperti di settore ed altro si incontrano per creare applicazioni,visualizzazioni e prototipi con lo scopo di risolvere problemi di un particolare dominio, facendo solitamente un uso massiccio di dati. Le hackathon che si focalizzano su una particolare raccolta di dati sono una possibile forma di coinvolgimento della comunità da parte dei pubblicatori di dati. L’hackathon è un formato popolare nella comunità open source.

Host [Permalink]

Una società che memorizza i dati di un cliente sui propri computer (gli host) e lo rende disponibile su internet. Un servizio di hosting quindi presenta un computer del provider che memorizza dati e a cui si accede attraverso la rete. Vedi anche SaaS.

Human Readable [Permalink]

I dati sono in un formato facilmente leggibile da una persona. Alcuni formati human-readable, come il PDF, non sono {macchine-readable} in quanto non sono dati strutturati, e.s. la rappresentazione di dati su un disco non rappresenta la reale relazione fra i dati presenti.

IP right [Permalink]

Vedi diritti di proprietà intellettuale.

Identificatore [Permalink]

Il nome di un oggetto o concetto in un database. Un identificatore può essere il nome dell’oggetto attuale (es ‘Londra’ o ‘W1 1AA’, un codice postale di Londra), o una parola che descrive il concetto (‘popolazione’), o un identificatore arbitrario come ‘XY123’ che ha senso solo in contesto in un particolare set di dati. L’attenta scelta degli identificatori utilizzando standard pertinenti può facilitare l’integrazione fra dati. Vedi linked data.

Information Asset Register - Informazioni sul registro dei beni [Permalink]

Gli IAR sono registri appositamente costituiti per acquisire e organizzare i meta-dati su grandi quantità di informazioni detenute da amministrazioni ed enti pubblici. Uno IAR completo include i database, i vecchi insiemi di file, i recenti file elettronici, le raccolte di dati statistici, di ricerca e così via.

La direttiva [EU PSI Directive](../eu-psi-directive/) riconosce l'importanza dei registri di attività per i potenziali riutilizzatori di informazioni pubbliche. Si richiede agli Stati membri di fornire elenchi, portali o qualcosa di simile. Essa afferma:

   Gli strumenti che aiutano i potenziali riutilizzatori a trovare documenti disponibili
    per il riutilizzo e le condizioni di riutilizzo può facilitare
    notevolmente l'utilizzo transfrontaliero di documenti del settore pubblico.
    Gli Stati membri dovrebbero pertanto garantire che le disposizioni pratiche
    sono in atto per aiutare i riutilizzatori nella ricerca di documenti
    disponibili per il riutilizzo. Elenchi di contenuti, preferibilmente accessibili online per i documenti principali           (documenti che sono ampiamente riutilizzati o che hanno il potenziale per essere ampiamente riutilizzati), e il
    portale di siti che sono collegati a elenchi di contenuti decentralizzati sono esempi
    di tali modalità pratiche.

Gli IAR possono essere sviluppati in modi diversi. Dipartimenti governativi possono sviluppare i propri IAR e questi possono essere legati alla IAR nazionale. IAR può includere informazioni detenute da enti pubblici, ma che ancora non sono state - e forse non saranno - proattivamente pubblicate. Di conseguenza, essi consentono al pubblico di identificare le informazioni che esistono e che possono essere richieste.

Per il pubblico che fa uso di questi IAR è importante che tutti i registri di informazione presenti siano il più completi possibile, al fine di poter avere fiducia che i documenti possano essere trovati. L'incompletezza di alcuni registri è un problema significativo in quanto crea un grado di inaffidabilità che puo` scoraggiare alcuni dall' utilizzare i registri per la ricerca di informazioni.

È essenziale che i metadati negli IAR siano globali in modo che i motori di ricerca possano funzionare in modo efficace. Nello spirito dei dati delle amministrazioni aperte, gli enti pubblici dovrebbero mettere gli IAR a disposizione del pubblico come dati grezzi sotto una licenza aperta in modo che gli hacker civici possano utilizzare i dati come, ad esempio, la costruzione di motori di ricerca e interfacce utente.
Informazione [Permalink]

Una collezione strutturata di dati presentata in una forma per cui le persone sono in grado di capirla ed elaborarla. L’informazione è convertita in conoscenza quando è contestualizzata con il resto della conoscenza di una persona o di un modello del mondo.

Informazione del settore pubblico [Permalink]

Informazione raccolta o controllata dal settore pubblico.

Integrazione fra dati [Permalink]

Generalmente qualsiasi uso interessante dei dati avviene dalla combinazione con differenti sorgenti. Per permettere questo è necessario garantire che i diversi dataset sia compatibili: questi devono usare gli stessi nomi per gli oggetti, le stesse unità di misura o coordinate ecc… Se la qualità dei dati è buona allora questo processo di integrazione può essere semplice, ma se non lo è, allora è probabile che sarà arduo. Un obbiettivo dei linked data è di rendere automatica, o quasi, l’integrazione fra dati. I non-{open data} sono una barriera all’integrazione fra dati, come quando si ottengono i dati, usando molto tempo per avere i permessi necessari per utilizzarli che deve poi essere rifatto per ogni nuovo dataset.

Internet [Permalink]

Una collezione strutturata di dati presentati in una forma che le persone sono in grado di capire ed elaborare. L’informazione è convertita in conoscenza quando questa è contestualizzata con il resto della conoscenza di una persona e del modello del mondo.

JSON [Permalink]

JavaScript Object Notation, un semplice ma potente sistema di formattazione di dati. È in grado di descrivere dati strutturati complessi, è altamente {machine-readable} e allo stesso modo ragionevolmente{human-readable}, ed è indipendente dalla piattaforma e dal linguaggio di programmazione. Per questo motivo è diventato un formato molto popolare di scambio di dati fra programmi e sistemi.

KML [Permalink]

Keyhole Markup Language, un formato aperto basato su XML- per i geodato. KML è stato ideato per il Keyhole Earth Viewer, successivamente acquistato da Google e rinominato Google Earth, ma successivamente, dal 2008 Open Geospatial Consortium lo ha reso uno standard internazionale

Larghezza banda [Permalink]

La velocità con cui i dati possono essere trasferiti da un computer all’altro. Dato che la larghezza banda è limitata, le applicazioni tendono a scaricare solo la quantità minima di dati necessari per soddisfare le richieste dell’ utente.

Le cinque stelle dell'open data [Permalink]

Un sistema di classicazione degli open data proposto da Tim Berners-Lee, creatore del World Wide Web. Il punteggio massimo è di cinque stelle, i dati devono essere (1) disponibili su Web con una licenza aperta, (2) essere in formato strutturato, (3) essere in un formato di file non-proprietario, (4) fare uso di proprietario come identificatori (vedi anche RDF), (5) includere link ad altre sorgenti dati (vedi linked data). Per ottenere un punteggio di 3 stelle devono essere sodisfatte tutte le condizioni dalla (1) alla (3), ecc.. L’Open Definition richiede dati con punteggio a 3 stelle per essere definiti come open data, non è invece necessario il requisito RDF o il linking. Questo permette di avere dati aperti di ampia varietà e da diverse fonti, senza il lavoro di modellazione delle informazioni di linking (collegamento).

Legislatura sulla protezione dei dati [Permalink]

La legislatura sulla protezione dei dati non riguarda i dati ma il diritto dei cittadini di vivere senza la paura che informazioni della loro vita privata siano resi pubblici. La legge protegge la privacy (come informazione sullo status economico personale, di salute e di posizione politica) e altri diritti come quello della libertà di movimento e di assemblea. Ad esempio, in Finlandia, un sistema di abbonamento per il trasporto pubblico è stato utilizzato per registrare tutti gli spostamenti. Ciò ha sollevato un dibattito dal punto di vista della libertà di circolazione e la raccolta dei dati della carta di viaggio è stata abbandonata in base alla legislazione sulla protezione dei dati.

Licenza [Permalink]

Uno strumento legale attraverso cui chi detiene un copyright può concedere alcuni diritti sull’opera protetta. Dati e contenuti sono aperti se accompagnati da una esplicita licenza conforme alla Open Definition. Sono disponibili diverse licenze aperte, fra quelle Creative Commons c’è la CC-BY che richiede la sola attribuzione.

Licenza Share-alike (condividi allo stesso modo) [Permalink]

Una licenza che richiede a chi genera contenuti da un prodotto di rilasciare i derivati con le stesse condizioni dell’orginale.

Linked data [Permalink]

Una forma di rappresentazione dei dati in cui ogni identificatore è una {URI} http:/…, utilizzando, ove possibile, elenchi standard di identificatori (vedi vocabolario), e dove dataset includono link di riferimento set di dati degli stessi oggetti. Uno degli obiettivi principali è quello di rendere automatica l’integrazione fra dati, anche per grandi insiemi di dati. I Linked Data sono di solito rappresentati utilizzando RDF. Vedi anche cinque stelle degli open data e triple store

Machine readable [Permalink]

I dati in un formato per i dati - come CSV, JSON, XML, ecc - possono essere automaticamente letti e processati da un computer. I dati machine-readable devono essere presentati come formato per i dati. Confronta con human-readable.

Metadati [Permalink]

Informazioni riguardo un dataset come il suo nome e descrizione, metodi della collezione, autore o pubblicatore, area e periodo storico coperto, licenza, data e frequenza di rilascio, ecc… È essenziale pubblicare dati con adeguati metadati per aiutare sia la reperibilità che la fruibilità dei dati.

Mixaggio delle licenze [Permalink]

Se il Progetto X pubblica contenuti e vuole includere quelli del Progetto Y, è necessario che i permessi della licenza di Y ne permettano il ri-uso con quelli della licenza di X. Ad esempio, un contenuto rilasciato come non-commerciale non può essere incluso in Wikipedia, in quanto la licenza aperta usata da quest’ultima abilita il riuso a fini commerciali che non può essere invece garantito da dati rilasciati con vincolo non-commerciale. Questo è un esempio di fallimento del mixagio delle licenze.

Movimento open [Permalink]

Il movimento open cerca di lavorare verso soluzioni dei molti dei problemi più urgenti del mondo in uno spirito di trasparenza, collaborazione, il riutilizzo e il libero accesso. Esso comprende l’open data, l’open government, l’open development, l’open science e molto altro. I processi partecipativi, la condivisione della conoscenza e i suoi output, il software open source sono fra i suoi strumenti principali. La definizione specifica di “open”, basata su dati, conoscenze e contenuti, è stabilita dalla Open Definition.

Non commerciale [Permalink]

Una restrizione, come parte di una licenza, dove il contenuto non può essere liberamente ri-usato per fini ‘commerciali’. Contenuti o dati soggetti a restrizioni non-commerciali, in accordo con la Open Definition, non sono open. Una tale restrizione riduce il valore economico a causa di problemi di mixaggio di licenze, e spesso esclude anche più di quanto previsto (es non è chiaro se gli usi educativi siano ‘commerciali’). L’intento di una clausola non-commerciale può essere gestita meglio dal requisito di condivisione allo stesso modo.

ODRA [Permalink]

Open Data Readiness Assessment, è un framework creato da World Bank per valutare le opportunità, gli ostacoli e i passi da seguire per un Paese (in particolare un Paese in via di sviluppo) al fine di pubblicare i dati governativi come open data.

ODbL [Permalink]

Open Database Licence, è un tentativo di creare una licenza aperta per i dati che riguarda il ‘diritto sulle banche dati’ (vedi copyright), così come il copyright stesso. Lo fa imponendo obblighi contrattuali sul ri-uso dei dati. Purtroppo il diritto contrattuale è fondamentalmente diverso dal diritto d’autore, dal momento che il copyright è insito in un lavoro e si lega a tutti gli utenti a valle del lavoro, mentre il contratto vincola solo le parti del contratto e non ha forza su un successivo ri-uso di ri-pubblicazione dei dati. La ODbL resta tuttavia utile, e altri tentativi sono stati fatti per creare licenze aperte appositamente per i dati.

OGP [Permalink]

L’Open Government Partnership, è una partnership fra i governi di varie nazioni lanciato nel 2011 con lo scopo di promuovere l’open government fra gli stati aderenti e nella collaborazione multi-laterale di accordi e buone pratiche. Allo stato attuale della stesura di questo documento (2014) stanno partecipando circa 64 nazioni.

ONG [Permalink]

Organizzazioni Non-Governative. Le ONG sono organizzazioni volontarie, senza fini di lucro, che si concentrano su opere di carità, community-building, campagne, ricerca, ecc, che costituiscono una parte essenziale della società civile.

Open Access [Permalink]

È il principio secondo il quale l’accesso ai paper pubblicati e altri risultati della ricerca, in particolare quella finanziata con fondi pubblici, dovrebbe essere liberamente accessibile a tutti. Questo contrasta con il modello tradizionale in cui la ricerca è pubblicata su riviste che fanno pagare costi di abbonamento ai lettori. Oltre ai benefici simili ai benefici degli open data, i sostenitori suggeriscono che è immorale trattenere potenziale salva-vita e che la ricerca acquisica valore da parte solo di alcuni lettori che possono essere in grado di utilizzare o costruire su di essa. Ora esistono diverse riviste ad accesso aperto e l’interesse dei finanziatori della ricerca sta dando loro un po di trazione, soprattutto nelle scienze.

Open Data [Permalink]

Un dato è aperto se chiunque è libero di usarlo, riusarlo e ridistribuirlo - soggetto, eventualmente, al requisito di attribuzione e/o condividere allo stesso modo. Vedi Open Definition

Open Development [Permalink]

L’Open Development cerca di portare la filosofia del movimento {open} per lo sviluppo internazionale. Promuove open government, trasparenza e flussi di aiuto, l’impegno dei beneficiari nella progettazione e realizzazione di progetti di sviluppo e la disponibilità e l’uso di dati per lo sviluppo.

Open Science [Permalink]

La pratica della scienza in accordo con i principi open, che includono la pubblicazione open access, la pubblicazione e la collaborazione intorno ai dati della ricerca come open data e il rilascio del codice sorgente utilizzato nel crearli, e nell’uso e nello sviluppo di strumenti open source per l’elaborazione dei dati.

Open Source [Permalink]

Software il cui codice sorgente è disponibile con una licenza aperta. Non solo il software può essere utilizzato liberamente, ma utenti con le necessarie capacità tecniche possono prendere visione del codice sorgente, modificarlo ed eseguire proprie versioni del codice, aiutare nel correggere bug, sviluppare nuove funzionalità, ecc… Alcuni grandi progetti open source hanno oltre migliaia di contributori volotari. La Open Definition è fortemente basata sulla più recente Open Source Definition, che definisce le condizioni attraverso cui un software può essere considerato open source.

Open definition [Permalink]

La Open Definition (“la definizione di open”), ha avuto il suo primo rilascio da Open Knowledge nel 2005 e stabilisce a quali condizioni i dati e i contenuti sono considerati open (aperto). Lo “standard” fornito dalla Open Definition è cruciale perché gran parte del valore degli open data sta nella facilità con cui diverse fonti open data possono essere combinate. La compatibilità giuridica e tecnica è di vitale importanza, e la Open Definition garantisce che le licenze aperte open data possonano essere combinate con successo, evitando la proliferazione di licenze e condizioni d’uso che portano alla complessità e incompatibilità. Mentre i governi e le organizzazioni si accalcano per portare l’etichetta di ‘open’, la Open Definition assicura che il termine non perda il suo significato in mezzo a questo crescente entusiasmo. Oggi è diventato il principale standard internazionale per gli open data e per le licenze per gli open data, grazie al supporto di un gruppo di professionisti di open data di alto livello ed può essere visionata al sito opendefinition.org. I processi di conformità delle licenze governative esperte e le raccomandazioni per la conformità hanno rafforzato le licenze in tutto il mondo, ad esempio il caso della revisione della “Open Government License” del governo britannico che ha un influenza internazionale. La Open Definition ha anche influenzato e guidato altre comunità di pratica nel movimento open, incluso l’open access della ricerca finanziata dal pubblico, l’open hardware, e altro ancora. Per una sintesi, vedi open data.

Open government [Permalink]

L’Open Government, e in linea con il movimento open in generale, cerca di rendere il funzionamento dei governi trasparenti, responsabili e sensibili per i cittadini. Ciò include anche gli ideali di democrazia, del giusto processo, della partecipazione dei cittadini e degli open data della pubblica amministrazione. Un approccio completo di Open Government, dovrebbe cercare di consentire la partecipazione dei cittadini, ad esempio, nella redazione e la revisione della legislazione e delle previsioni di bilancio. Vedi OGP.

Open standard [Permalink]

Generalmente si intendono le norme tecniche esenti da restrizioni di licenza. Può anche essere interpretato nel senso di standard che si sviluppano in maniera indipendente rispetto al fornitore.

PDF [Permalink]

Portable Document Format, è un formato di file per rappresentare l’impaginazione e la rappresentazione di documenti su una pagina indipendente dal software, sistema operativo, ecc. Inizialmente il formato era proprietario di Adobe Systems, PDF è stato reso un formato aperto dal 2008. I dati in file PDF non sono {machine-readable}; vedi dati strutturati.

Portale di dati [Permalink]

Una piattaforma web per pubblicare dati. Lo scopo di un portale di dati è quello di fornire un catalogo di dati in modo da rendere i dati non solo disponibili ma anche cercabili dagli utenti, fornendo un comodo flusso di lavoro alle organizzazioni nella pubblicazione. Funzioni tipiche sono interfacce web per pubblicare, cercare e prendere visione dei dati, interfacce utili alle macchine (API) per abilitare la pubblicazione automatica da altri sistemi, l’anteprima dei dati e la loro visualizzazione.

Preservazione dei dati [Permalink]

Il Domesday Book del 1086 è stato scritto con l’inchiostro su pergamena, una tecnologia che è ancora leggibile fino ad ora. La conservazione a lungo termine degli attuali dataset è più difficile da garantire ai nostri giorni a causa dell’incertezza sul futuro dei formati di file , architetture, supporti di memoria e connettività di rete. Progetti che mettono un accento particolare sulla conservazione dei dati assumendo una varietà di approcci per risolvere questi problemi.

Principio dei molti occhi [Permalink]

Se qualcosa è visibile da molte persone allora, insieme, si è più propensi a trovarne gli errori. La pubblicazione di open data può essere quindi anche un modo per migliorare l’accuratezza e la qualità dei dati, in particolare se si fornisce una buona interfaccia per segnalare gli errori. Vedi crowdsourcing.

Privacy [Permalink]

Il diritto degli individui alla vita privata include il diritto di non rendere pubbliche informazioni personali di sè. Il diritto alla privacy è riconosciuto dalla dichiarazione universale dei diritti dell’uomo e dalla convenzione europea dei diritti dell’uomo. vedi protezione dei dati

Proprietario [Permalink]

(i) Il software proprietario è posseduto da una azienda che restringe le modalità attraverso cui questo viene utilizzato. Gli utenti normalmente devono pagare per utilizzare il software, non è poi permesso leggere o modificare il codice sorgente, e copiare il software o rivenderlo come parte di un proprio prodotto. Esempi comuni includono Microsoft Excel e Adobe Acrobat. Il software non proprietario è solitamente chiamato open source.

(ii) Un format di file proprietaro è posseduto e controllato da una azienda. I dati in questo formato hanno spesso bisogno di software proprietario per essere utilizzati. A differenza di un formato aperto, la descrizione del formato può essere confidenziale o inpubblicata, e può essere modificata diverse volte dall’azienda. Software proprietari, solitamente, aprono e salvano dati in formati proprietari. Ad esempio, diverse versioni di Microsoft Excel usano diversi formati proprietari di XLS e XLSX.

Protocollo di accesso ai dati / data access protocol [Permalink]

Un sistema che permette ad esterni di avere accesso alla banca dati senza dover sovraccaricare altri sistemi.

Pubblico dominio [Permalink]

Un contenuto dove il copyright non si applica, ad esempio perchè scaduto, di cui chiunque è libero di farne ogni tipo di utilizzo, è definito come pubblico dominio. CC0, è uno strumento legale creato da Creative Commons per rinunciare al copyright in tutto il mondo.

Publisher - Pubblicatore [Permalink]

Chiunque distribuisca e renda disponibili dati o altri contenuti. I pubblicatori di dati includono dipartimenti governativi e agenzie, istituti di ricerca, ONG, agenzie di media, aziende, privati, ecc

Pulizia dei dati [Permalink]

Il processamento di un dataset per renderlo più semplice da utilizzare. Questo può realizzarsi nella correzione di inconsistenze e errori, rimozioni di elementi non-{machine-readable} come la formattazione, uso di etichette standard per l’intestazione di righe e colonne, garanzie che numeri, date ed altre quantità siano rappresentate in maniera appropriata, coversioni in formati di file più idonei, rinconciliazione delle etichette con un altro dataset che sarà utilizzato (vedi integrazione fra dati, ecc… Vedi qualità dei dati.

Qualità dei dati [Permalink]

Una misura per l’usabilità dei dati. Un dataset ideale è accurato, completo, tempestivo nella pubblicazione, coerente nella denominazione degli elementi e nella sua gestione, ad esempio, dati mancanti o direttamente {machine-readable} (vedi pulizia dei dati), conforme a denominazioni standard dei campi e pubblicati con sufficenti metadati in modo che gli utenti siano in grado di capirli (ad esempio, da chi viene pubblicato il dataset e il significato delle variabili presenti).

Query [Permalink]

Una tipologia di interrogazione accettata da un database sui dati che archivia. Una query complessa può chiedere al database di selezionare i dati secondo alcuni criteri, aggregarli per quantità rispetto a delle caratteristiche, ecc… Diversi database accettano query in linguaggio SQL o in un dialetto di questo. Una web API permette ad una {app} di inviare query ad un database attraverso il web. Rispetto a scaricare ed elaborare i dati, questo riduce il carico di calcolo della applicazione e la bandanecessaria.

RDF [Permalink]

Resource Description Framework, è la forma originaria per descrivere i linked data. RDF non è esattamente un formato dati; piuttosto, esistono alcuni formati equivalenti, nei quali RDF può essere espresso, tra cui un formato basato su XML. I dati RDF prendono la forma di un “tripla” (ogni atomo di dato è specificato in tre parti, vale a dire un soggetto, un predicato ed un oggetto), e può essere archiviato in un database chiamato triple store.

Real time - tempo reale [Permalink]

Si tratta di dati (come la posizione attuale di un treno sulla rete ferroviaria) che sono constantemente aggiornati, dove è necessario utilizzare una query per ottenere l’ultima versione.

Recupero dei costi [Permalink]

Il principio di fissare un prezzo per una risorsa. Ad esempio, per i dati, al fine di recuperare il costo necessario per coprire la spesa della raccolta a differenza dei costi marginali. Il fatto di caricare i dati di un costo di recupero, ai sensi della Open Definition, non fa di questi degli open data. Diversi studi dimostrano che caricare i dati del settore informativo pubblico con il recupero dei costi porta ad abbassare la crescita dei costi marginali.

Ri-uso [Permalink]

È raro che dati raccolti per un particolare scopo non abbia altri possibili utilizzi. Fortunatamente, i dati, una volta raccolti per qualsiasi scopo, sono una risorsa infinita (vedi la tragedia degli anti-commons) che può essere riutilizzata più e più volte, in modi che non sono mai stati previsti prima, alla sola condizione che il titolare dei dati li metta a disposizione con una licenza aperta per abilitarne il riuso.

Rintracciabili / Discoverable [Permalink]

Non è sufficiente che gli open data siano pubblicati se i potenziali utenti non riescono a trovarli, o addirittura non sanno che esistono. Piuttosto che limitarsi a pubblicare i dati a casaccio su siti web, i governi ed altri pubblicatori di dati di grandi dimensioni possono contribuire a rendere i propri dataset rintracciabili con l’indicizzazione dei loro cataloghi o nei portali di dati.

Risorsa [Permalink]

CKAN utilizza questo termine per indicare un singolo oggetto (come un {file} in formato foglio di calcolo, o una API) di un dataset.

SPARQL [Permalink]

Una query in un linguagio simile al SQL, utilizzata per interrogare un triple store linked-data.

SQL [Permalink]

Structured Query Language, è un linguaggio standard di interrogazione di molte tipologie di database. Vedi query.

SaaS [Permalink]

Software as a Service, es. un programma software che non viene eseguito sulla macchina utente ma su computer di una azienda di {hosting}, che l’utente raggiunge attraverso il web. Il server remoto si preoccupa della gestione dell’archiviazione dei dati e, normalmente trae vantaggio nell’offrire questo servizio monetizzando o in altro modo.

Scraping [Permalink]

Estrazione di dati da una sorgente non-{machine-readable}, come un sito web o un documento PDF al fine di creare dati strutturati. La creazione di un dataset da scraping richiede molto tempo da parte di un programmatore, pertanto, di solito si sceglie questo percorso dopo diversi tentativi falliti di avere i dati in forma strutturata. Possono essere avanzate questioni legali come violazioni di copyright o di termini di utilizzo nelle operazioni di scraping da siti web.

Server [Permalink]

Un computer in internet, generalmente gestito da una azienda di {hosting}, che risponde alle richieste di un utente es. pagine web, scaricamento di file o accesso a caratteristiche di un pacchetto SaaS che è stato installato sul server.

Shapefile [Permalink]

Un formato di file molto popolare per i geodati, mantenuto e pubblicato da Esri, una azienda software specializzata nei sistemi GIS. Uno shapefile attualmente consiste in un insieme di file. Anche se il formato è tecnicamente proprietario, Esri ha pubblicato le specifiche complete dello standard e, per tale motivo, gli shapefile possono essere letti da un ampio numero di software, si tratta pertanto di una pratica molto simile a quella degli {open standard}.

Spreadsheet - Foglio di calcolo [Permalink]

Una tabella di dati e calcoli che possono essere trattati in modo interattivo con un foglio di calcolo specializzato come Microsoft Excel o OpenOffice Calc.

Standard [Permalink]

Una specifica pubblica per, ad esempio, definire la struttura di un particolare formato di file, raccomandare una nomenclatura da utilizzare in un particolare dominio, una collezione comune di campi di metadati, ecc. Adeguarsi a standard pertinenti aumenta notevolmente il valore dei dati pubblicati, migliorando la machine readability e facilitando la integrazione fra dati.

Tab-separated values - Valori separati da tabulatore [Permalink]

Tab-separated values (TSV), ovvero valori separati da tabulatori, è un formato di file di testo molto diffuso per la condivisione di dati in formato tabellare. Il formato è estremamente semplice e altamente {term:machine-readable}.

Tragedia degli anti-commons [Permalink]

La nota tragedia dei beni comuni si verifica quando una risorsa comune, come il pascolo, viene degradata attraverso un uso eccessivo. Effettivamente, gli utenti stanno trattando una risorsa limitata come se fosse illimitata, grazie ad una struttura povera di stimoli. L’economista Michael Heller ha coniato il termine ‘tragedia degli anti-commons’ per descrivere l’errore opposto, dove gli scarsi incentivi portano al sotto-utilizzo di una risorsa abbondante e senza limiti. Il caso dei dati non pubblicati o addebitati ad un costo superiore a quello marginale ne sono un primo esempio, i dati devono essere in realtà una risorsa illimitata.

Trasparenza [Permalink]

I governi e le altre organizzazioni vengono dette trasparenti quando il loro operato e i processi decisionali sono facilmente comprensibili, adeguatamente documentati e verificabili. La trasparenza è una delle caratteristiche dell’open government. Un aumento della trasparenza è uno dei benefici derivati dagli open data..

Triple store [Permalink]

La ‘tripla’ di dati RDF può essere archiviata in uno specifico database dal nome triple store, attraverso cui le interrogazioni ({queries}) possono essere fatte attraverso il linguaggio SPARQL.

URI / URL [Permalink]

Uniform Resource Identifier / Uniform Resource Locator. Un URL è l’indirizzo web http:/… di una pagina o risorsa. Quando una URL è utilizzata nei linked data come identificatore di un oggetto, non è l’esatta locazione dell’oggetto (es. http:/it.dbpedia.org/page/Parigi porta ad un documento che parla di Parigi, non ma a Parigi in sè, in questo contesto allora si fa rifermento ad una URI

Unconference / non-conferenza [Permalink]

Un meeting, simile ad una conferenza, ma senza un programma stabilito all’inzio. Utilizzando varie tecniche consolidate, i partecipanti concordano congiuntamente il giorno in cui verranno eseguite le sessioni. Alcune sessioni saranno più tradizionali anche includendo relatori ad invito. Un formato popolare fra le comunità tecnologiche è quello di combinare o affiancare una non-conferenza con una hackathon su dati aperti. Si tratta di un possibile metodo di ingaggio di comunità attraverso i fornitori di dati.

Unique identifire / Identificatore univoco [Permalink]

(o UID): È un identificatore per un oggetto che si garantisce essere diverso da tutti gli altri identificatori contenuti in una collezione di oggetti. All’interno di un database, ogni oggetto avrà un UID che è unico all’interno della banca dati. Un UID assegnato da un registro centrale (come un ISBN per i libri, o di un DOI per i dati), sarà unico per tutti gli oggetti per i quali è assegnato. Gli identificatori http:/… dei linked data forniscono una tecnologia per garantire gli UID senza un’autorità centrale.

Visualisation / Visualizzazione [Permalink]

Una rappresentazione visuali dei dati è spesso il modo più convincente di comunicarli, facendo emergere le sue caratteristiche principali, correlazioni e valori anomali. Anche se esistono molti strumenti, creare una visualizzazione per un set di dati non è un processo automatico. Per progettare una rappresentazione visiva che sia in grado di far trasparire il messaggio contenuti nei dati, è necessaria una attenzione al significato delle variabili, il rapporto tra queste e le storie inerenti ai dati.

Vocabolario [Permalink]

Uno standard le cui specifiche servono a definire degli identificatori da utilizzare per una particolare collezione di oggetti. L’utilizzo di vocabolari standard sono la chiave per abilitare l’integrazione fra dati. I linked data sono ricchi di vocabolari in diversi argomenti.

Web [Permalink]

Il World Wide Web è la vasta raccolta di documenti collegati e collegabili e di servizi accessibili via ‘web browser’ attraverso Internet.

Web API [Permalink]

Una API che è costruita per funzionare via web.

XLS(X) [Permalink]

un formato proprietario per il foglio di calcolo foglio di calcolo, quello originario del popolare pacchetto Microsoft Excel. Nelle vecchie versioni il formato utilizzato è .xls, mentre quelle più recenti fanno uso di una variante .xslx basata su XML

XML [Permalink]

Extensible Markup Language, un semplice e potente standard per rappresentare dati dati strutturati

de-identificazione [Permalink]

Una forma di anonimizzazione dove i dati personali sono mantenuti intatti, ma specifiche informazioni di identificazione, come ad esempio nomi, vengono sostituiti con identificatori anonimi. La de-identificazione comporta un rischio maggiore di fuga di dati rispetto all’[aggregazione]. Ad esempio, se la banca dati di una prigione detiene i precedenti penali di un detenuto e la sua storia medica, il detenuto potrebbe in molti casi essere identificato anche senza il nome, guardando la fedina penale, e di conseguenza avere accesso non autorizzato anche alla sua storia medica. In altri casi, questo rischio è assente, oppure si ha un valore dai dati non-aggregati così grande che vale la pena lavorare sulla de-identificazione con molta cura e aumentando la sicurezza.