Terminológia

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  my  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW  my 
API [Permalink]

Alkalmazásprogramozói felület. Adatok esetén az adatközzétevők ennek segítségével teszik elérhetővé a programok vagy alkalmazások számára, hogy közvetlenül a weben keresztül olvassák be az információkat. Az alkalmazás egy lekérdezést küld az API felé, amelyben lekéri a számára szükséges adatokat, például hogy mikor indul a következő busz egy adott megállóból. Ez lehetővé teszi az adatok felhasználását anélkül, hogy a teljes adathalmazt le kellene tölteni, kímélve a sávszélességet, és biztosítva, hogy a felhasznált adatok az elérhető legfrissebbek.

BitTorrent [Permalink]

A BitTorrent egy nagyméretű fájlok továbbítására szolgáló protokoll, amely elosztja az ehhez szükséges sávszélességet az átvitelben résztvevő számítógépek között. Ahelyett, hogy a fájlokat egy specifikus forrásból kellene letölteni, a BitTorrent segítségével a felhasználók azokat egymástól tölthetik le.

CKAN [Permalink]

Egy nyílt forráskódú, adatportálok létrehozására szolgáló szoftverplatform, melyet az Open Knowledge készít és tart karban. A CKAN-t körülbelül 20 állam számára szolgál hivatalos adatpublikációs platformként, de emellett számos helyi, közösségi, tudományos és más adatportál motorjaként is működik. Funkciói között megtalálhatóak a konfigurálható metaadatok, a felhasználók és a közzétevők számára egyaránt felhasználóbarát webes felület, az adatelőnézet, a szervezetalapú jogosultsági szintek, valamint az API-k, amelyek az adatok mellett a felsorolt képességek mindegyikéhez hozzáférést engednek.

CSV [Permalink]

A “vesszővel tagolt értékek” egy táblázatokhoz használt formátum. Az adatok mint egyszerű szövegfájlok vannak tárolva, ahol az egyes adatokat vesszők, az adatsorokat pedig sortörések választják el. Rendkívül szimpla, nyílt formátumként a feldolgozása igen egyszerű, így széles körben használják nyílt adatok publikálására.

Creative Commons [Permalink]

Egy 2001-ben alapított nonprofit szervezet, amely az újrahasznosítható tartalmak elterjedését segíti elő azzal, hogy szabványosított licenszeket publikál, melyek egy része nyílt (míg mások nem kereskedelmi célú kikötéseket tartalmaznak), és alkalmas az újrahasznosításra, továbbá pontos magyarázatokat nyújt ezek jelentésére vonatkozóan.

DOI [Permalink]

A Digital Object Identifier egy digitális objektumoknál (például dokumentumoknál vagy adathalmazoknál) használt azonosító, melyet egy központi regiszter oszt ki, ezáltal az garantáltan globálisan egyedi: a világon nem lesz két digitális objektumnak azonos DOI-ja.

Data Access Protocol [Permalink]

Egy rendszer, amely lehetővé teszi külső felhasználók számára, hogy hozzáférést nyerjenek adatbázisokhoz a rendszerek túlterhelése nélkül.

EU PSI irányelv [Permalink]

A közszféra információinak további felhasználásáról szóló irányelv, 2003/98/EK. “részletezi, hogy a közigazgatási szervek hogyan segítsék az információs erőforrásaik újrafelhasználását” AZ EURÓPAI PARLAMENT ÉS A TANÁCS 2003/98/EK IRÁNYELVE

GIS [Permalink]

Geographical Information System, azaz földrajzi információs rendszer: minden olyan számítógépes rendszer, amelynek célja a geoadatok feldolgozása, elemzése és manipulálása.

GPS [Permalink]

A GPS (Global Positioning System) egy műholdas rendszer, amely pontos helyzeti információkat képes nyújtani bármely olyan eszköz számára, ami erre alkalmas vevővel rendelkezik (beleértve a modern okostelefonokat). A GPS elengedhetetlen számos helyzetfüggő alkalmazás máködéséhez, például útkereseséshez vagy időjárás előrejelzéshez. A GPS szembeötlő példája a sikeres nyílt adatoknak, hiszen a rendszert az amerikai állam működteti, és ingyenesen elérhető bárki számára, aki a megfelelő vevővel rendelkezik.

GeoJSON [Permalink]

A JSON egy fajtája, amely kifejezetten geoadatok leírására szolgál, ezáltal népszerű formátum efféle adatok cseréjére.

IP jogok [Permalink]

Lásd szellemi tulajdonjogok.

Information Asset Register [Permalink]

Az IAR-ok olyan regiszterek, amelyek kifejezetten az állami hivatalok és szervezetek által birtokolt hatalmas mennyiségű információhoz tartozó metaadatok gyűjtésére és rendszerezésére szolgálnak. Egy átfogó IAR elektronikus fájlokat, statisztikai gyűjteményeket, kutatásokat, adatbázisokat és régi iratokat egyaránt tartalmaz.

Az EU PSI irányelv elismeri ezen regiszterek fontosságát a közinformációk lehetséges újrafelhasználói számára. Előírja a tagállamok számára a listák, portálok vagy hasonló megoldások használatát. Az erre vonatkozó rész így szól: ” Azon eszközök, amelyek segítik a potenciális további felhasználókat a további felhasználásra rendelkezésre álló dokumentumok és a további felhasználás feltételeinek megtalálásában, nagymértékben elősegítik a közszféra dokumentumainak további felhasználását. A tagállamoknak ezért biztosítaniuk kell, hogy gyakorlati intézkedések segítsék a felhasználókat a további felhasználásra rendelkezésre álló dokumentumok felkutatásában. A legfontosabb dokumentumok (olyan dokumentumok, amelyek széles körben vagy amelyek feltehetően széles körben kerülnek további felhasználásra további felhasználás céljából) jegyzékét lehetőleg on-line kell elérhetővé tenni, és a decentralizált jegyzékekkel összekapcsolt internetes portálok jó példák az ilyen gyakorlati intézkedésekre.”

Az IAR-ok létrehozásának több módja van. A minisztériumok saját regisztereket hozhatnak létre, amelyeket összeköthetnek a nemzeti IAR-ral. Ezek olyan közigazgatási szervek által birtokolt információkat tartalmazhatnak, melyeket proaktívan még nem publikáltak, vagy esetleg a későbbiekben sem fognak publikálni. Ezért, a regiszterek lehetővé teszik, hogy a felhasználók azonosítsák mely információk elérhetők és melyek kérvényezhetők. “Hogy az IAR-ok hasznosak legyenek a nagyközönség számára, fontos, hogy minden regiszter a lehető legteljesebb legyen, hogy biztosítsuk a dokumentumok megtalálhatóságát. Az egyes regiszterek hiányossága jelentős problémát jelent, mivel ez olyan megbízhatatlanságot sugall, amely elbátortalaníthatja az embereket a használatuktól.”

A keresőmotorok megfelelő működése érdekében kulcsfontosságú, hogy a regiszterekben található metaadatok átfogóak legyenek. A nyílt állami adatok szellemében a közigazgatási szerveknek célszerű az IAR-okat a nagyközönség számára nyers adatként, valamilyen nyílt licensz alatt közzétenniük, mert így a polgári hackerek képesek hasznosítani azokat, például keresőmotorok és felhasználói felületek létrehozásával.

JSON [Permalink]

A JavaScript Object Notation (JSON) egy adatokhoz használható, egyszerű de erőteljes formátum. Képes komplex adatstrukturák leírására, gép által olvasható, emberek számára is viszonylag könnyen értelmezhető, platform- és nyelvfüggetlen független, emiatt népszerű formátum a programok és rendszerek közti adatcseréhez.

KML [Permalink]

A Keyhole Markup Language egy XML-alapú nyílt, geoadatok tárolására szolgáló formátum. A KML eredetileg a Keyhole Earth Viewer alkalmazáshoz készült, amelyet később a Google megvett és Google Earth névre keresztelt, a formátum azonban 2008-ban nemzetközi szabvánnyá vált az Open Geospatial Consortium által.

ODRA [Permalink]

Az Open Data Readiness Assessment (Nyílt adat készenlét becslő) egy, a Világbank által létrehozott keretrendszer, amely segít a lehetőségek, akadályok felmérésében és következő szükséges lépések megállapításában azon országok (különösen a fejlődő országok) számára, amelyek állami adatok nyílt adatként történő közzétevését tervezik.

ODbL [Permalink]

Az Open Database Licence (Nyílt Adatbázis Licensz) célja egy olyan licensz megalkotása, amely lefedi az “adatbázis jogokat” (lásd szerzői jog) és a szerzői jogokat is. Ezt az adatok újrafelhasználóira vonatkozó szerződéses kötelezettségek felállításával éri el. Sajnos a szerződésjog és a szerzői jog alapjaiban különböznek, mivel utóbbi a mű velejárója és annak minden további felhasználójára érvényes, míg a szerződés csak a szerződéses felek közöt érvényes és nincs hatással az újrapublikált adatok későbbi újrafelhasználóira. Ennek ellenére az ODbL továbbra is hasznos, és további próbálkozások is születnek a kifejezetten adatokhoz szánt nyílt licenszek létrehozására.

OGP [Permalink]

Az Open Government Partnership (Nyílt adat partnerség) egy 2011-ben indult államközi szövetség, melynek célja a nyílt állam népszerűsítése ennek tagországaiban, valamint többoldalú egyezményeken kidolgozása és a “jó gyakorlatok” létrehozása. Jelen dokumentum írásakor (2014) a partnerség 64 tagországot számlál.

Open definition [Permalink]

Az Open Definition-t az Open Knowledge által 2005-ben kiadott dokumentum, amely meghatározza, hogy az adatok és tartalmak mely feltételek meglétekor tekinthetőek nyíltnak. Az Open Definition által nyújtott “szabvány” kulcsfontosságú, hiszen a nyílt adatok értékének nagy része a különböző adatforrások egyszerű kombinálhatóságából ered. Rendkívül fontos mind a jogi, mint a technikai nyíltság: az Open Definition biztosítja, hogy a nyílt licensszel rendelkező adatok keverhetőek, és segít elkerülni a különböző licenszek és feltételek túlburjánzását, amely túlzott komplexitáshoz és inkompatibilitáshoz vezet. Manapság egyes kormányok és szervezetek tolakodva próbálják magukra aggatni a “nyílt” címkét: az Open Definition biztosítja, hogy a kifejezés ne veszítsen jelentéséből. Napjainkban ez számít a fő nemzetközi szabványnak a nyílt adatok és nyílt adatlicenszek területén. Az Open Definition egy nyílt adat elveket gyakorló tanácsadói testülettel egyetemben az opendefinition.org címen érhető el. A szakértők által vezetett licenszmegfelelőségi folyamat és benne tett javaslatok világ számos licenszére, például az Egyesült Királyság nemzetközileg is jelentős Open Government Licence-ére is hatással voltak. A definíció más mozgalmak formálásában is részt vett, például a közpénzből végzett kutatásokhoz való nyílt hozzáférésben, a nyílt hardverekben, és sok másban. Összefoglalóért lásd: nyílt adatok.

PDF [Permalink]

A Portable Document Format (PDF) egy dokumentumelrendezés és megjelenés leírására szolgáló fájlformátum, amely független az elrendezést készítő szoftvertől, operációs rendszertől, stb. Eredetileg az Adobe Systems jogvédett formátuma volt, de 2008 óta nyílt formátum. A PDF-ben tárolt adatok nem gép által olvashatóak; lásd strukturált adatok.

RDF [Permalink]

A Resource Description Framework a kapcsolt adatok leírásának natív módja. Az RDF nem kifejezetten egy adatformátum; Az RDF több, ekvivalens formátum segítségével is kifejezehető, például XML alapon. Az RDF adatok hármas azonosítók (tripletek) segítségével vannak tárolva (minden atomi adat három részből áll: alany, állítmány, tárgy), és specializált adatbázisokban, un. triple store-okban tárolható.

SPARQL [Permalink]

Egy SQL-hez hasonló lekérdezőnyelv, amely kapcsolat adatokat tartalmazó triplet store-ok lekérdezésére szolgál.

SQL [Permalink]

A Structured Query Language egy adatbázisok lekérdezésére szolgáló szabványos nyelv. Lást lekérdezés.

SaaS [Permalink]

A Software as a Service, azaz szoftver mint szolgáltatás rövidítése. Ezek például olyan programok, amelyek nem a felhasználó számítógépén, hanem egy szolgáltató gépein futnak, a felhasználók pedig a web-en keresztül érhetik el őket. Az adattárolásért a szolgáltató felel, melyért többnyire havidíját kér, vagy valamiképp monetizálja a felhasználói bázist .

Shapefile [Permalink]

Egy népszerű földrajzi adatok tárolására szolgáló fájlformátum, melyet a GIS szoftvereket gyártó Esri publikál és tart karban. Egy Shapefile tulajdonképpen több kapcsolódó fájlból áll. Habár a formátum technikailag jogvédett, az Esri publikálja a szabvány teljes specifikációját, így a Shapefile-t számos alkalmazás képes kezelni. Emiatt, gyakorlatilag a nyílt szabványokhoz hasonlóan működik.

Tab-separated values [Permalink]

A Tab-separated values (tabbal határolt szövegfájlok) egy táblázatos jellegű adatok megosztására szolgáló, rendkívül népszerű szövegfájl formátum. A formátum különösen egyszerű, és gép által könnyedén olvasható.

URI / URL [Permalink]

Uniform Resource Identifier / Uniform Resource Locator. Az URL egy weblap vagy más erőforrás http://… azonosítója. Ha egy URL-t egy objektum kapcsolt adat azonosítójaként használunk, az nem szigorúan az erőforrás helyét (lokációját) határozza meg (pl. a http://dbpedia.org/page/Paris egy Párizsról szóló dokumentum címe, nem Párizs maga). Ilyen kontextusban az URL helyett az URI kifejezést használjuk.

XLS(X) [Permalink]

Egy jogvédett táblázatkezelő formátum, a népszerű Microsoft Excel natív formátuma. A korábbi verziók .xls, míg az új verziók az XML alapú .xlsx variánst használják.

XML [Permalink]

Az Extensible Markup Language (bővíthető jelölőnyelv) egy strukturált adatok tárolására szolgáló egyszerű és erőteljes szabvány.

a magánlegelők tragédiája [Permalink]

A jól ismert “közlegelők tragédiája” akkor következik be, ha egy közös erőforrás, például egy legelő túlhasználat miatt degradálódik. Gyakorlatilag, a felhasználók egy limitált erőforrást korlátlanként kezelnek egy rossz ösztönzési rendszernek köszönhetően. A Michael Heller közgazdász által megalkotott kifejezés, a “magánlegelők tragédiája” az ezzel ellentétes kudarcára vonatkozik, melyben a rossz ösztönzési rendszer egy bőséges vagy korlátlan erőforrás kihasználatlanságához vezet. A publikálatlan adatok, vagy az, ha az adatokat a marginális költségeknél drágábban áruljuk, remek példái ennek, hiszen az adatok tulajdonképpen végtelen erőforrások.

a nyílt adatok öt csillaga [Permalink]

Tim Berners-Lee, a World Wide Web alapítója által ajánlott értékelési rendszer a nyílt adatok számára. A maximális öt csillag eléréséhez az adatoknak (1) elérhetőnek kell lenniük a weben és nyílt licenszet kell használniuk, (2) strukturált adatok formájában kell lenniük, (3) nem jogvédett formátumban kell szerepelniük, (4) URI-kat kell használniuk azonosítóként (lásd még RDF) és (5) hivatkozniuk kell más adatforrásokra (lásd kapcsolt adatok). 3 csillag eléréséhez az (1)-(3) követelményeknek teljesülnie kell, stb.

adat [Permalink]

Az adatokra feldolgozatlan, tényszerű atomi állításokként tekinthetünk. Gyakran utal számszerű információk szisztematikus táblázatos gyűjteményére, például táblázatokra vagy adatbázisokra. Amikor az adat strukturált és olyan formában szerepel, amely hasznos és releváns egy adott célra, az adat emberi feldolgozásra alkalmas információvá válik. Lásd még tudás.

adatbázis [Permalink]

(i) Bármely rendezett adatgyüjtemény adatbázisnak tekinthető. Ebben a jelentésben az adathalmaz szinonímája.

(ii) Adatok feldolgozására és kezelésére szolgáló szoftverrendszer, melyben lehetőség van az adatok kiterjesztésre, frissítésre, átalakításra és lekérdezésére. Ilyenek például a nyílt forráskódú PostgreSQL, vagy a zárt forráskódú Microsoft Access.

adatbázis jogos [Permalink]

Az adatbázisokból történő adatkinyerést és újrafelhasználást védő jog. Többnyire az európai törvénykezésben található meg.

adatgyűjtés [Permalink]

Az adathalmazok különböző adatgyűjtési módszerek által jönnek létre: manuális vagy automata mérések (például időjárási adatok), felmérések (népszámlálás), kormányzati döntések (költségvetés), folyamatban lévő adatok (kiadások), több adat összesítése (bűnözési statisztikák), matematikai modellezés (népességelőrejelzés), stb.

adathalmaz [Permalink]

Adatok bármilyen rendezett gyűjteménye. Az “adathalmaz” egy rugalmas kifejezés, vonatkozhat egy teljes adatbázisra, egy táblázatra, más adatfájlokra, vagy adaterőforrások kapcsolódó gyűjteményére.

adatigazító [Permalink]

Az adatok felhasználható formába történő konvertálásáért felelős személy, amelyek ezáltal könnyen feldolgozhatóvá válnak a félig- vagy teljesen automatizált eszközök számára. Az adazigazításhoz tartozhat további adattisztítás is.

adatintegrálás [Permalink]

Az adatok szinte összes izgalmas felhasználása több adatforrás kombinációjából jön létre. Ehhez szükséges az, hogy a különböző adathalmazok kompatibilisek legyenek egymással: azonos elnevezéseket kell használniuk azonos objektumokra, egyforma mértékegységeket vagy koordinátarendszereket kell alkalmazniuk, stb. Amennyiben az adatminőség jó, az integrálás folymata nagy valószínűséggel egyszerű lesz, de ha nem, akkor hosszadalmas munkát igényelhet. A kapcsolt adatok célja, hogy az adatintegrálás teljesen, vagy közel teljesen automatikus legyen. A nem nyílt adatok korlátot állítanak az integráció elé, mivel az adatok és a szükséges használati engedélyek beszerzésének folyamata időigényes, és minden adathalmaz esetén meg kell ismételni.

adatkaparás (scraping) [Permalink]

Adatok kinyerése és strukturált adatok létrehozása egy nem gép által olvasható forrásból, például egy weblapból vagy PDF dokumentumból. Az adathalmazok ily módú létrehozása rendkívül időigényes programozói feladat, ezért általában csak akkor kerül rá sor, ha minden más próbálkozás kudarcot vallott strukturált adatok kinyerésére. Jogi kérdéseket vethet fel az, hogy az adatkaparás sérti-e az adott weblap szerzői jogait vagy ütközik-e a felhasználási feltételeivel.

adatkezelés [Permalink]

Szabályzatok, folyamatok és technikai döntések összessége, amelyek az adatok kezelésére vonatkoznak azok teljes életciklusa során, az adatgyűjéstől kezdve a tároláson és megőrzésen át egészen a felhasználásig. Az adatkezelési szabályzatnak figyelembe kell vennie az adatminőség, elérhetőség, adatvédelem, adatmegőrzés, stb. követelményeit.

adatmegőrzés [Permalink]

Az 1086-os Ítéletnapi könyv (Domesday book) pergamenre, tintával íródott, és ez a technológia napjainkban is olvasható maradt. A manapság létező adathalmazok hosszútávú megőrzése bonyolultabb feladat, köszönhetően a jövőbeli fájlformátumok, számítógép architektúrák, tárolómédiumok és hálózati kapcsolatok miatt fellépő bizonytalanságnak. Azon projektek, amelyek nagy hangsúlyt fektetnek az adatmegőrzésre, különböző megközelítésekkel próbálják megoldani ezt a problémát.

adatportál [Permalink]

Egy adatpublikálásra szolgáló webes platform. Az adaportálok célja adatkatalógusok létrehozása, amelye nem csak elérhetővé, de felfedezhetővé is teszi az adatokat a felhasználók számára, továbbá egyszerűbbé teszi a közzétételt végző szervezetek számára a publikálás munkafolyamatát. Tipikus funkciói a publikálásra, a katalógus keresésére és böngészésére szolgáló webes felületek, a gépi interfészek (API-k), amelyek lehetővé teszik a más rendszerekből történő automatikus adatpublikálást, valamint az adatelőnézet és a vizualizáció.

adatszivárgás [Permalink]

Amennyiben a személyes adatok nincsenek megfelelően anonimizáva, lehetséges, hogy azokból (akár más forrásokból származó adatok segítségével) rekonstruálható az adatok tárgyát képző személy identitása. Ebben az esetben, azok a személyes adatok, amelyeket nem publikálásra szántak (lásd adatvédelem ), tulajdonképpen “kiszivárognak” az “anonimizált” adatokból. Más bizalmas információk is ki lehetnek téve az adatszivárgás veszélyének, például gyenge adatbiztonsági intézkedéseknek köszönhetően. Lásd azonosíthatóság meggátolása.

adattisztítás [Permalink]

Az adathalmaz feldolgozásának folyamata, amely könnyebben fogyaszthatóvá teszi az adatokat. Ide tartozhat az inkonzisztenciák és hibák javítása, a gép által nem olvasható elemek, például a formázás eltávolítása, szabványos sor- és oszlopjelölések alkalmazása, a számok, dátumok és más mennyiségek megfelelő formátumának biztosítása, konverzió megfelelő fájlformátumba, címkék egyeztetése más használt adathalmazokkal (lásd adatintegrálás), stb. Lásd adatminőség.

adatvédelmi törvények [Permalink]

Az adatvédelmi törvények nem az adatok védelmére szolgálnak, hanem a polgárok azon jogainak védelmére, hogy ne kelljen félniük a magánéletükre vonatkozó információk nyilvánosságra kerülése miatt. A törvény védi a magánéleti információkat (például az adott személy pénzügyi helyzetére, egészségi állapotára és politikai nézeteire vonatkozóan) és más olyan jogokat, mint a mozgási és gyülekezési szabadság. Például, a finn tömegközlekedési kártyarendszer minden alkalommal rögzítette, amikor a kártyát leolvasták az egyes vonalakon. Ez vitát indított a mozgásszabadság kérdésében, és az utazási adatok gyűjtését az adatvédelmi törvényekre hivatkozva leállították.

adatújságírás [Permalink]

Az adatok megfelelő felhasználásának képessége egyre fontosabb részét képezi az újságírók fegyvertárának. A jó, adat alapú történetek elbeszéléséhez szükséges képességek közé tartozik a reveláns adatok felkutatása, az adattisztítás, az adatok felfedezése vagy bányászata a történet mögöttes tartalmának megértéséhez, valamint a szemléletes vizualizációk létrehozása.

alkalmazásfejlesztői felület [Permalink]

A számítógépes programok egymás közti kommunikációjának módja. A programozók a segítségükkel küldenek utasításokat a programok között.

alkalmazásfejlesztői verseny [Permalink]

A közösség bevonásának népszerű formája, amely során az adatok közzétevői egy olyan app/alkalmazás fejlesztésére invitálják meg a programozókat, mely a publikált adatok segítségével képes megoldani egy problémát, vagy valamiféle szolgáltatást képes nyújtani.

anonimizálás [Permalink]

Az adatok adaptálásának folyamata, amely során meggátoljuk az egyes személyek azonosítását. Az anonimizálás lehetővé teszi, hogy az adatokat az adatvédelmi szabályok megszegése nélkül publikálhassuk. Fő technikái az aggregálás és az azonosíthatóság ellehetlenítése. Ügyeljünk arra, hogy kerüljük el az adatszivárgást, mert az sértheti egyes emberek személyiségi jogait. A UKAN foglalkozik az anonimizálás jó gyakorlataira vonatkozó tanulmányok készítésével.

anonymizálás [Permalink]

Lásd anonimizálás.

app / alkalmazás [Permalink]

Egy szoftver (másnéven “app”), amely kifejezetten a webre mobiltelefonokra és hasonló platformokra készült. Az appok a hálózaton keresztül képesek csatlakozni a nagy adatbázisokhoz, így hatékony módját jelenthetik a nyílt adatok fogyasztásánák, melyek akár valós idejűek, személyre szabottak, vagy (a mobiltelefonok GPS moduljai segítségével) helyzetfüggőek is lehetnek. A crowdsourcing alkalmazások segítségével új adathalmazok jöhetnek létre, vagy bővülhetnek ezek már meglévő adatai.

attribúció [Permalink]

Az adat eredeti forrásának feltüntetése újbóli közzététel esetén. Az adatok felhasználását engedélyező licensz tartalmazhat követelményeket a forrás megjelölésével kapcsolatban. Az ilyen megkötéssel rendelkező adatok az Open Definition alapján továbbra is nyílt adatnak tekintendők.

azonosíthatóság ellehetlenítése [Permalink]

Az anonimizálás egy formája, amely során a személyes adatok érintetlenül maradnak, de a specifikus, azonosításra alkalmas információkat, például a neveket anoním azonosítókra cserélik. Az aggregációval összehasonlítva, az azonosíthatóság ellehetlenítése magával hordozza az adatszivárgás veszélyét: például, ha egy börtönnyílvántartás egészségügyi adatokat is tartalmaz, a rabok gyakran azonosíthatók név nélkül is, mivel a bűnügyi nyilvántartás jogosulatlan hozzáférést enged az egészségügyi adatokhoz. Más esetekben ez az aggály nem merül fel, vagy a nem aggregált adatok értéke olyan nagy, hogy megfelelő óvintézkedések mellett megéri az azonosíthatóság ellehetetlenítése után az adatokat elérhetővé tenni.

azonosító [Permalink]

Egy adatbázisban szereplő objektum vagy fogalom neve. Az azonosító lehet az objektum rendes neve (pl. “London” vagy “W1 1AA”, egy londoni irányítószám), a fogalmat leíró szó (“lakosság”), vagy egy tetszőleges aznosító “XY123”, amely csak az adott adathalmaz kontextusában nyer értelmet. Az azonosítók precíz, releváns szabványok szerint történő megválasztása előségítheti az adatintegrációt. Lásd kapcsolt adatok.

big data [Permalink]

Adatok olyan nagy méretű gyűjteménye, amely nem tárolható, továbbítható vagy feldolgozható hagyományos módszerek segítségével. Az ilyen adathalmazok (például óriási mennyiségű időjárási vagy tudományos adatok) feldolgozási lehetőségeinek fejlődése, valamint ennek növekvő igénye speciális új számítógépes technológiák, architektúrák és programnyelvek kifejlesztéséhez vezetett.

civilszervezet [Permalink]

A civilszervezetek olyan önkéntes, nonprofit szervezetek, amelyek céljai a karitatív munka, közösségépítés, kampányolás, kutatás, stb, és a civil közösség fontos részei.

crowdsourcing [Permalink]

A nagy mennyiségű adatok gyűjtésével járó munka szétosztása kisebb alfeladatokra, amelyet önkéntesek vállahatnak el. Néhány példa: a Wikipedia egy közösség által szerkesztett enciklopédia, a Galaxy Zoo egy korai példa volt a tudományos adatok crowdsource-olására, ahol nem hivatásos önkénteseket kértek meg galaxisok osztályozására azok vizuális megjelenése alapján. A NOVAM szolgáltatás lehetővé tette a nagyközönség számára, hogy ellenőrizzék vagy kijavítsák a hivatalos adatokat az Egyesült Királyság buszállomásainak helyzetéről, körülbelül 18.000 korrekciót eredményezve.

dimenziók [Permalink]

Egy hagyományos táblázatot könnyedén jellemezhetünk két adatdimenzióval: minden adatpont rendelkezik egy sorral és egy oszloppal. A való életben azonban számos adat többdimenziós, például egy olyan adathalmaz, amely a föld felületi hőmérsékletét tartalmazza helyekkel és időpontokkal (két koordináta szükséges a pozíció, például hosszúsági és szélességi fokok, és egy az időpont meghatározására).

egyben letölthető [Permalink]

Az adatok akkor egyben letölthetőek, ha a teljes adathalmaz könnyen és hatékonyan letölthető a felhasználó saját számítógépére. Amennyiben nem egyben letölthető, az adatoknak csak kis részeit érhetjük el, így minden alkalommal az adathalmaz néhány elemére vagyunk korlátozva, és lekérdezések ezreire vagy millióira lenne szükség a teljes adathalmaz letöltésére. Az egyben történő letölthetőség feltétele az adatok nyíltságának.

egyedi azonosító [Permalink]

Másnéven UID: Egy olyan objektumazonosító amely garantáltan eltér a gyűjteményben szereplő összes többi objektum azonosítójától. Az adatbázisban szereplő összes objektum olyan UID-vel fog rendelkezni, amely az adatbázison belül egyedi. Egy központi regiszter (például könyvek esetén az ISBN, adatok esetén a DOI által kiosztott UID egyedi lesz minden hozzárendelt objektum esetén. A kapcsolt adatok http://… azonosítói lehetőséget kínálnak az UID-k egyediségének garantálására központi felügyelet nélkül is.

ember által olvasható [Permalink]

Az emberek számára kényelmesen olvasható formában lévő adat. Egyes ilyen formátumok, például a PDF, nem gép által olvasható, mivel nem strukturált adat, vagyis a merevlemezen tárolt reprezentációjuk nem tartalmazza az adatok közt fennálló kapcsolatokat.

erőforrás [Permalink]

A CKAN ezt a kifejezést használja az önálló adatobjektumokra (például egy táblázatfájlra, vagy egy adathalmaz API-ra).

felfedezhető [Permalink]

A nyílt adatokat nem elég szimplán publikálni, a potenciális felhasználóknak meg is kell tudnia találni ezeket. Ahelyett, hogy az adatokat véletlenszerűen publikálnák különböző weblapokon, az állam és más nagy adatközzétevők segíthetek az adahalmazaik felfedezhetővé tevésében azok katalógusokban vagy adatportálokon történő indexelésével.

felhő [Permalink]

A “felhőben” tárolt adatok kezelésért egy hosting cég felel, tehermentesítve ezzel az adattulajdonosokat a fizikai tárhelyek kezelésének feladata alól. Ezek az adatok egyetlen gép helyett több, akár különböző helyen lévő számítógépen lehetnek tárolva, vagy akár ezek között mozgatva, de az adattulajdonosoknak és a felhasználóknak nem szükséges ezek ismerete. A hosting cég feladata, hogy ezen adatok elérhetőek legyenek az interneten keresztül.

forráskód [Permalink]

Programozók által írt, programkódot tartalmazó fájlok, melyek egy szoftver létrehozásához szükségesek. A forráskódot általában olyan formába konvertálják, vagy “fordítják”, melyet a felhasználó számítógépe képes futtatni. Ezáltal, a felhasználó sosem láthatja az eredeti forráskódot, hacsak azt nem nyílt forráskódúként publikálják.

fájlformátum [Permalink]

Annak leírása, hogy egy fájl miképp van reprezentálva a számítógép merevlemezén. A formátum általában összhangban van a fájlnév utolsó részével (a “kiterjesztéssel”), például egy CSV formátumú fájl neve lehet iskola-lista.csv. A fájlformátum a fájl belső felépítésére utal, nem arra, hogy az miképp jelenik meg a felhasználó számára. Például, a CSV és az XLS fájlok jelentősen másképp vannak strukturálva, de egy táblázatkezelő alkalmazásban, például az Excel-ben megnyitva hasonlóan festenek.

geoadat [Permalink]

Bármely olyan adathalmaz, amelynek adatpontjai földrajzi fekvéseket tartalmaznak, például hosszúsági és szélességi fokokban, vagy más szabványos kódolásban. Térképek, szállítási útvonalak, környezeti és kataszteri adatok, valamint számos egyéb adat publikálható geoadatként.

gép által olvasható [Permalink]

Számítógépek számára automatikusan olvasható és feldolgozható formában szereplő adatok. Ilyen formátumok például a CSV, JSON, XML, stb. A gép által olvasható adatoknak strukturált adatoknak kell lenniük. Lásd még: ember számára olvasható.

A nem digitális anyagok (például nyomtatott, vagy kézzel írott anyagok) természetüknél fogva nem gép által olvashatóak. Azonban, a digitális anyagok sem feltétlenül azok. Vegyünk például egy táblázatos adatokat tartalmazó PDF dokumentumot. Habár ez egyértelműen digitális, de nem gép által olvasható, mivel a számítógép számára nehezen hozzáférhetőek a táblázatos információk - annak ellenére, hogy azok az emberek számára könnyedén olvashatóak. Ezen táblázat táblázatkezelő formátumban tárolt verziója gép által olvasható lenne.

Egy másik példa a szkennelt (fényképezett) szöveg, amely gép számára nem, de ember számára olvasható. Az ezzel ekvivalens szöveg például egy egyszerű ASCII szövegfájlban vagy egy szövegszerkesztő formátumban, például Microsoft Word-ben tárolva már gép által olvasható.

Megjegyzés: A megfelelő, gép által olvasható formátumok adattípusonként eltérnek - például, a földrajzi adatok tárolására szolgáló formátumok eltérnek a táblázatos adatokétól.

hackathon [Permalink]

Általában egy- vagy kétnapos események, ahol fejlesztők, a téma szakártői és mások összegyűlnek, hogy alkalmazásokat, vizualizációkat és prototípusokat készítsenek, és ezzel segítsenek megoldani egy adott terület problémáit, többnyire adatok nagyfokú felhasználásával. A meghatározott adatgyűjteményekre fókuszáló hackathonok lehetséges eszközei lehetnek az adatközzétevők és a közösség kapcsolatfelvételnek. A hackathon igen népszerű a nyílt forráskódot támogató közösségekben.

információ [Permalink]

Adatok strukturált gyűjteménye, amely emberek számára értelmezhető és feldolgozható formában szerepel. Az információ akkor alakul tudássá, amikor az kontextusba kerül az ember tudásával és világnézetével.

információszabadság [Permalink]

Más néven FOI (Freedom of Information). Egy közintézményeknek szóló jogi előírás (például az egyesült királyságbeli 2000. évi Freedom of Information Act vagy a indiai 2005. évi Right to Information Act), amely előírja, hogy az általuk kezelt adatokat kérésre a lakosság rendelkezésére kell bocsájtani, kivéve ha azok a meghatározott kivételek közé tartoznak, például bizalmas adatok. Attól, hogy bizonyos adatokat kötelező kiadni, azok általánosságban még nem lesznek nyílt adatok, mivel azok nem feltételenül vannak terjesztve, vagy nem érhetőek el nyílt licensz alatt, stb.

információszabadság [Permalink]

Más néven FOI (Freedom of Information). Egy jogi előírás (például az egyesült királyságbeli 2000. évi Freedom of Information Act vagy a indiai 2005. évi Right to Information Act) közintézmények számára, amely előírja, hogy az általuk kezelt adatokat kérésre a lakosság rendelkezésére kell bocsájtani, kivéve ha azok a meghatározott kivételek közé tartoznak, például bizalmas adatok. Annak ténye, hogy bizonyos adatokat kötelező kiadni, attól ezek általánosságban nem lesznek nyílt adatok, mivel azokat nem feltételenül vannak terjesztve, vagy nem érhetőek el nyílt licensz alatt, stb.

internet [Permalink]

Összekapcsolt számítógéphálózatok világméretű hálózata, amely az internet protokollkészlet (TCP/IP) segítségével hajt végre adatküldést és cserét több milliárd olyan eszköz között, amelyek logikai kapcsolatban állnak egy globálisan egyedi címtér által.

jogvédett [Permalink]

(i) Jogvédett szoftvereknek azokat a szoftvereket tekintjük, melynek tulajdonosa korlátozza a felhasználás feltételeit. A felhasználóknak többnyire fizetniük kell a használatért, nem tekinthetik meg és nem módosíthatják a forráskódot, nem készíthetnek másolatot és nem adhatják tovább azt saját termékük részeként. Ismert példák erre a Microsoft Excel és az Adobe Acrobat. A nem jogvédett szoftverek általában nyílt forráskóduak.

(ii) A jogvédett fájlformátumokat egyetlen cég birtokolja és irányítja. Az ilyen formátumban tárolt adatok megbízható feldolgozásához gyakran jogvédett szoftverekre van szükség. A nyílt formátumokkal ellentétben ezen formátumok leírása bizalmas, vagy nincs publikálva, és a cég bármikor változtathat rajta. A jogvédett szoftverek általában jogvédett formátumban tárolt adatokkal dolgoznak. Például, a Microsoft Excel különböző verziói az XLS és XLSX formátumokat használják.

kapcsolt adatok [Permalink]

Az adatreprezentáció egy formája, amelyben minden azonosító egy http://… URI, ami ahol lehetséges szabványos azonosító listákat használ (lásd szókészlet), és ahol az adathalmazok hivatkozásokat tartalmaznak azonos objektumokból álló referencia adathalmazokra. A kapcsolt adatok fő célja az adatintegrálás automatizálása, akár nagy adathalmazok esetén is. A kapcsolat adatokat általában RDF segítségével reprezentálják. Lásd még: a a nyílt adatok öt csillaga; triple store.

konnektivitás [Permalink]

A konnektivitás a közösségek internetre, különösképp a World Wide Webre való csatlakozásának képességét jellemzi.

konverzió [Permalink]

Egy folyamat, amely során adatokat olvasunk be egy adott fájlformátumból, majd azokat egy másik formátumba alakítjuk, hogy így több alkalmazás számára legyenek hozzáférhetőek.

korrupció [Permalink]

Visszaélés a köztisztséggel vagy közvagyonnal, például sikkasztás, kenőpénz elfogadása, indokolatlan költségelszámolás, barátok vagy adott csoportok előnyben részesítése a közfeladatok ellátására, stb. A nyílt adatok, általánosabban a nyílt állam fontos eszközei a korrupció elleni harcnak.

kutatási adatok [Permalink]

A műszaki és társadalomtudományi kísérleti kutatások nagy mennyiségű adatot termelnek. A tudományos adat kezelés (Research Data Management) egy most megjelenő módszertan, amely ezen adatok kezelésének legjobb gyakorlatait keresi. A kutatók a kutatási adatokat hagyományosan nem hozzák nyilvásságra, csak az elemzésükből születő tanulmányokat publikálják. A nyílt tudomány azt tartja, hogy ezeket is közzé kell tenni, részben, a munka alátámasztása okán, részben, hogy más kutatások is felhasználhassák őket. A nyílt tudományos közreműködés teljes szellemiségének átvétele már a projekt korai szakaszaiban is az adatok közzétevését szorgalmazná, azonban ennek széleskörű elterjedése a kutatási kultúra jelentős megváltozását igényelné.

költségmegtérülés [Permalink]

Az elv, melynek során árat rendelünk egy adott erőforráshoz - például adathoz - az adatgyűjtés költségének megtérülése céljából. Nem összetévesztendő a marginális költséggel. A költségek megtérülése okán pénzért árusított adatok az Open Definition szerint nem számítanak nyílt adatnak. Tanulmányok bebizonyították, hogy a pénzért árult közadatok kisebb mértékben képesek elterjedni mint az ingyenesen, vagy a marginális költségek fedezésére szolgáló összegért elérhető adatok.

közadatok [Permalink]

Az állami szektor által gyűjtött és kezelt adatok.

közkincs [Permalink]

Azt a tartalmat, amelyre nem vonatkozik a szerzői jog - például mert már lejárt - és bárki számára ingyenesen felhasználható, közkincsnek nevezik. A Creative Commons CC0 licensze segít a “közkinccsé tevésben” azzal, hogy segíti az adott mű jogairól történő lehető legnagyobb mértékű lemondásban.

közzétevő [Permalink]

Bárki, aki adatokat vagy más tartalmat terjeszt és tesz elérhető. Beletartoznak az állami szervek, ügynökségek, kutatóintézetek, civilszervezetek, a média, üzleti vállalkozások, magánemberek, stb.

közösségi hack [Permalink]

Olyan (többnyire online) eszközök és közösségek, amelyek egy adott lakossági vagy szociális problémával foglalkoznak. Például, olyan eszközök amelyek segítenek a helyi, hasonló gondolkodású és érdeklődésű emberek összehozásában, amellyel be lehet jelenteni az önkormányzatnak a hibás infrastukturális elemeket, vagy segítenek megszervezni a lakhelyünk környezetében lévő szemét eltakarítását. A lokális szintű nyílt adatok különösen hasznosak ilyen közösségi projektek esetén.

lekérdezés [Permalink]

Egy adatbázisok által elfogadott, az általuk tárolt adatokra vonatkozó kérdéstípus. Egy komplex lekérdezés segítségével kiválaszthatjuk az adatbázisból feltételeinknek megfelelő rekordokat, aggregálhatunk belőlük bizonyos mennyiségeket, stb. Számos adatbázis erre egy specizalizált SQL nyelvet, vagy annak valamely dialektusát használja. A webes API-k lehetővé teszi az alkalmazások számára, hogy a weben keresztül intézzenek lekérdezéseket. Az adatok letöltéséhez és feldolgozásához mérve ez csökkenti a szükséges számítási kapacitást és sávszélességet.

licensz [Permalink]

Egy jogi eszköz, amelynek segítségével a szerzői jogok birtokosa jogosultságot adhat másoknak a védett mű felhasználására. Nyílt adatokról és tartalomról akkor beszélhetünk, ha azokra explicit módon egy Open Definition-nek megfelelő licensz vonatkozik. Számos szabványos nyílt licensz létezik, ilyen például a Creative Commons CC-BY, amely csak attribúciós, azaz eredetmegjelölési követelménnyel rendelkezik.

licenszkeverés [Permalink]

Amennyiben X projekt tartalmat publikál, és magába szeretné foglalni Y projekt valamilyen tartalmát, ahhoz az szükséges, hogy Y licensze legalább azonos mértékű újrafelhasználást engedélyezzen, mint X. Egy példa a licenszek nem megvalósítható keverésére: ha egy tartalom kizárólag nem kereskedelmi célú felhasználást engedélyező licensszel rendelkezik, az nem emelhető be a Wikipedia-ra, mert a Wikipedia nyílt licensze megengedi a kereskedelmi célú újrafelhasználást, ami nem valósulhat meg ezen adatok esetén.

magánélet(hez való jog) [Permalink]

A magánélethez való jog része, hogy a személyes adatok nem hozhatók nyilvánosságra. Ezt a jogot elismeri az Emberi Jogok Egyetemes Nyilatkozata és az Emberi Jogok Európai Egyezménye is. Lásd adatvédelmi törvények.

marginális költség [Permalink]

Az erőforrások, például adatok új másolatának előállítási költsége. Az Open Definition szerint, ha egy adatot nyíltnak tekintünk, csak annyi pénzt kérhetünk érte, mint annak marginális költsége. Ha az adatok interneten keresztül letölthetőek, a marginális költség általában nulla. Különleges esetekben előfordulhat némi marginális költség, például ha az adatok mérete miatt azokat lemezeken kell postázni.

metaadat [Permalink]

Információ egy adathalmazról, például cím, leírás, az adatgyűjtés módszere, szerző vagy kiadó, téma, tárgyidőszak, licensz, dátum, kiadás gyakorisága, stb. Kulcsfontosságú, hogy adatokat megfelelő metaadatokkal együtt publikáljunk, hogy azt felfedezhetővé tegyük és javítsuk a felhasználhatóságát.

nem üzleti célú [Permalink]

Egy licencsz részét alkotó megkötés, amely megszabja, hogy az adott tartalom “üzleti” célra történő szabad újrafelhasználása nem megengedett. A nem kereskedelmi célú megkötéssel rendelkező tartalom vagy adat az Open Definition értelmében nem számít nyílt adatnak. Ez a korlátozás csökkenti a tartalom gazdasági értéket, problémát okoz a licenszkeverésben, továbbá sokszor több használati esetet zár ki, mint eredetileg tervezték (például, gyakran nem tiszta, hogy az oktatási felhasználás “üzleti célnak” számít-e). Az efféle licensz eredeti szándékát jobban tükrözheti egy “így add tovább” típusú licensz.

nyers adat [Permalink]

Az a gép által olvasható formában szereplő eredeti adat, amely alapjául szolgál minden alkalmazásnak, vizualizációnak, publikált kutatásnak, értelmezésnek, stb.

nyílt adat [Permalink]

Egy adat akkor nyílt, ha az mindenki számára szabadon hozzáférhető, felhasználható és módosítható bármilyen célból, továbbá legfeljebb a forrásmegjelölés és az “add tovább licensz” követelményeivel rendelkezik. A nyílt adatok pontos meghatározását az Open Definition írja le, ez alapján az adatnak két fő kikötésnek kell megfelelnie: A. Jogi nyíltság: az adatnak nyílt licensszel kell rendelkeznie, ami megengedi a szabad hozzáférést, újrafelhasználást és továbbadást B. Technikai nyíltság: az adatért legfeljebb annak reális reprodukciós költsége kérhető el, gép által olvasható formában kell szerepelnie és egyben letölthető kell legyen.

nyílt formátum [Permalink]

Olyan fájlformátum, amely nem rendelkezik pénzügyi vagy egyéb korlátozással, és feldolgozható legalább egy ingyenes/szabad felhasználású/nyílt forráskódú szoftvereszköz segítségével. A szabadalmak gyakori forrásai ezen korlátozásoknak, ebben az esetben a formátum jogvédettnek számít. A nyílt formátumok felépítését gyakran, de nem szükségszerűen elfogadott szabványokban definiálják, melyet egy nem profitcélú szakértői testület ad ki és felügyel. A nyílt fájlformátumok garantálják, hogy több különböző szoftver is képes megfelelően beolvasni, és lehetséges az ezek közt történő adatátvitel.

nyílt hozzáfférés (open access) [Permalink]

Az open acces, másnéven nyílt hozzáférés alapelve, hogy a publikációknak és kutatási eredményeknek, különösképp az államilag finnanszírozott kutatásoknak mindenki számára ingyenesen elérhetőnek kellenne lennie. Ez szemben áll azzal a hagyományos modellel, ahol a kutatásokat előfizetési díj ellenében elérhető folyóiratokban publikálják. A nyílt adatokhoz hasonló előnyökön túl a nyílt hozzáférés támogatói azt vallják, hogy erkölcstelen potenciálisan életmentő és értékes kutatásokat elzárni olyan olvasók elől, akik képesek lehetnek azokat felhasználni vagy további kutatásokat tudnának végezni a segítségükkel. Manapság már elérhetőek nyílt hozzáférésű folyóiratok, és a kutatások finanszírozását végző felek érdeklődése révén a mozgalom kezd egyre nagyobb teret nyerni, különösen a tudományok területén.

nyílt mozgalmak [Permalink]

A nyílt mozgalmak célja, hogy megoldást találjanak a világ legégetőbb problémáira, az átláthatóság, együttműködés, újrafelhasználás és szabad hozzáférés szellemében. Többek közt beletartoznak a nyílt adatok, nyílt állam, nyílt fejlesztés, nyílt tudomány mozgalmak. Kulcseszközei a részvételi folyamatok, a tudás és eredménymegosztás, valamint a nyílt forráskódú szoftverek. A “nyíltság” adatokra, tudásra és tartalomra vonatkozó definícióját az Open Definition határozza meg.

nyílt szabványok [Permalink]

Általában olyan műszaki szabványokra értik, amelyek mentesek a licenszelési megkötésektől. Más értelmezésben olyan szabványok, amelyek gyártofüggetlen felfogásban készültek.

nyílt tudomány [Permalink]

Nyílt irányvonalak mentén történő kutatás, beleértve a nyílt hozzáférésű publikációt, a kutatási adatok és a kapcsolódó forráskódok publikálását és az ezekkel történő kollaborítív munkát, valamint a nyílt forráskódú adatfeldolgozási eszközök fejlesztését és használatát.

nyílt állam [Permalink]

A nyílt állam, a nyílt mozgalmakhoz hasonlóan arra törekszik, hogy az állam működése transzparens, elszámolható, valamint a lakosság felé reszponzív legyen. Magában foglalja a demokrácia, a tisztességes eljárás, a lakossági részvétel és a nyílt állami adatok elveit. A nyílt állam kiterjedtebb megközelítése törekszik arra is, hogy lehetővé tegye a lakosság részvételét például a törvénytervezetek és költségvetési kérdések előkészítésében és módosításában. Lásd OGP.

strukturált adatok [Permalink]

Habár minden adat rendelkezik valamiféle struktúrával, a “strukturált adatok” kifejezést olyan adatokra értjük, melyben az elemek közti kapcsolat explicit módon szerepel a számítógépen tárolt adatokban. A népszerű XML és JSON formátumok lehetővé teszik számos struktúratípus ábrázolását. A szövegszerkesztőkben használt formátumok és a PDF dokumentumok belső struktúrája például az oldalakon megjelenő elemek pozícióját tükrözik, nem a logikai struktúrájukat, így azok automatikus kinyerése ennek megfelelően nehéz, vagy lehetetlen.

szabvány [Permalink]

Egy nyilvános specifikáció, például egy adott fájlformátum felépítése, egy adott terület javasolt nevezéktana, közös metaadat mezők, stb. A releváns szabványoknak való megfelelés jelentősen növeli a közzétett adatok értékét, a gép általi olvashatóság javításával és az adatintegrálást megkönnyítésével.

szellemi tulajdonjogok [Permalink]

Magánszemélyeknek biztosított monopóliumok a szellemi termékekkel kapcsolatban.

szerver [Permalink]

Egy internetre kapcsolt számítógép, melyet általában egy szolgáltató kezel, és amely felhasználói kérdésekre válaszol: pl. weblapokat szolgál ki, letölthető fájlokat kínál, vagy lehetővé teszi a szerveren futó SaaS alkalmazások képességeihez való hozzáférést.

szerzői jog [Permalink]

Egy adott szellemi termék (például egy könyv) alkotójának az adott műre vonatkozó jogai. Habár a különálló adatok (tények) önmagukban nem esnek szerzői jogi védelem alá, az adatbázisok az adatok kiválasztása és elrendezése révén többnyire igen. Az Európai Únion belül külön “adatbázis jogok” vonatkoznak azokra az adatbázisokra, amelyeknél jelentős munkát jelentett az adatok “megszerzése”. A jogbirtokos licenszek segítségével engedélyezheti mások számára a védett anyagok felhasználását, bizonyos esetekben adott korlátozásokkal ellátva azt.

szolgáltató [Permalink]

Egy cég, amely az ügyfelek adatait a saját (a szolgáltató) számítógépein tárolja, ésteszi ezeket elérhetővé az interneten. Tárhelyről üzemeltetett szolgáltatásoknak nevezzük azt, ha az alkalmazás a szolgáltató számítógépein fut és tárol adatokat, és a hálózaton keresztül érhető el. Lásd még: SaaS.

szókészlet [Permalink]

Egy szabvány, amely specifikálja az adott objektumgyűjteményhez használatos azonosítókat. A szabványos szókészletek használata kulcsfontosságú az adatintegráció lehetővé tevéséhez. A kapcsolt adatok gazdag szókincset kínál számos tématerülethez.

sávszélesség [Permalink]

A számitógépek közti adattovábítás sebessége. Mivel a sávszélesség korlátozott, az appok törekednek arra, hogy csak a minimálisan szükséges adatmennyiséget töltsék le a felhasználó kérésének teljesítéséhez.

triplet store [Permalink]

Az RDF adatok “tripletjeit” speciális adatbázisokban, un. triplet store-okban tárolják, melyben SPARQL lekérdezőnyelv segítségével végezhetünk el lekérdezéseket.

tudás [Permalink]

Egy személy - vagy az emberiség - rendelkezésére álló információk, amelyek segítségével megérti a világot. Lásd még adat

táblázat [Permalink]

Egy adatokból és számításokból álló táblázat, amelyet specializált táblázatkezelő programok, például a Microsoft Excel vagy OpenOffice Calc képesek interaktívan feldolgozni.

társadalmi részvétel [Permalink]

A társadalom aktív részvétele a döntéshozásban és törvénykezésben. A társadalmi részvétel a nyílt állam kezdeményezések fő célja. Ezen mozgalmak szeretnék elérni a döntéshozatal jobbá tételét, illetve megszerezni vagy megtartani a lakosság beleegyezését és támogatását. A nyílt adatok kulcsfontosságú eszközei az informált társadalmi részvételnek.

több szem elv [Permalink]

Ha valami több ember számára látható, akkor együtt nagyobb eséllyel találnak benne hibákat. A nyílt adatok publikálása ezáltal segíthet az adatok pontosságának és adatminőségének javításában, különösen ha rendelkezésre áll egy kényelmes felület a hibák jelentésére. Lásd még crowdsourcing.

unconference [Permalink]

Egy konferenciához hasonló találkozó, ahol nincs előre egyeztetett menetrend. A résztvevők különböző, előre kidolgozott technikák segítségével közösen egyeznek meg, hogy aznap milyen szekciók lesznek. Néhány esetben az eseményen hagyományosabb konferenciaszekciók is szerepelnek meghívott előadókkal. Az uncamp népszerű formátum a műszaki közösségben, és akár párhuzamosan is futhat egy nyílt adatokkal foglalkozó hackathon-nal. Egy lehetséges módja az adatközzétevők közösséggel történő interakciójának.

valós idejű [Permalink]

Folyamatosan frissülő adatok (például egy adott vonat helyzete a vasúthálózaton), melynél a lekérdezés mindig az adat legfrissebb verziójára vonatkozik.

vizualizáció [Permalink]

Az adatok vizuális ábrázolása gyakran az adatok kommunikálásának legcélszerűbb módja: kiemeli annak fő tulajdonságait, összefüggéseit és rejtett tulajdonságait. Habár számos eszköz létezik erre, az adathalmazok ábrázolásának létrehozása nem automatikus folyamat. Egy olyan vizuális ábrázolás elkészítéséhez, amely hűen ábrázolja az adatok jelentését, különös figyelmet kell fordítanunk a változók jelentésére, a köztük lévő kapcsolatra és az adatok értelmezésére.

web [Permalink]

A World Wide Web összekapcsolt, hivatkozható dokumentumok és szolgáltatások hatalmas gyűjteménye, melyet az interneten keresztül érhetünk el “webböngészők” segítségével.

web API [Permalink]

Egy API, amely kifejezetten internetes működésre van tervezve.

állami adatok [Permalink]

Az állam munkájába beletartozik a nagy mennyiségű adatgyűjtés, melynek jelentős része nem bizalmas jellegű (gazdasági-, demográfiai-, költségvetési-, bűnözési- és közlekedési adatok, stb.). Ezen adatok értékét nagy mértékben növelheti, ha nyílt adatként adják közre őket, lehetővé téve az újrafelhasználást üzleti vagy kutatási célokra, valamint a civil társadalom, adatújságírók, és további érdeklődök számára.

átláthatóság [Permalink]

Egy állam vagy más szervezet akkor számít átláthatónak, ha a munkája és döntéshozási folyamata könnyen érelmezhető, megfelelően dokumentálva van, és nyitott az ellenőrzésre. Az átláthatóság a nyílt állam egyik aspektusa. A nyílt adatok használatának egyik előnye az átláthatóság javítása.

így add tovább licensz [Permalink]

Egy licensz, amely elvárja, hogy a mű felhasználói a tartalmat az eredetivel megegyező, vagy ahhoz hasonló feltételekkel kínálják.

újrafelhasználás [Permalink]

Ritka, hogy az adott célra gyűjtött adatoknak ne lenne más lehetséges felhasználási módja. Szerencsére, az adat egy végtelen erőforrás (lásd A magánlegelők tragédiája); ha már összegyűjtötték, bármior újra és újra felhasználható, akár oly módon, ami eredetileg fel sem merült - feltéve, hogy az adatbirtokos azt egy nyílt licensz segítségével újrafelhasználhatóvá tette-