guide

כיצד לפתוח מידע

Languages:  de  el  en  es  fr  he  hr  id  is  it  ja  ko  lt  lv  nl_BE  pt_BR  ro  ru  zh_CN  zh_TW 

פרק זה מהווה את חלקו העיקרי של מדריך זה. הוא נותן שיעור בסיסי ומפורט, כיצד מי שהמידע נמצא ברשותם יכולים לפתוח אותו. הפרק דן בבסיס, אבל גם מכסה את המלכודות. לבסוף, הוא דן בנושאים מורכבים יותר שיכולים לעלות.

ישנם שלושה כללים, שאנו ממליצים ליישם אותם כאשר פותחים מידע:

  • שימרו על פשטות. התחילו בקטן, פשוט וזריז. לא קיים שום הכרח, שכל מערך מידע קיים חייב להיפתח כעת. אפילו פתיחה של מערך מידע אחד, או רק חלק ממערך מידע גדול, מספיקים. מובן, שככל שתפתחו יותר מערכי מידע, כך ייטב.

זכרו שאנו מדברים על חדשנות. להתקדם כמה שיותר מהר זה טוב, משום שכך תוכלו ליצור מומנטום וללמוד מהנסיון. חדשנות פירושה גם הצלחות וגם כשלונות, ולא כל מערך מידע יהיה שימוש.

  • צרו קשר מוקדם ולעיתים קרובות* צרו קשר עם צרכני מידע ומשתמשים חוזרים במידע, מוקדם ככל הניתן ולעיתים קרובות ככל שתוכלו, בין אם אלה אזרחים, אנשי עסקים או מפתחים, בפועל ופוטנציאלים, מוקדם ככל שניתן . הם יבטיחו, שבפעם הבאה שתיתנו להם שירות, הוא יהיה רלוונטי ככל שניתן לצרכיהם.

חיוני לזכור, שרוב המידע לא יגיע ישירות למשתמשים המתאימים, אלא דרך אנשי ביניים - עורכי המידע. אלה האנשים שמקבלים את המידע ומסבים או עורכים אותו להצגתו. לדוגמה, רובנו לא רוצים או זקוקים למאגר המידע הגדול של קואורדינטות ה- GPS. פשוט נעדיף מפה. לכן, צרו קשר עם עורכי המידע תחילה. הם ימחזרו את המידע ויתאימו אותו לצרכים.

  • תנו מענה לפחדים ולאי-הבנות. הדבר חשוב, במיוחד אם אתם עובדים עם או בארגונים גדולים, כמו ממשלות. כאשר פותחים מידע, תתקלו בהרבה שאלות ופחדים. חשוב לזהות את החשובים שבהם ולתת להם מענה, מוקדם ככל שאפשר.

ישנם ארבעה שלבים עיקריים בפתיחת מידע, כל אחד מהם יפורט בהמשך. סדר השלבים אינו חשוב - רבים מהם ניתן לבצע במקביל.

  1. בחרו את מערכי המידע שלכם. בחרו את בסיס(י) המידע שאתם מתכננים לפתוח. זכרו, שייתכן ותאלצו לחזור על שלב זה אם תיתקלו בבעיות בהמשך.
  2. הגש בקשה לרישיון פתוח
    1. קבע אילו זכויות קניין רוחניות מגינות על המידע
  1. הגש בקשה לרישון “פתוח” מתאים, שנותן את כל הזכויות הללו ותומך בהגדרה של פתיחות, כפי שנדונה בפרק “מהו מידע פתוח””
  2. הערה: אם אינכם מצליחים, חזרו לשלב מס’ 1 ונסו מערך מידע אחר.
  1. הנגישו את המידע - בפורמט יעיל והמוני. תרצו אולי גם לשקול דרכים חלופיות, למשל שימוש ב- API (ממשק תכנות אפליקציה)
  2. עשו שהמידע יהיה קל לחיפוש - הפיצו ברשת, ואולי גם תקימו קטלוג של כל מערכי המידע שלכם במקום מרכזי אחד.

בחר מערך(י) מידע

בחירת מערכי המידע שאתם מתכוונים לפתוח, היא הצעד הראשון, אולם כדאי לזכור, כי התהליך של פתיחת נתונים הוא מחזורי ואתם יכולים לחזור לצעד זה מאוחר יותר, אם אתם נתקלים בבעיות.

אם אתם יודעים במדויק אילו מערכי מידע אתם מתכננים לפתוח, עברו לסעיף הבא. עם זאת, במקרים רבים, בייחוד במוסדות גדולים, בחירת מערכי המידע הראויים לפתיחה מהווה אתגר. כיצד עליכם לפעול במקרה זה?

יצירת רשימת בסיסי הנתונים הניתנים לפתיחה, צריכה להיות תהליך מהיר, במהלכו מזהים את בסיסי הנתונים שכדאי להתחיל מהם. יהיה זמן בשלבים מאוחרים יותר, לבדוק בפרוטרוט האם בסיסי הנתונים מתאימים..

אין שום צורך ביצירת רשימה הכוללת את כל בסיסי הנתונים של מערך המידע. הנקודה העיקרית שיש לזכור היא, האם ניתן בקלות לפרסם את המידע בכלל (פתוח או אחרת) - ראו את הפרק הקודם “איזה מידע ניתן לפתוח”.

לשאול את הקהילה

אנו ממליצים שתייעץ עם הקהילה במקרה הראשון. הכוונה לאנשים שיגשו למידע וישתמשו בו, והם אלה שיש להם את ההבנה, איזה מידע הוא בעל ערך.

  1. הכינו רשימה קצרה של בסיסי נתונים פוטנציאלים, שתרצו משוב לגביהם. אין זה משנה שרשימה זו תתיישב עם הציפיות שלך - הכוונה העיקרית, היא לתת את תחושת הצורך. זה יכול להתבסס על :מושג: ‘מידע פתוח’ של ארצות אחרות.
  2. צור בקשה להערות
  3. פרסם את בקשתך בדף אינטרנט. וודא שניתן להגיע אליו בכתובת אינטרנט ישירה. בדרך זו, כאשר ישתפו את הבקשה ברשתות החברתיות, ניתן יהיה להגיע אליה בקלות.
  4. שליחת תגובות להצעה צריכה להיות פשוטה. הימנע מלהתנות זאת ברישום כלשהו - הדבר יוביל לצמצום התגובות.
  5. הפץ את הבקשה ברשימות דיוור רלוונטיות, פורומים ואחרים, תוך קישור לדף הבקשה.
  6. ערוך אירוע היוועצות. קבע אותו במועד שיהיה נוח גם לאיש העסקים, גם לשוחר המידע וגםלפקיד הממשל.
  7. בקש מפוליטיקאי לשאת דברים מטעם הגוף אותו אתה מייצג. סביר ,שמידע פתוח יהווה חלק ממדיניות רחבה יותר של הגברת הנגישות למידע ממשלתי.

בסיס העלות

כמה כסף מוציאות חברות על איסוף ותחזוקת מידע שברשותן? אם הן מוציאות סכום גדול על סוג מסוים של מידע, סביר שאחרים ירצו להגיע אליו.

טיעון זה עלול להיות רגיש למדי לדאגה מפני “נסיעת חינם”. תצטרכו לענות על השאלה, מדוע יש לתת בחינם מידע, שהינו כה יקר? התשובה היא, שההוצאה נספגת על-ידי הסקטור הציבורי, כדי לבצע תפקוד מסוים. העלות של שליחת מידע זה, מרגע שנאסף, לצד שלישי, היא שולית. לפיכך, אין לחייבם כלל.

קלות השחרור

לעתים, במקום להחליט מה יהיה המידע היקר ביותר, כדאי לראות מהו המידע שיהיה הכי קל להעבירו לידי הציבור. שחרורים קטנים ופשוטים יכולים לשמש כזרזים לשינוי התנהגות של ארגונים.

למרות זאת, יש להיזהר עם גישה זו. ייתכן שלשחרורים קטנים אלה אין ערך ממשי, וכשום דבר לא יוכל לצמוח מהם. אם זה קורה, האמונה בפרויקט כולו עלולה להתערער.

צפה בשותפיך

התנועה למידע פתוח נמצאת בתהליך צמיחה. סביר שיהיו רבים בסביבתך, שמבינים מה קורה במקומות אחרים. צור רשימה על בסיס מה שחברות אלה עושות.

הגש בקשה לרישון פתוח (פתיחות חוקית)

ברוב אזורי השיפוט בעולם קיימות זכויות קניין רוחני למידע, שמונעות מגורמי צד שלישי שימוש, שימוש-מחדש והפצה של המידע, ללא רשות מפורשת. אפילו במקומות בהם הזכויות לא ודאיות, ישנה חשיבות להשתמש ברישיון לשם הבהירות. לפיכך, אם אתם מתכוונים להפוך את המידע שלכם לזמין, עליכם לשחררו ברישיון, ואם רצונכם שהמידע יהיה פתוח הדבר, אפילו חשוב יותר.

באילו רישיונות אתם יכולים להשתמש? אנו ממליצים שעבור מידע ‘פתוח’ תשתמשו באחד מהרישיונות, העומדים ב’הגדרת הפתיחות’ ומתאימים למידע. הרשימה (לצד הוראות שימוש) זמינה כאן:

מדריך קצר (באנגלית) לשימוש ברישיונות מידע פתוח ניתן למצוא באתר ה-Open Data Commons

הנגישו את המידע (פתיחות טכנית)

:מונח:,מידע פתוח’ צריך להיות פתוח הן טכנית והן מבחינה חוקית. באופן ספציפי, המידע צריך להיות זמין ברובו בפורמט דיגיטלי.

Available

המידע צריך להיות מתומחר במחיר סביר בלבד של אחזורו, עדיף בצורה שניתנת להורדה חופשית באינטרנט. מודל התמחור הוא כזה, משום שהגוף בו אתם עובדים צריך לפעול ללא כוונת רווח, כשהוא מנגיש מידע.

In bulk

המידע צריך להינתן כמערך מלא. אם יש לכם מידע רשמי שנאסף בהוראת חוק, כל המידע צריך להיות נגיש להורדה. API או שירות דומה מאוד יעילים, אבל אינם משמשים תחליף לגישה המונית לחומר.

In an open, machine-readable format

שימוש חוזר במידע שמוחזק על-ידי גוף ציבורי, אסור לו להיות מוגבל במגבלות של פטנט. חשוב מכך,שמירה על פורמט קריא על-ידי מחשב מאפשרת שימוש חוזר רב יותר של המידע. לצורך הדגמה, חישבו על מידע סטטיסטי, שמפורסם בפורמט PDF, שניתן להדפיסו באיכות גבוהה. בעוד שמסמכים כאלה נקראים על-ידי בני אדם, קשה מאוד לעשות בזה שימוש ממוחשב. הדבר מגביל מאוד שימוש חוזר של מידע שכזה.

להלן כמה עקרונות שיהוו רווח משמעותי:

  • שמרו על פשטות
  • פעלו במהירות
  • היו תכליתיים

במיוחד עדיף לתת מידע לא מעובד כעת, מאשר לתת אותו בצורה מושלמת בעוד חצי שנה.

יש הרבה יותר מדרך אחת, לתת מידע לאחרים. הדבר הטבעי ביותר כיום, זה לתת אותו באינטרנט. יש צורות רבות לכך - באופן בסיסי, גופים מוסרים מידע דרך אתרי האינטרנט שלהם, וקטלוג מרכזי מפנה את המבקרים למקור המתאים. גם לכך דרכים חלופיות.

כאשר ה:מונח:’קישוריות’ מוגבלת, או גודל המידע גדול באופן קיצוני, ניתן לאשר הפצה בפורמטים אחרים. חלק זה ידון גם בדרכים חלופיות, שיכולות לאפשר שמירה על מחירים נמוכים.

שיטות מקוונות

דרך אתר האינטרנט שלכם

השיטה המוכרת ביותר לאנשי התוכן שלכם, תהיה לאפשר הורדת קבצים דרך האינטרנט. בדיוק כפי שאתם מאפשרים כיום גישה למסמכי דיון, כך קבצי מידע ניתנים להורדה באותה דרך.

קושי אחד בגישה זו, הוא שקשה מאוד למישהו מבחוץ למצוא מידע עדכני בתוך האתר. אפשרות זו מטילה אחריות על מי שמפתח כלים לשימוש במידע שלכם.

באמצעות אתרי צד שלישי

אתרי מידע רבים הפכו למרכזי ידע בתחומים ספציפיים. לדוגמה, pachube.com מיועד לחבר אנשים עם חיישנים, לאלה המחפשים גישה למידע שלהם. Infochimps.com ו- Talis.com מאפשרים לגופים ציבוריים לאחסן כמויות גדולות של מידע בחינם.

אתרי צד שלישי יכולים להיות מאוד יעילים. הסיבה העיקרית לכך היא, שיש להם כבר קהילת מתעניינים, ומערכים שונים של מידע. כאשר המידע שלכם הופך להיות חלק מהפלטפורמות האלה, נוצרת התעניינות צירופית חיובית.

פלטפורמות אחסון מידע כבר מספקות את התשתית, שיכולה לענות על הדרישה. לרוב הן מספקות מידע סטטיסטי ושימושי. לגופים בסקטור הציבורי הדברים נעשה לרוב ללא תמורה.

יכולים להיות שני מחירים לפלטפורמות אלה: הראשונה היא עצמאות. הגוף בו אתם עובדים צריך להיות מסוגל למסור שליטה לאחרים. לרוב, זה דבר קשה פוליטית או תפעולית. המחיר השני הוא פתיחות. וודאו שפלטפורמת המידע שלכם “עיוורת” לגבי מי שיכול לגשת למידע. מפתחי תוכנה ומדענים משתמשים במערכות הפעלה רבות, מטלפונים חכמים למחשבי על. לכולם צריכה להיות גישה למידע.

דרך שרתי FTP

שיטה פחות עכשווית למתן גישה למידע, היא באמצעות שרתי FTP. הצורה הזו מתאימה לקהל יעד טכני, כמו מפתחי תוכנה ומדענים. מערכת ה- FTP מחליפה את ממשק ה- HTTP, אבל היא מיועדת להעברת קבצים.

שירות FTP עדיף פחות. במקום להיכנס לאתר אינטרנט, אתר FTP דומה מאוד לתיקיות במחשב. לכן, למרות שזו שיטה מתאימה לשימוש, יש מעט מאוד דרישה ממפתחי ווב להקים אתרים כאלה.

כטורנטים

:מונח:’BitTorrent’ היא מערכת מוכרת למקבלי ההחלטות, משום הקישור בינה ובין הפרת זכויות. מערכת זו עושה שימוש בקבצים הנקראים טורנטים (Torrents), שמחולקים בין כל מי שמנסה לגשת אליהם. במקום להעמיס על שרתים, ההיצע מתגבר כשהביקוש גובר. זו הסיבה, שמערכת זו כה מצליחה לשיתוף סרטים. זו דרך יעילה בצורה נפלאה להפצת כמויות גדולות של מידע.

כ- API

מידע יכול להיות מופץ באמצעות API (‘Application Programming Interface’). ממשקים אלה הפכו פופולריים מאוד. הם מאפשרים למתכנתים לבחור בכמויות מסוימות של מידע, במקום לספק את כל המידע כקובץ גדול. ממשקי API קשורים במיוחד לבסיסי מידע שמתעדכנים בזמן אמת. המשמעות היא, שמסירת מידע באמצעות API יכולה להבטיח שהמידע עדכני.

מסירת מידע לא מעובד בכמויות גדולות היא הדאגה הגדולה של יזמי מידע פתוח באשר הם. יש כמה עלויות למסירת מידע באמצעות API:

  1. המחיר. נדרש זמן פיתוח ואחזקה ארוך יותר, מאשר מסירת קבצי מידע.
  2. הציפיות. כדי לטפח קהילת משתמשים במידע, חשוב לספק יציבות. כאשר דברים משתבשים, יצפו מכם לתקן אותם ללא עלות.

גישה לכמויות גדולות של מידע מבטיחה:

  • אין כל תלות בספק המקורי של המידע, כלומר, אם המידע משתנה או שינויים תקציביים משנים את המצב, המידע עדיין זמין.
  • כל אחד אחר יכול להשיג עותק ולהפיץ אותו לשימוש חוזר. זה מפחית את עלות ההפצה החוזרת ממפיץ המידע המקורי, ומבטיח שאין נקודת כשל יחידה.
  • אחרים יכולים לפתח שירותים משלהם, בהתבסס על המידע, משום שהם יהיו בטוחים שמידע הזה לא ילקח מהם.

מתן מידע בכמות גדולה מאפשר לאחרים להשתמש במידע, מעבר למטרותיו המקוריות. לדוגמה, ניתן להמיר אותו לפורמט חדש, לקשר אותו למקורות אחרים, או לתת לו גרסאות ולשמור אותו במקומות שונים. בעוד שהגרסה העדכנית של המידע צריכה להימסר באמצעות API, מידע לא מעובד יכול להימסר בכמויות גדולות, בזמנים קבועים.

לדוגמה, לשירות הסטטיסטי של הרכבת האירופית יש אתר הורדות ,המכיל יותר מ- 400 קבצים. השירות מעודכן פעמיים ביום ומציע קבצים בפורמט TSV (Tab-separated values). הוא כולל מסמכים על האתר עצמו, כמו גם על קבצי המידע.

דוגמה נוספת, היא קטלוג המידע של מחוז קולומביה, שמאפשר להוריד את המידע בפורמט CSV או אקסל, בנוסף לפיד חי של המידע.

וודאו שהמידע קל למציאה

:מונח:’מידע פתוח’ לא קיים ללא משתמשים. אתם חייבים להיות מסוגלים לוודא, שאנשים יכולים למצוא את מקור החומר. חלק זה יסקור גישות שונות.

הדבר החשוב ביותר, הוא לספק חלל נייטרלי, שיעקוף פוליטיקה בין-גופית ודיוני תקציב עתידיים. גבולות שיפוט, סקטוריאליות או גיאוגרפיות, יכולים להקשות על שיתוף פעולה. למרות זאת, יש יתרונות ברורים באיחוד כוחות. ככל שקל יותר לאנשים מבחוץ לגלות מידע, כך הם יפתחו יותר כלים יעילים לשימוש בו.

כלים קיימים

יש ברשת הרבה כלים, שמיועדים להקל על חיפוש ומציאת מידע.

אחד הפופולריים בהם הוא DataHub, שמהווה קטלוג ומקום אחסון למערכי מידע מכל העולם. אתר זה מקל על יחידים וארגונים לפרסם חומר, ולמשתמשי מידע למצוא דברים שהם זקוקים להם.

בנוסף, ישנם עשרות קטלוגים מתמחים לסקטורים ומקומות שונים. קהילות מדענים רבות יצרו מערכות קטלוגיות לעצמן, כי המידע נדרש לצורך הפירסומים שלהן.

לממשל

כפי שהתברר, שיטה מקובלת לחברות מובילות, היא יצירה של קטלוג למידע ממשלתי. כשיוצרים קטלוג, נסו ליצור מבנה, שיאפשר למרב הגופים לעדכן את המידע שלהם.

הימנעו מפיתוח תוכנה שתטפל במידע - יש תוכנות קוד פתוח חינמיות, כמו CKAN (ckan.org) שנמצאות כבר בשימוש ממשלות רבות. השקעה בפלטפורמות אחרות תהיה מיותרת.

ישנם כמה דברים, שלא קיימים ברוב הקטלוגים של מידע פתוח. התוכנית שלכם יכולה לקחת בחשבון את הדברים הבאים:

  • לתת אפשרות לגופים פרטיים וציבוריים להוסיף מידע משלהם. עדיף לחשוב על הקטלוג כעל דבר תחומי, מאשר דבר אזורי-ממשלתי.
  • מתן אפשרות לשיפור המידע, על-ידי מתן האפשרות לקטלג את מערך המידע. לדוגמה, משתמש יכול לקודד כתובות באמצעות geocodes ואולי ירצה לשתף תוצאות אלה עם אחרים. אם מרשים רק גרסאות יחידות של מערכי המידע, שיפורים אלה יישארו חבויים.
  • היו סובלנים, כשהמידע שלכם יופיע במקומות אחרים. כלומר, סביר שמידע יועתק לקהילות בעלות עניין. אם יש לכם מידע ניטור על נהרות, ייתכן שהמידע שלכם יופיע בקטלוג מידע של הידרולוגים.
  • וודאו שהגישה למידע שווה לכולם. נסו להימנע ממתן זכויות יתר לגישה של גורמים או חוקרים רשמיים, כי זה יפגע בשיתוף הפעולה של הקהילה ובמעורבות שלה.

לחברה האזרחית

היו נכונים ליצור קטלוג נספח למידע לא רשמי.

ממשלות לא קשורת בדרך כלל למידע לא רשמי, או לא מוסמך. פקידי ממשל משקיעים רבות לוודא, שהמידע לא יכול לגרום למבוכה פוליטית או נזק אחר, שעלול להיגרם משימוש לא נכון או הישענות רבה מידי על המידע.

יתרה מכך, על ממשלות להיות מוכנות לסייע לפעילים, שממזגים את המידע שלהם עם מידע עסקי. ממשלות נעדרות מוטיבציות רווחיות, ובצדק. לכן הן יכולות להפיץ קטלוג עצמאי לקבוצות קהילתיות, עסקים ואחרים.