ניהול דאטה: 4 קיצורי הדרך למידע הנכסף

משקיעים יותר מידי זמן ומאמץ כדי להגיע למידע הרלוונטי? אספנו עבורכם את 4 כללי האצבע שיאפשרו לכם לקצר את הדרך, ולא פחות חשוב: לוודא שהמידע מטויב ועדכני.

ככל שהארגון אוסף כמויות רבות יותר של מידע, כך נפתחות בפנינו אנשי ניהול הדאטה יותר אפשרויות לחיזוי ומיצוי משאבי המידע שיתרמו לשיפור הביצועים העסקיים. אך באותה נשימה, בעידן הביג דאטה שבו נפחי המידע הולכים וגדלים, גובר הקושי לחלץ נתונים מתוך בליל המידע: גם אחרי שמושקע הרבה מאוד זמן ומאמץ באיתור מקורות המידע, בשינוע המידע ובכתיבת הקוד, כלל לא בטוח שמדובר במידע עדכני ומטויב.

במציאות הזו כל שרשרת ניהול הדאטה עלולה להיפגע: מה- Data Engineer שאחראי על שינוע המידע ונאלץ לבזבז זמן יקר על כתיבת קוד, ה- Data Scientist וה- Data Analyst שצריכים לחלץ חלק מהנתונים בעצמם במקום להתרכז בבניית המודלים – ועד דרגי הניהול, שעלולים לקבל החלטות אסטרטגיות על סמך מידע לא מדויק או לא אמין.

כדי למנוע את כל אלה, ריכזנו עבורכם את 4 כללי האצבע שיובילו לניהול דאטה יעיל ויאפשרו לכם להגיע למידע הרצוי בדרך הקצרה והאפקטיבית ביותר.

מיפוי והגעה ל- Data הרלוונטי

מכיוון שהארגון אוסף כמויות גבוהות של מידע המאוחסן במגוון פלטפורמות שונות, קשה לשלוט במידע ולדעת מהם נכסי המידע העומדים לרשותכם (Data governance). במקרה כזה פונים למחלקות השונות כמו מחלקת השירות, השיווק וה- BI מתוך ניסיון להגיע למאגר המידע הרלוונטי, העדכני והמטויב. מעבר לזמן הרב המושקע בחיפוש, בצורת פעולה זו אנחנו עלולים לפספס פיסות מידע חשובות (בעלי התפקידים השונים לא תמיד יודעים איפה מאוחסנים כל הנתונים הרלוונטיים ומה המיקום המדויק שלהם במאגר המידע). בנוסף, במרבית הארגונים הדרך נפוצה ביותר להגיע לנתון הינה להתקשר לאיש המתאים, במקום להגיע אליו בלחיצת כפתור.

מה הפתרון? לעבוד עם פלטפורמה שיודעת למפות ולהתחקות אחרי כל המידע בארגון, כולל חיפוש קשרים והצגת זרימת המידע (Data Lineage). Informatica מספקת מענה מסוג זה, שחוסך את כל עבודת ההכנה ומצמצם למינימום את האפשרות לפספס פיסות מידע חשובות. בצורה זו אפשר להתחקות אחר זרימת מידע בארגון ולבסס את ההחלטות הארגוניות על המידע המהימן והעדכני ביותר. המערכת גם יודעת לאתר בקלות כפילויות מידע או מאגרים אשר מתוחזקים בעלויות רבות, אך אין כל להן אף משתמש אקטיבי.

שינוע מידע בצורה קלה ויעילה

הצורך להנגיש את המידע נובע מהעובדה שהוא נמצא במגוון רחב של פלטפורמות, כתוב בשפות שונות ובפורמטים שונים. כדי להנגיש את המידע ולהכין אותו למודל, Data Engineers רבים עדיין צריכים לכתוב קוד בכל פעם שרוצים לשנע אותו מהמקורות השונים. פעולה זו גוזלת זמן יקר, מצריכה תחזוק של הקוד ומגדילה את התלות של הגורם העסקי ב- IT במקום לתת לו חופש פעולה מרבי.

שימוש במערכת שמושכת את המידע מהמקורות השונים, יכול לחסוך זמן יקר: אחד היתרונות של אינפורמטיקה טמון ביכולת למשוך מידע Native, ובכך להעמיד לרשות אנשיה – Data פתרון אחד שמחלץ מידע במגוון רחב של שפות. כל זאת באמצעות כלי Drag and Drop פשוט וקל לתפעול.

ניהול דאטה
צילום: שאטר סטוק

טיוב נתונים והנגשת המידע

כדי להכין את המידע למודל, עליו להיות בפורמט אחיד למרות שהוא מגיע מקורות שונים (למשל פורמט אחיד של רשומות המכילות מספרי טלפון או תאריכים). מצב שכזה מצריך עבודה ידנית מרובה במקרה הטוב, או הסתמכות על מידע בלתי מהימן במקרה הפחות טוב (למשל בשל הסתמכות על רשומות כפולות או הסרת רשומות רלוונטיות שאינן בפורמט המתאים). כדי למנוע מצבים מסוג זה מכילה Informatica מערכות טיוב נתונים, שיוצרות מכנה משותף בין הפורמטים השונים בהם מוצג המידע. המערכות יכולה באופן כמעט עצמאי ליצור פורמט אחיד של טלפון, תאריך או כתובת. כך לדוגמה הכתובות: USA, U.S.A, US, US of Amrica => ירשמו כולן כ- “”United Stats of Amrica.

על מנת לספק מענה לביקושים הגדלים של KMS lighthouse, גייסנו עבורם 25 אנשי פיתוח במיקור חוץ, אנשי QA Automation ואנשי DevOps. היכולת לזהות את הצורך הטכנולוגי של KMS lighthouse ולאתר את אנשי המקצוע המתאימים למשימה, היא חלק בלתי נפרד מה- DNA של קבוצת Aman, הנחשבת לאחת מקבוצות ה- IT הוותיקות והמובילות בישראל. לצד גיוס האנשים המתאימים למשימה, אנשי Aman Offshore משתמשים במומחיות הטכנולוגית של קבוצת Aman כדי לספק ליווי ייעודי לפי הצורך. איך נראה המודל של KMS lighthouse כיום? מלאכת התכנון מבוצעת בארץ ולצד מרכז הפיתוח בישראל, גדל מרכז הפיתוח בחו”ל ומסייע ל- KMS lighthouse לעמוד בביקושים ולשמור על יתרון מול המתחרים.

הכנת המידע למודל

“כדי לספק מענה לשאלת המחקר, ה- Data Analyst צריך להיעזר באנשי ה- IT לצורך שליפת הנתונים הרלוונטיים והכנת ה- Data Set. צורת ההתנהלות שכזו מאריכה את התהליך, מגדילה את התלות בגורמי ה- IT ואף מגדילה את מרווח הטעות בעקבות ריבוי האינטראקציות.

“את כל אלו אפשר למנוע, באמצעות ה- Self Service Data Preparation של אינפורמטיקה – פתרון שמאפשר לאיש הדאטה לדלות את המידע הרצוי בכוחות עצמו: לאחר איתור פריטי המידע הרלוונטיים, ממשק דמוי אקסל מוביל לבניית Data set בצורה קלה ופשוטה, אך בו בזמן מנוהלת ומנוטרת לצרכי Data governance (כך שהמידע נמצא בידיים הנכונות). התוצר שמתקבל הוא data set נקי, מהימן ומסודר לעבודת המידול החשובה – והכל ללא תלות כלשהי ב- IT.

“יישום 4 העקרונות בעשייה השוטפת יאפשר לכם לקצר את הדרך ולהגיע למידע הרצוי במינימום מאמץ, ולא פחות חשוב: יאפשר לארגון להסתמך על מידע מהימן לצורך בניית מודלים ופרדיקציות, שיובילו לקבלת החלטות טובות יותר.

Accessibility Toolbar