... או איך להמנע ממכות במשרד...
זה באמת אחד הנושאים הנפיצים יותר בפורומים של אנליסטים ואנשי BI. כולם מוכנים להישבע בנקיטת חפץ שהמערכת אליה הם רגילים היא-היא המערכת בה' הידיעה ואין בלתה. טענות בסגנון: "בהייטק עובדים רק עם …", "יש ל-… את הגרפים הכי יפים" ו-"…היא הכי אינטואיטיבית" הן חלק די נכבד מהטיעונים בוויכוחים הלוהטים שלהם הייתי עד.
רק שאף אחת מהטענות לעיל לא מביאה שום עובדה רלבנטית לדיון. זה שלכאורה מערכת אחת יותר נפוצה מאחרת (בנקודת זמן נתונה!) לא הופך אותה לברירת המחדל. בחירת מערכת שכזו אמור להיות תהליך מסודר, שמנתח היטב את הצרכים ולא את הרצונות של המנהלים לראות דשבורדים יפים (וכבר כתבתי על רצון מול צורך כאן). יתרה מכך, כיום יש מערכות ענן שבכלל אינן מצריכות להחזיק שכבת הביניים של הנתונים – חבר את מקורות הנתונים ישירות וסע לשלום (ועל זה בהמשך).
התוצאה של ויתור על תהליך שכזה בדרך כלל מובילה לזמן פיתוח ארוך מהרגיל, הוצאות נוספות שלא נלקחו בחשבון (פתאום צריך להרים עוד מכונה כדי שיהיה שרת תומך בפעולה שלא באה out-of-the-box, שכירת מפתחים נוספים וכו'), וחוסר שביעות רצון מהפתרון.
אז איך עושים את זה? כרגיל, תהליך מסודר:
- הגדירו מראש את המטרה באופן אופרטיבי. לא, "שיהיו דשבורדים" זו לא מטרה. דשבורדים הם תשומה לביצוע העבודה. לדוגמה: "מחלקת המרקטינג זקוקה לדוחות במרווחי זמן קבועים או זמן אמת על מנת לנטר את המאמצים, לקבל התראות, ולמדוד ביצועים באופן אינטראקטיבי. יש צורך להשוות בין ביצועי עבר להווה ולייצר תחזיות".
- הגדירו תקציב. בסופו של דבר, זה המסנן העיקרי. רק שבתוך התקציב הזה יש להכניס לא רק את עלות הרשיונות השונים בחברה, אלא גם את עלות הקמת הפרוייקט שמכיל בדרך כלל כמה סעיפים משלו:
– בדרך כלל, כל מערכת שכזו תעבוד אחרת מבחינת קריאת נתונים. אם המערכת צריכה להתחבר לבסיסי הנתונים שלכם, רצוי לייצר data marts שייעלו את עבודת המערכת.
– עקומת לימוד עולה כסף, ולכל מערכת יש את השגעונות שלה, שיצריכו יותר זמן עבודה ממפתח או אנליסט.
– בלת"מים, כי יכול להיות שבסוף כן תאלצו להוסיף רכיבים נוספים.
– POC: רצוי מאד לנסות כמה מערכות. אלו שעות עבודה שתצטרכו לתקצב (ר' למטה) - חינם זה סבבה, אבל לא תמיד יתאים. יש כמה וכמה שמות מובילים שמספקים את השירות בחינם (למשל Looker Studio), או כ-open source על הסטאק שלכם (למשל Metabase, Redash – שאפשר גם לבחור את שירות הענן בעלויות נמוכות), רק שבדרך כלל מה שמגיע בחינם, יכול שלא להתאים – הן ברמה הוויזואלית והן מבחינת שעות העבודה הנדרשות)
- בדק בית: יכול להיות שבתוך אחת מהפלטפורמות שכבר יש לכם בסטאק מתחבאת לה מערכת כזו? יכול להיות שבסטאק שיש לכם, הספק יציע הנחה על המערכת שלו? אולי זו לא המערכת האידיאלית, אבל פה צריך להכנס חישוב העלות/תועלת. אם החסכון משמעותי והתועלת יורדת במעט, אולי שווה לשקול.
- ירידה לפרטים: פה מתחילה העבודה הקשה. זה המקום לפרט עד כמה שניתן מה צריך כבר היום ומה רואים בעתיד הנראה לעין. כמה משתמשים? מה הרמה הטכנית של המשתמשים? האם המערכת נותנת שירות רק לעובדי הארגון או גם ללקוחות חיצוניים? מה קצב רענון הנתונים הדרוש? וכן הלאה.
סעיף חשוב שבדרך כלל לא נותנים עליו את הדעת הוא התמיכה: האם יש ספק שירות של כוח אדם לפיתוח למקרה הצורך? איך נראית הדוקומנטציה? האם יש פורומים של תמיכה וכמה תוכן יש בהם?
עכשיו, תעדפו מה חובה, מה לא נורא אם אפשר יהיה לפתור ממקום אחר, ומה nice to have.
אחרי שרשמתם ותעדפתם, פשוט צרו טבלה ותנסו להשוות בין המערכות. זה הציון ההתחלתי. - POC: המלצה שלי – לא לבחור אחת וזהו, אלא לבחור 3-4 מערכות שיצאו מובילות. בדרך כלל יהיו למערכות האלו תקופת נסיון בחינם למשך שבועיים עד חודש. אם יש ספק שירות מקומי, היפגשו עמו ונסו POC דרכו במידת האפשר. נסו לעבוד עם המערכות. תנו למפתחים או לאנליסטים לפתח ותנו למשתמשי הקצה לנסות להבין.
- ואם אתם עדיין תקועים, תמיד תוכלו ליצור עמי קשר.
Original image by Benzoix on Freepik