ביג דאטא הוא אחת מהבאזזווורדס הכי חמות כיום. המילה מתארת את השימוש במאגרים ענקיים של מידע ממקורות שונים שניתן להפיק ממנו תובנות בעלות משמעות.
בהקשר של משווקים ומפרסמים ברשת, המידע הכלול בביג דאטא עשוי להיות מידע ממקור ראשון שמושג ישירות דרך רישומים באתר שלנו או קמפיינים ממומנים שאוספים לידים, אך גם מידע מגורמי צד שלישי. בעבר כמעט לא היה ניתן להשיג מידע שלא היה קיים ברשותכם ללא רכישה שלהם ממאגרים מיוחדים, אך כיום המידע הזה הוטמע בלא מעט מערכות שאנחנו עובדים איתן ביום יום. לדוגמה, כאשר אתם ממקדים קהלים בפייסבוק לפי תחומי עניין, אתם למעשה משתמשים במידע שמקורו בביג דאטא של צד שלישי, למרות שמבחינתכם התהליך הוא שקוף לחלוטין.
למרבה הצער, המידע הזה לא תמיד מוגש לכם על מגש של כסף ובמצבים מסוימים אין לכם דרך לארגן את כולו באופן לוגי או להסיר כפילויות. כפילויות של נתונים או מידע לא שלם עשויים להיווצר לדוגמה ממצב של ריבוי ערוצים בו אדם התחיל את מסע השיווק שלו בערוץ אחד וסיים אותו בערוץ אחר. במקרים אחרים יש לנו הרבה מידע שפשוט אין לנו מה לעשות אתו והוא יוצר לנו רעש רקע מיותר.
כאן בדיוק נכנס התפקיד של מערכות הביג דאטא. לעיתים הדרך הכי טובה לארגן את הביג דאטא הוא על פי נישות מסוימות. לדוגמה, במערכות אבטחה פיננסיות, ייתכן שחברת כרטיס האשראי שלכם תשתמש במאגר עצום של נתונים על מנת לזהות ניסיונות לתרמיות בכרטיסי אשראי במהירות עוד לפני שהלקוח זיהה שמישהו גנב או הכרטיס שלו (ובמקרה הרע יותר שכפל אותו). לפיכך, פתרון ביג דאטא בנישה אחת לא בהכרח מתאים לפתרונות בתחומים אחרים.
בתחום השיווק והשיווק באינטרנט בפרט, שימוש חכם בביג דאטא יכול לענות על לא מעט שאלות חשובות כגון:
- איפה נמצא קהל היעד העיקרי ומה בדיוק הוא מחפש
- כיצד הביצועים שלנו משתווים מול אלו של מפרסמים ספציפיים
- מהם הגורמים המשפיעים על הנאמנות של הגולשים
- האם תקציב הפרסום מנוצל בצורה אפקטיבית ומחזיר את ההשקעה בכלל הערוצים (לרוב ההחזר על ההשקעה נמדד בכל ערוץ בנפרד)
מערכות לניהול ביג דאטא כיום
למרות הצרכים השונים של כל נישה, מערכות רבות לניהול ביג דאטא הן מספיק גמישות על מנת להציע מגוון של פתרונות לכל אחד. בשוק קיימות כמה עשרות מערכות מובילות, חלקן מחברות הנמצאות שנים בתחום כמו למשל IBM ואורקל או SAP, וחלקן מחברות שנכנסו לשוק רק בשנים האחרונות. למרות שרוב המערכות נשענות על מודלים סטנדרטים של מבני נתונים (כגון SQL), לרוב אין צורך בידע תכנותי על מנת לאחד בין סוגי המידע ולבצע את הניתוחים הדרושים. יש גם מערכות בהן ניתן לבנות אפליקציות פשוטות ללא ידע בתכנות.
המערכות נבדלות זו מזו במספר מאפיינים חשובים:
- תמיכה בענן (מרבית המערכות כיום אינן מחייבות התקנה מקומית)
- תמיכה טכנית (וובינרים, תמיכה אונליין ותמיכה פנים מול פנים).
- נפח המידע בו הן מסוגלות לטפל
- מגוון הפעולות שאפשר לבצע על הנתונים עצמם כגון טיוב נתונים (ניקוי וניפוי של נתונים שאינם שלמים)
- מודלים נוספים כגון עיבוד אנליטי מקוון, אינטליגנציה עסקית ועוד
מערכות נישתיות
מלבד המערכות הנ"ל, קיימות גם מערכות נישתיות עבור משווקים באינטרנט ויכול מאוד להיות שאת חלקן אתם מכירים : מדובר בשירותים כמו ahref או majestic. רוב השירותים הללו מתבססים על אינדקסים ענקיים של אתרים ברשת והקשרים ביניהם או מאגרים של מודעות ממומנות על מנת ליצור מודל המחקה באופן הקרוב ביותר את האופן בו פועל מנוע חיפוש אמיתי. באמצעות מאגר המידע הזה, השירותים יכולים לספק תובנות על הביצועים והמצב של כל אתר. לדוגמה, אם מסתכלים בדו"ח הפרסום הממומן, ניתן לראות את המודעות המקושרות לאתר שנבחר, את מילות המפתח עליהן הוא משתתף במכירות הפומביות ואפילו את התנועה המוערכת אותה הוא מקבל מכל מילת מפתח.
זוהי כמות של מידע שבשום פנים ואופן לא היינו יכולים להשיג משיטוט ידני ברשת או מחקר מתחרים בסיסי. ואם בעבר המערכות האלו ניתחו בעיקר נתונים הקשורים לקידום האורגני והממומן, היום הן יכולות לנתח גם תוכן ואפילו את החשיפה ברשתות החברתיות.