האתגר שבהתמודדות עם כמויות גדולות של מידע יוצר תפקידים והתמחויות חדשות. אלא שהיכולת לשלב בין אלו ולהוסיף עליהם מהלך של חיזוי, נותרה נחלת מעטים, והעלתה את קרנו של תפקיד מדען הנתונים. תפקידו הוא ביצוע מחקרי מידע מעמיקים להפקת תובנות עסקיות לארגון, ניקוי, שיפור וסידור המידע למחקרים, הפעלת אלגוריתמים של מידול, כריית מידע ולמידה חישובית על המידע, בניית תהליכים להכנתו ואופטימיזציה של האלגוריתמים. עיקר הכישורים המקצועיים הנדרשים לכך מתמקדים בארבעה שלבים עיקריים של עבודה עם המידע: השגתו – אינטגרציה מכמה מקורות, מהאינטרנט, עבודה עם כמויות גדולות של מידע ועיבוד מידע לא מובנה. חקירת המידע – תכנות, ניתוח סטטיסטי וחיבור בין בסיסי נתונים, ניתוח אנליטי של המידע - חיזוי, כריית מידע, אופטימיזציה, עיבוד מידע טקסטואלי ואנליזה של נתונים גדולים, הצגת תוצרי המידע וויזואליזציה. עבור כל אלה נדרשת אינטואיציה עסקית, חשיבה אנליטית, יצירתיות וסקרנות, מכלול תכונות המסייעות לשים לב לפרטים וקשרים שונים ומפתיעים. הקורס זמין ברובו גם ללימוד מרחוק, ניתן לצפות ולהשתתף בשיעורים באופן חי מהבית.
מקום הלימודים
הרצליה, קורס אינטרנטי
מתכונת הקורס
240 ש"ל, פעמיים בשבוע בשעות 17:30-21:30 במשך חצי שנה
קהל היעד
בעלי רקע בניתוח מידע ו-BI המעוניינים להעשיר את יכולותיהם ויכולות הארגון
תנאי קבלה
שאלון אישי, יעוץ מקצועי, נסיון בעבודה מול טבלאות נתונים, נסיון במסדי נתונים רלציוניים
נושאי הלימוד
- מהות עבודת מדען נתונים , מונחים, רעיונות, מושגים וכלים שימושיים
- פיתוח בפייתון וסביבות העבודה
- יצירת מודלים לחיזוי ואופן ביטויים
- שיערוך ערך רציף על בסיס נתונים מהעבר
- מודל רגרסיה כללי ולינארית, רמת אמינות ושיפור ביצועים
- קיטלוג נתון חדש לקטגוריות
- מדדים להערכת איכות המודל ומונחים קשורים
- קשרים משתנים, תרחישים עסקיים בהם נדרשים הקשרים, מדדי איכות ועוצמה
- פילוח נתונים לקבוצות בעלות מכנה משותף
- שיפור איכות המודלים באמצעות נתונים
- חיזוי ערך עתידי על בסיס נתוני עבר, מגמה מול עונתיות
- ניתוח הטקסט, התאמות, הרחבות
- big data, Hadoop map-reduce
- יסודות שפת R, כלים לעיבוד נתונים והצגתם, מימוש מודלים