רגע! לפני שהולכים... 👋
אל תפספסו! מסלולי לימוד נפתחים בקרוב - מקומות מוגבלים
| מסלול RT Embedded Linux | 29/06 |
| מסלול Machine Learning | 29/06 |
| מסלול Computer Vision | 29/06 |
| מסלול Full Stack | 29/06 |
| מסלול Cyber | 05/07 |
✓ ייעוץ אישי ללא התחייבות | תשובה תוך 24 שעות

עודכן לאחרונה: 15 יוני, 2026
התשובה הקצרה: Data Analyst הוא מי שמתרגם נתונים לתובנות עסקיות באמצעות שאילתות, דוחות וויזואליזציה. Data Scientist הוא מי שבונה מודלים סטטיסטיים ואלגוריתמים של Machine Learning כדי לחזות תופעות עתידיות ולהפיק ערך חדש מנתונים. שני התפקידים עובדים עם דאטה, אבל העומק המתמטי, הכלים, וסוג השאלות שהם שואלים — שונים מהותית. אם מישהו אומר לך "זה אותו דבר" — הוא טועה, ואני הולך להראות לך בדיוק למה, עם דוגמאות קוד, טבלת השוואה, ומדריך מעשי שיעזור לך לבחור את המסלול הנכון לך.
בואו נפסיק לרגע עם ההגדרות האקדמיות ונדבר על מה שקורה ביום-יום. כי ההבדל בין Data Analyst ל-Data Scientist הוא לא רק עניין של כותרת בלינקדאין — הוא מגדיר את סוג הבעיות שתפתרו, את הכלים שתשתמשו בהם, ואת הדרך שתיראה הקריירה שלכם בחמש השנים הקרובות.
Data Analyst הוא בעצם מי שיודע לשאול את השאלה הנכונה, לחפור בנתונים, ולחזור עם תשובה שמנהלים יכולים לקבל על בסיסה החלטות. זה לא תפקיד "קטן" — זה תפקיד קריטי. חברות כמו Wix, Monday.com ופייסבוק ישראל מעסיקות עשרות אנליסטים שמשפיעים ישירות על החלטות מוצר ושיווק.
הכלים העיקריים: SQL (הבסיס — בלי זה אתם לא מתחילים), Excel או Google Sheets ברמה מתקדמת, כלי ויזואליזציה כמו Tableau או Power BI, ו-Python ברמה בסיסית לניקוי וניתוח נתונים. לפי סקר Stack Overflow 2024, SQL נמצא בראש רשימת הטכנולוגיות המבוקשות לתפקידי אנליטיקה — עם 52% מהמשרות בתחום הדאטה בישראל דורשות אותו כדרישת חובה.
היום-יום: כתיבת שאילתות על בסיסי נתונים, בניית דשבורדים, ניתוח A/B Testing, הצגת ממצאים להנהלה, וזיהוי מגמות. האנליסט טוב כשהוא יודע לספר סיפור עם נתונים — לא רק להציג מספרים.
Data Scientist לוקח את הנתונים צעד אחד קדימה. במקום לתאר מה קרה (descriptive analytics), הוא בונה מודלים שחוזים מה יקרה (predictive analytics) או אפילו ממליצים מה כדאי לעשות (prescriptive analytics). זה דורש רקע מתמטי מוצק — סטטיסטיקה, אלגברה ליניארית, ותאוריית הסתברות.
הכלים העיקריים: Python (עם ספריות כמו Pandas, Scikit-learn, TensorFlow, PyTorch), R לניתוח סטטיסטי, SQL כבסיס, Jupyter Notebooks לפיתוח ותיעוד, וכלי MLOps כמו MLflow או Kubeflow לניהול מודלים בייצור. לפי דוח של LinkedIn Israel ל-2024, משרות Data Science בישראל דורשות ממוצע של 2-3 שנות ניסיון ב-Machine Learning, ושכר הכניסה גבוה ב-25%-35% ממשרות אנליסט.
היום-יום: ניקוי ועיבוד נתונים (ו-spoiler — זה 60%-70% מהזמן), בניית ואימון מודלים, Feature Engineering, הערכת ביצועי מודלים, ושיתוף פעולה עם צוותי Engineering להעלאת מודלים לייצור. בחברות ישראליות כמו Mobileye, Orcam ו-Taboola, ה-Data Scientists עובדים צמוד לצוותי פיתוח ומוצר.
הטבלה הבאה מרכזת את ההבדלים המרכזיים. שימו לב — ההבדלים הם לא רק בכלים, אלא במהות השאלות, ברמת המתמטיקה הנדרשת, ובסוג הפלט שמצופה מכם:
| קריטריון | Data Analyst | Data Scientist |
|---|---|---|
| שאלה מרכזית | מה קרה? למה זה קרה? | מה יקרה? מה כדאי לעשות? |
| סוג הניתוח | Descriptive, Diagnostic | Predictive, Prescriptive |
| שפות תכנות | SQL (עיקרי), Python (בסיסי), R (אופציונלי) | Python (מתקדם), R, SQL, Scala (אופציונלי) |
| כלים מרכזיים | Tableau, Power BI, Excel, Google Analytics | Jupyter, Scikit-learn, TensorFlow, PyTorch, MLflow |
| רמת מתמטיקה | סטטיסטיקה תיאורית, הסתברות בסיסית | אלגברה ליניארית, חשבון דיפרנציאלי, סטטיסטיקה מתקדמת |
| פלט עיקרי | דשבורדים, דוחות, תובנות עסקיות | מודלים, אלגוריתמים, חיזויים, מערכות המלצה |
| שכר כניסה בישראל (2024) | 15,000-22,000 ₪ לחודש | 22,000-32,000 ₪ לחודש |
| סף כניסה | תואר ראשון (לאו דווקא CS) + קורסים מעשיים | תואר ראשון/שני במדעי המחשב, סטטיסטיקה, או מתמטיקה + פרויקטים מעשיים |
| זמן עד העסקה (ממוצע) | 3-6 חודשי לימוד מרוכז | 6-18 חודשי לימוד מרוכז |
| ביקוש בשוק הישראלי | גבוה מאוד — כל חברה צריכה | גבוה — במיוחד ב-Deep Tech ו-AI |
עכשיו שהבנתם את ההבדלים, בואו נעשה את זה פרקטי. אני רוצה לתת לכם תרגיל שתוכלו להריץ עוד היום — ושיעזור לכם להבין לאיזה כיוון הלב שלכם באמת נוטה.
בין אם תהיו אנליסטים או סיינטיסטים, SQL הוא השפה שדרכה אתם מדברים עם הנתונים. הנה שאילתה אמיתית שתיתקלו בה בראיון עבודה בחברת סטארטאפ ישראלית:
-- ניתוח שימור משתמשים: כמה משתמשים חזרו בשבוע השני אחרי הרשמה?
WITH first_week AS (
SELECT
user_id,
MIN(DATE(event_timestamp)) AS signup_date
FROM user_events
WHERE event_type = 'signup'
GROUP BY user_id
),
second_week_activity AS (
SELECT DISTINCT
ue.user_id
FROM user_events ue
JOIN first_week fw ON ue.user_id = fw.user_id
WHERE DATE(ue.event_timestamp) BETWEEN fw.signup_date + INTERVAL '7 days'
AND fw.signup_date + INTERVAL '14 days'
AND ue.event_type = 'session_start'
)
SELECT
COUNT(DISTINCT swa.user_id) AS retained_users,
COUNT(DISTINCT fw.user_id) AS total_signups,
ROUND(
COUNT(DISTINCT swa.user_id)::DECIMAL / COUNT(DISTINCT fw.user_id) * 100,
2
) AS retention_rate_pct
FROM first_week fw
LEFT JOIN second_week_activity swa ON fw.user_id = swa.user_id;
אם קראתם את השאילתה הזו והרגשתם התרגשות — "וואלה, אני רוצה להבין את הנתונים האלה ולהציג אותם" — סימן טוב לכיוון אנליטיקה. אם קראתם ואמרתם — "אוקיי, אבל מה אם הייתי בונה מודל שחוזה מראש מי ינטוש?" — סימן טוב לכיוון Data Science.
הקוד הבא הוא מודל חיזוי Churn (נטישת לקוחות) בסיסי ב-Python. זה בדיוק סוג המשימה שנופלת בצד של Data Science. הריצו אותו, שחקו עם הפרמטרים, ותראו מה אתם מרגישים:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix
# יצירת דאטהסט לדוגמה — נתוני משתמשים
np.random.seed(42)
n_users = 1000
data = pd.DataFrame({
'days_since_last_login': np.random.randint(0, 90, n_users),
'total_sessions_last_month': np.random.randint(0, 50, n_users),
'support_tickets': np.random.randint(0, 10, n_users),
'subscription_months': np.random.randint(1, 36, n_users),
'avg_session_duration_min': np.random.uniform(1, 60, n_users).round(2)
})
# יצירת משתנה יעד — churned (האם המשתמש נטש?)
data['churned'] = (
(data['days_since_last_login'] > 30) &
(data['total_sessions_last_month'] < 5)
).astype(int)
print(f"חלוקת הנתונים:\n{data['churned'].value_counts()}\n")
# פיצול לאימון ומבחן
X = data.drop('churned', axis=1)
y = data['churned']
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=42, stratify=y
)
# בניית מודל Random Forest
model = RandomForestClassifier(
n_estimators=100,
max_depth=5,
random_state=42,
class_weight='balanced'
)
model.fit(X_train, y_train)
# הערכת ביצועים
y_pred = model.predict(X_test)
print("Confusion Matrix:")
print(confusion_matrix(y_test, y_pred))
print("\nClassification Report:")
print(classification_report(y_test, y_pred, target_names=['Active', 'Churned']))
# חשיבות פיצ'רים — מה הכי משפיע על נטישה?
feature_importance = pd.DataFrame({
'feature': X.columns,
'importance': model.feature_importances_
}).sort_values('importance', ascending=False)
print("\nFeature Importance:")
print(feature_importance.to_string(index=False))
שימו לב למה שקרה כאן: לקחנו נתונים גולמיים, יצרנו פיצ'רים, בנינו מודל, הערכנו את הדיוק שלו, ובדקנו אילו משתנים הכי משפיעים. זה ליבת העבודה של Data Scientist. אם מצאתם את עצמכם רוצים לשנות את ה-hyperparameters, לנסות מודל אחר, לשפר את ה-F1 Score — מצוין, את הנטייה הזו אתם צריכים לטפח.
עכשיו בואו נראה את הצד השני. אנליסט היה לוקח את הנתונים האלה ובונה דשבורד שמציג את התובנות בצורה ויזואלית ברורה להנהלה. הנה דוגמה פשוטה עם Matplotlib:
import matplotlib.pyplot as plt
# ויזואליזציה של חשיבות פיצ'רים — סגנון אנליסט
fig, axes = plt.subplots(1, 2, figsize=(14, 5))
# גרף 1: חשיבות פיצ'רים
colors = ['#e74c3c' if imp > 0.25 else '#3498db' for imp in feature_importance['importance']]
axes[0].barh(feature_importance['feature'], feature_importance['importance'], color=colors)
axes[0].set_xlabel('Importance Score')
axes[0].set_title('Which Factors Drive Customer Churn?')
axes[0].invert_yaxis()
# גרף 2: פילוח לפי ימים מהתחברות אחרונה
bins = [0, 7, 14, 30, 60, 90]
labels = ['0-7', '8-14', '15-30', '31-60', '61-90']
data['login_bucket'] = pd.cut(data['days_since_last_login'], bins=bins, labels=labels)
churn_by_bucket = data.groupby('login_bucket')['churned'].mean() * 100
axes[1].bar(churn_by_bucket.index, churn_by_bucket.values, color='#e74c3c', alpha=0.8)
axes[1].set_ylabel('Churn Rate (%)')
axes[1].set_xlabel('Days Since Last Login')
axes[1].set_title('Churn Rate by Login Recency')
plt.tight_layout()
plt.savefig('churn_analysis_dashboard.png', dpi=150, bbox_inches='tight')
plt.show()
print("Dashboard saved as churn_analysis_dashboard.png")
האנליסט ייקח את הגרף הזה, יוסיף הקשר עסקי, ויציג להנהלה: "אנחנו רואים שמשתמשים שלא התחברו 30+ יום הם בסיכון גבוה לנטישה. ההמלצה: להפעיל קמפיין Win-back אוטומטי ביום 21." זו בדיוק התוספת הערכית של אנליסט — תרגום נתונים לפעולה.
אחרי שהבנתם את ההבדלים והתנסתם בפועל, הנה תוכנית למידה מעשית לכל מסלול. אני לא מאמין בלמידה תאורטית בלי ידיים על המקלדת — אז כל שלב כולל פרויקט.
חודש 1-2: בסיס SQL ו-Excel — למדו SQL דרך פלטפורמות כמו SQLZoo או Mode Analytics. תתמקדו ב-JOINs, Window Functions, CTEs, ו-Subqueries. במקביל, רכשו שליטה ב-Excel ברמה של Pivot Tables, VLOOKUP, ו-INDEX-MATCH. פרויקט: נתחו דאטהסט אמיתי מ-Kaggle וצרו דוח עם תובנות.
חודש 3-4: ויזואליזציה וסיפור נתונים — למדו Tableau או Power BI. לפי מחקר של Gartner מ-2024, Power BI ו-Tableau מחזיקים ביחד ב-60% משוק ה-BI הארגוני. בישראל, Power BI דומיננטי יותר בחברות מסורתיות, ו-Tableau בסטארטאפים. פרויקט: בנו דשבורד אינטראקטיבי שמציג מגמות עסקיות.
חודש 5-6: Python לאנליטיקה ו-A/B Testing — למדו Pandas, Matplotlib, ובסיס סטטיסטי ל-Hypothesis Testing. הבינו מה זה p-value, confidence interval, ו-statistical significance. פרויקט: נתחו תוצאות A/B Test אמיתיות והציגו המלצות מבוססות נתונים.
חודש 1-3: Python מתקדם ובסיס מתמטי — שליטה מלאה ב-NumPy, Pandas, Matplotlib, Seaborn. במקביל, רעננו אלגברה ליניארית (מטריצות, פירוקים), חשבון דיפרנציאלי (גרדיאנטים — הבסיס של כל אלגוריתם למידה), וסטטיסטיקה (התפלגויות, בייס). פרויקט: EDA (Exploratory Data Analysis) מעמיק על דאטהסט מורכב.
חודש 4-7: Machine Learning קלאסי — Scikit-learn מההתחלה עד הסוף. Linear Regression, Logistic Regression, Decision Trees, Random Forest, XGBoost, K-Means, PCA. הבינו לא רק איך להשתמש — אלא למה כל אלגוריתם עובד. פרויקט: בנו מודל חיזוי End-to-End, מניקוי נתונים ועד Deployment.
חודש 8-11: Deep Learning ו-NLP — TensorFlow או PyTorch (בישראל, PyTorch דומיננטי יותר בתעשיית ה-AI לפי סקר של Israel AI Ecosystem 2024). Neural Networks, CNNs, RNNs, Transformers. פרויקט: בנו מודל NLP שמסווג טקסטים בעברית — זה גם אתגר טכני וגם מראה למעסיקים שאתם יודעים לעבוד עם שפות מורכבות.
חודש 12-15: MLOps ופורטפוליו — למדו Docker, ניהול ניסויים עם MLflow, ופריסת מודלים עם FastAPI או Flask. פרויקט: העלו מודל לענן (AWS SageMaker או GCP Vertex AI), בנו API שמחזיר חיזויים בזמן אמת, ותעדו את הכל ב-GitHub.
בואו נהיה קונקרטיים. הנה סביבת העבודה שכל אחד מהתפקידים צריך להקים. זה שורה תחתונה — מה שבאמת משתמשים בו יום-יום בחברות ישראליות:
# סביבת עבודה בסיסית — Data Analyst
# התקנת Python וכלי אנליטיקה
pip install pandas numpy matplotlib seaborn
pip install sqlalchemy psycopg2-binary # חיבור ל-PostgreSQL
pip install openpyxl xlsxwriter # עבודה עם Excel
pip install jupyter # סביבת Notebook
# כלים נוספים
# Tableau Desktop / Power BI Desktop — התקנה נפרדת
# DBeaver / DataGrip — כלי GUI ל-SQL
echo "=== Analyst Environment Ready ==="
# סביבת עבודה — Data Scientist (כולל את כל מה שלמעלה + תוספות)
pip install scikit-learn xgboost lightgbm # ML קלאסי
pip install tensorflow torch torchvision # Deep Learning
pip install transformers datasets # NLP עם Hugging Face
pip install mlflow # ניהול ניסויים
pip install fastapi uvicorn # API למודלים
pip install shap lime # הסבר מודלים (Explainability)
# כלים נוספים
pip install docker-compose # קונטיינרים
pip install boto3 google-cloud-storage # ענן
echo "=== Data Science Environment Ready ==="
שימו לב להבדל: האנליסט צריך כלי חיבור לבסיסי נתונים, כלי ויזואליזציה, ויכולת לייצא Excel מסודר. הסיינטיסט צריך את כל מה שהאנליסט צריך — ועל זה עוד ספריות ML, כלי Deep Learning, תשתית MLOps, ויכולות Deployment. זה משקף את הסיבה שהסף נמוך יותר להיכנס לאנליטיקה — אבל שני המסלולים דורשים עבודה קשה ועקבית.
בואו נדבר תכל'ס. לפי נתוני LinkedIn Israel ו-Indeed ישראל לרבעון הראשון של 2024, יש כמה מגמות ברורות שחשוב שתכירו לפני שאתם בוחרים כיוון.
משרות Data Analyst בישראל עלו ב-18% בשנה האחרונה — בעיקר בגלל שכל חברה, מסטארטאפ של 20 עובדים ועד בנק גדול, צריכה מישהו שיודע לשלוף ולנתח נתונים. הביקוש הוא רוחבי — פינטק, הלת'טק, ריטייל, לוגיסטיקה. כולם צריכים אנליסטים.
משרות Data Science עלו ב-12%, אבל עם דגש ברור על ניסיון מעשי ב-ML בייצור. חברות ישראליות כמו Mobileye (אינטל), AI21 Labs, ו-Run:ai מחפשות סיינטיסטים שיודעים לא רק לבנות מודל ב-Jupyter — אלא גם להעלות אותו לייצור, לנטר אותו, ולשפר אותו לאורך זמן.
מגמה חשובה: הגבול בין שני התפקידים מיטשטש. יותר ויותר חברות ישראליות (במיוחד סטארטאפים בשלב מוקדם) מחפשות "Analytics Engineer" — תפקיד היברידי שמשלב SQL מתקדם, Python, וידע בסיסי ב-ML. אם אתם לא בטוחים איפה אתם — זה יכול להיות נקודת כניסה מצוינת.
לא בהכרח, אבל זה תלוי בתפקיד. עבור Data Analyst, חברות ישראליות רבות מקבלות מועמדים עם קורסים מעשיים, פורטפוליו חזק, והוכחת יכולת ב-SQL ו-Python. עבור Data Scientist, תואר ראשון הוא כמעט תמיד דרישה (בעיקר במדעי המחשב, סטטיסטיקה, מתמטיקה, או פיזיקה), ותואר שני מהווה יתרון משמעותי — במיוחד בחברות Deep Tech. מה שיותר חשוב מהתואר: פרויקטים אמיתיים שמוכיחים שאתם יודעים לפתור בעיות עם דאטה.
בהנחה שיש לכם רקע כלשהו בתכנות או במתמטיקה — לימוד מרוכז של 9-15 חודשים יכול להביא אתכם לרמה של ג'וניור. בלי רקע כלל — חשבו על 18-24 חודשים. חשוב להבין: Data Science זה לא קורס שעושים ומסיימים. זה תחום שדורש למידה מתמשכת. הטכנולוגיות משתנות, מודלים חדשים יוצאים כל חודש. מי שנכנס לתחום הזה צריך לאהוב ללמוד — לא רק לסיים קורס ולקבל תעודה.
בהחלט — וזה מסלול מאוד נפוץ. הרבה Data Scientists בישראל התחילו כאנליסטים, צברו הבנה עמוקה של נתונים עסקיים, ואז השלימו ידע מתמטי ו-ML. היתרון של המסלול הזה: אתם מגיעים ל-Data Science עם הבנה עסקית שחסרה להרבה סיינטיסטים שבאים ישר מהאקדמיה. החיסרון: צריך להשקיע זמן רציני בהשלמת הבסיס המתמטי.
שאלה מצוינת שצריך לענות עליה בכנות. כלי AI כמו ChatGPT ו-GitHub Copilot כבר יודעים לכתוב שאילתות SQL ולבנות ויזואליזציות בסיסיות. המשמעות: משימות טכניות טהורות יעברו אוטומציה. מה שלא יעבור אוטומציה: הבנה עסקית, שיקול דעת, ויכולת לשאול את השאלה הנכונה. Data Scientists שיודעים לבנות מערכות ML מורכבות ולהביא אותן לייצור — עמידים יותר. אנליסטים שיודעים לתרגם נתונים לסיפור עסקי ולהשפיע על החלטות — עמידים יותר. מי שפגיע? מי שרק יודע להריץ פקודות בלי להבין למה.
לאנליסט: 2-3 פרויקטים שמראים יכולת SQL מתקדמת (לא רק SELECT *), דשבורד אינטראקטיבי ב-Tableau או Power BI, וניתוח A/B Test עם מסקנות ברורות. לסיינטיסט: מודל ML מלא מקצה לקצה (כולל ניקוי נתונים, Feature Engineering, הערכת ביצועים), פרויקט NLP או Computer Vision, ורצוי מודל שפרוס כ-API עם תיעוד. בשני המקרים: GitHub מסודר עם README ברור לכל פרויקט. מגייסים ישראלים מסתכלים על הקוד — לא רק על התוצאה.
בהחלט — ויש לזה אפילו שם: Full Stack Data Professional. בפועל, הרוב מתחילים באנליטיקה (כי סף הכניסה נמוך יותר), צוברים ניסיון בעבודה עם נתונים אמיתיים, ואז מתרחבים ל-ML ו-Data Science. זה המסלול הפרגמטי ביותר: אתם מתחילים להרוויח ולצבור ניסיון מהר יותר, ובמקביל לומדים את החומר המתקדם. רק אל תיפלו למלכודת של "ללמוד הכל בבת אחת" — זה מתכון לשחיקה.
Python, בלי ויכוח. בשוק הישראלי, Python שולטת ב-85%+ ממשרות הדאטה. R עדיין קיימת באקדמיה ובמחקר סטטיסטי, אבל בתעשייה — Python היא השפה. למדו Python קודם, ואם בעתיד תצטרכו R (למשל, אם תיכנסו לתחום ה-Biostatistics) — תלמדו אותה בקלות יחסית כי העקרונות דומים.
בסופו של דבר, אין מסלול נכון או לא נכון — יש את המסלול שנכון לכם. מה שכן נכון תמיד: להתחיל. לפתוח Jupyter Notebook, לכתוב שאילתה ראשונה, לבנות מודל ראשון. הידע הטוב ביותר הוא זה שנרכש עם ידיים על המקלדת ועיניים על נתונים אמיתיים. אנחנו ב-rt-ed.co.il רואים אתכם כבר כמה צעדים קדימה ממקום שאתם רואים את עצמכם — כי ראינו עשרות אנשים שעשו בדיוק את המסע הזה בהצלחה. באתר תמצאו מדריכים נוספים, סילבוסים מעודכנים, ותוכניות לימוד מעשיות שלוקחות אתכם מאפס לעבודה בתעשייה. הדלת פתוחה — עכשיו תורכם להיכנס.