לדלג לתוכן

סטטוס עבודות סנכרון ונתונים

נתיב: /dashboard/jobs · הרשאה: מודול Sync Jobs

Sync Jobs Monitoring Sync Jobs Monitoring

עבודות הסנכרון עוקבות אחרי כל משימת רקע שמעדכנת את בסיס הידע שלך — העלאות קבצים, סריקת URLים, ואינדקס של שאלות נפוצות. תשתמש בדף הזה כדי לעקוב אחרי התקדמות, לזהות כשלים, ולנסות שוב עבודות בעייתיות.


איך נוצרות עבודות סנכרון

אף פעם לא צריך ליצור עבודות סנכרון באופן ידני. הן נוצרות אוטומטית בכל פעם ש:

  • מעלים קובץ ב-Knowledge Base → Files
  • מוסיפים URL ב-Knowledge Base → URLs
  • מוסיפים או מעדכנים שאלה נפוצה ב-Knowledge Base → FAQs
  • לוחצים על Refresh Knowledge Base כדי להפעיל אינדוקס מלא מחדש
  • סורקים מחדש URL כדי לעדכן תוכן מאתר שהשתנה

כל פעולה יוצרת עבודה אחת או יותר שמופיעות בדף הזה מיד.


עמודות ברשימת העבודות

עמודה מה היא מציגה
Type סוג העבודה — העלאת קובץ, סריקת URL, סנכרון FAQ, או אינדוקס מלא מחדש
Source שם הקובץ או ה-URL שמעובדים — לחץ כדי לראות את הנתיב המלא
Status המצב הנוכחי: Pending, Processing, Completed, או Error (מקודד בצבע)
Duration כמה זמן לקח לעבודה מההתחלה ועד הסוף
Created מתי העבודה נכנסה לתור לראשונה
Updated הפעם האחרונה שהסטטוס השתנה

הסבר על סטטוסי העבודות

סטטוס צבע מה זה אומר מה לעשות
Pending אפור בתור, מחכה שעובד יטפל בזה כלום — זה יתחיל אוטומטית
Processing כחול/ענבר מחלץ טקסט באופן אקטיבי, מחלק תוכן, ויוצר embeddings וקטוריים לחכות — ההתקדמות מתרחשת
Completed ירוק התוכן עבר אינדוקס מלא והבוט יכול לחפש בו כלום — הבוט יכול עכשיו להשתמש בתוכן הזה
Error אדום משהו השתבש במהלך העיבוד תקרא את הודעת השגיאה, תתקן את הבעיה, ותנסה שוב

מה קורה במהלך העיבוד

כשעבודת סנכרון רצה, המערכת מבצעת את השלבים האלה:

  1. Extraction — טקסט מחולץ מהמקור (פירוק PDF, הסרת HTML, עיצוב FAQ).
  2. Chunking — תוכן ארוך מחולק למקטעים קטנים יותר שחופפים, בשביל דיוק חיפוש טוב יותר.
  3. Embedding — כל מקטע מומר לווקטור מספרי באמצעות מודל ה-embedding.
  4. Indexing — הווקטורים נשמרים במנוע החיפוש כך שהבוט יוכל לשלוף מקטעים רלוונטיים כשמשתמשים שואלים שאלות.

כל התהליך הזה בדרך כלל לוקח 10–60 שניות לקובץ בודד, וכמה דקות לsitemaps גדולים או העלאות מרובות.


סוגי שגיאות נפוצות ותיקונים

שגיאה הגורם הסביר התיקון
Unsupported format סוג הקובץ לא מזוהה המר ל-PDF, DOCX, TXT, CSV, או Markdown והעלה מחדש
Password protected קובץ PDF או DOCX מוצפן הסר את הגנת הסיסמה והעלה מחדש
Image-only PDF מסמך סרוק בלי טקסט שאפשר לבחור השתמש בתוכנת OCR כדי להמיר ל-PDF מבוסס טקסט קודם
URL blocked / 403 האתר חוסם סורקים אוטומטיים נסה URL אחר, השתמש ב-sitemap, או העלה את תוכן הדף כקובץ
URL timeout הדף לקח יותר מדי זמן להגיב האתר יכול להיות איטי — נסה שוב מאוחר יותר, או העלה את התוכן ידנית
Empty content ה-URL לא החזיר טקסט קריא הדף עשוי להיות כבד ב-JavaScript (SPA). העלה את התוכן כקובץ במקום
Connection error ה-URL לא זמין בדוק שה-URL נכון ונגיש לציבור

כדי לנסות שוב עבודה שנכשלה, לחץ על כפתור הניסיון החוזר בשורת העבודה. המערכת תכניס אותה שוב לתור עם אותו מקור.


פורמטי קבצים נתמכים

פורמט סיומת הערות
PDF .pdf חייב להכיל טקסט שאפשר לבחור (לא תמונות סרוקות)
Word .docx מסמכי Microsoft Word
Plain text .txt קבצי טקסט פשוטים
CSV .csv נתונים מופרדים בפסיקים — מצוין לרשימות מוצרים ותמחור
JSON .json נתונים מובנים — שימושי לתיעוד API
Markdown .md תיעוד טכני וקבצי README
PowerPoint .pptx תוכן טקסט משקופיות מצגת

טיפים לביצועים

  • PDFים גדולים וsitemaps לוקחים יותר זמן — PDF של 100 עמודים או sitemap עם 500+ URLים עלול לקחת כמה דקות. זה נורמלי.
  • פזר העלאות גדולות — להעלות 50 קבצים בבת אחת יוצר תור ארוך. העלה במנות של 5–10 בשביל משוב מהיר יותר.
  • הסר תוכן מיושן — מסמכים ישנים מגדילים את גודל האינדקס ועלולים לגרום לבוט לשלוף מידע לא רלוונטי. מחק קבצים שאתה כבר לא צריך.
  • עקוב אחרי שינויים מרובים — אחרי שמעלים קבצים רבים או מרעננים את בסיס הידע, בדוק ב-Sync Jobs שהכל הושלם בהצלחה לפני שבודקים את הבוט.
  • השתמש ב-sitemaps לאתרים — במקום להוסיף 50 URLים בודדים, תספק את ה-sitemap.xml של האתר ותן למערכת לגלות את כל הדפים אוטומטית.

שאלות נפוצות

ש: עבודה תקועה ב-"Processing" הרבה זמן.

  • קבצים גדולים או sitemaps עם דפים רבים יכולים באמת לקחת כמה דקות. אם עבודה תקועה יותר מ-15 דקות, נסה לנסות אותה שוב. אם היא ממשיכה להיכשל, צור קשר עם מנהל החשבון שלך.

ש: URL מציג "Error" שוב ושוב.

  • סביר שהאתר חוסם סורקים אוטומטיים, דורש אימות, או מחזיר תוכן ריק. נסה: URL של דף אחר, לספק URL של sitemap במקום, או להעלות את תוכן הדף כקובץ.

ש: האם צריך להפעיל עבודות סנכרון ידנית?

  • לא. עבודות סנכרון נוצרות אוטומטית כשמעלים קבצים, מוסיפים URLים, או יוצרים FAQs. הכפתור Refresh Knowledge Base בדף ה-Knowledge Base מפעיל אינדוקס מלא מחדש של כל המקורות.

ש: מה ההבדל בין עבודת סנכרון לבין re-index?

  • עבודת סנכרון מעבדת מקור חדש או מעודכן בודד (קובץ אחד, URL אחד, FAQ אחד). re-index (שמופעל על ידי Refresh Knowledge Base) בונה מחדש את כל האינדקס הווקטורי מכל המקורות הנוכחיים. re-indexing שימושי אחרי מחיקת תוכן או כשרוצים לוודא שהכל טרי.

ש: האם עבודות הסנכרון הן לכל בוט בנפרד?

  • כן. עבודות הסנכרון של כל בוט בלתי תלויות. העבודות שמוצגות הן רק לבוט שנבחר כרגע.