סטטוס עבודות סנכרון ונתונים
נתיב: /dashboard/jobs · הרשאה: מודול Sync Jobs
עבודות הסנכרון עוקבות אחרי כל משימת רקע שמעדכנת את בסיס הידע שלך — העלאות קבצים, סריקת URLים, ואינדקס של שאלות נפוצות. תשתמש בדף הזה כדי לעקוב אחרי התקדמות, לזהות כשלים, ולנסות שוב עבודות בעייתיות.
איך נוצרות עבודות סנכרון
אף פעם לא צריך ליצור עבודות סנכרון באופן ידני. הן נוצרות אוטומטית בכל פעם ש:
- מעלים קובץ ב-Knowledge Base → Files
- מוסיפים URL ב-Knowledge Base → URLs
- מוסיפים או מעדכנים שאלה נפוצה ב-Knowledge Base → FAQs
- לוחצים על Refresh Knowledge Base כדי להפעיל אינדוקס מלא מחדש
- סורקים מחדש URL כדי לעדכן תוכן מאתר שהשתנה
כל פעולה יוצרת עבודה אחת או יותר שמופיעות בדף הזה מיד.
עמודות ברשימת העבודות
| עמודה | מה היא מציגה |
|---|---|
| Type | סוג העבודה — העלאת קובץ, סריקת URL, סנכרון FAQ, או אינדוקס מלא מחדש |
| Source | שם הקובץ או ה-URL שמעובדים — לחץ כדי לראות את הנתיב המלא |
| Status | המצב הנוכחי: Pending, Processing, Completed, או Error (מקודד בצבע) |
| Duration | כמה זמן לקח לעבודה מההתחלה ועד הסוף |
| Created | מתי העבודה נכנסה לתור לראשונה |
| Updated | הפעם האחרונה שהסטטוס השתנה |
הסבר על סטטוסי העבודות
| סטטוס | צבע | מה זה אומר | מה לעשות |
|---|---|---|---|
| Pending | אפור | בתור, מחכה שעובד יטפל בזה | כלום — זה יתחיל אוטומטית |
| Processing | כחול/ענבר | מחלץ טקסט באופן אקטיבי, מחלק תוכן, ויוצר embeddings וקטוריים | לחכות — ההתקדמות מתרחשת |
| Completed | ירוק | התוכן עבר אינדוקס מלא והבוט יכול לחפש בו | כלום — הבוט יכול עכשיו להשתמש בתוכן הזה |
| Error | אדום | משהו השתבש במהלך העיבוד | תקרא את הודעת השגיאה, תתקן את הבעיה, ותנסה שוב |
מה קורה במהלך העיבוד
כשעבודת סנכרון רצה, המערכת מבצעת את השלבים האלה:
- Extraction — טקסט מחולץ מהמקור (פירוק PDF, הסרת HTML, עיצוב FAQ).
- Chunking — תוכן ארוך מחולק למקטעים קטנים יותר שחופפים, בשביל דיוק חיפוש טוב יותר.
- Embedding — כל מקטע מומר לווקטור מספרי באמצעות מודל ה-embedding.
- Indexing — הווקטורים נשמרים במנוע החיפוש כך שהבוט יוכל לשלוף מקטעים רלוונטיים כשמשתמשים שואלים שאלות.
כל התהליך הזה בדרך כלל לוקח 10–60 שניות לקובץ בודד, וכמה דקות לsitemaps גדולים או העלאות מרובות.
סוגי שגיאות נפוצות ותיקונים
| שגיאה | הגורם הסביר | התיקון |
|---|---|---|
| Unsupported format | סוג הקובץ לא מזוהה | המר ל-PDF, DOCX, TXT, CSV, או Markdown והעלה מחדש |
| Password protected | קובץ PDF או DOCX מוצפן | הסר את הגנת הסיסמה והעלה מחדש |
| Image-only PDF | מסמך סרוק בלי טקסט שאפשר לבחור | השתמש בתוכנת OCR כדי להמיר ל-PDF מבוסס טקסט קודם |
| URL blocked / 403 | האתר חוסם סורקים אוטומטיים | נסה URL אחר, השתמש ב-sitemap, או העלה את תוכן הדף כקובץ |
| URL timeout | הדף לקח יותר מדי זמן להגיב | האתר יכול להיות איטי — נסה שוב מאוחר יותר, או העלה את התוכן ידנית |
| Empty content | ה-URL לא החזיר טקסט קריא | הדף עשוי להיות כבד ב-JavaScript (SPA). העלה את התוכן כקובץ במקום |
| Connection error | ה-URL לא זמין | בדוק שה-URL נכון ונגיש לציבור |
כדי לנסות שוב עבודה שנכשלה, לחץ על כפתור הניסיון החוזר בשורת העבודה. המערכת תכניס אותה שוב לתור עם אותו מקור.
פורמטי קבצים נתמכים
| פורמט | סיומת | הערות |
|---|---|---|
.pdf |
חייב להכיל טקסט שאפשר לבחור (לא תמונות סרוקות) | |
| Word | .docx |
מסמכי Microsoft Word |
| Plain text | .txt |
קבצי טקסט פשוטים |
| CSV | .csv |
נתונים מופרדים בפסיקים — מצוין לרשימות מוצרים ותמחור |
| JSON | .json |
נתונים מובנים — שימושי לתיעוד API |
| Markdown | .md |
תיעוד טכני וקבצי README |
| PowerPoint | .pptx |
תוכן טקסט משקופיות מצגת |
טיפים לביצועים
- PDFים גדולים וsitemaps לוקחים יותר זמן — PDF של 100 עמודים או sitemap עם 500+ URLים עלול לקחת כמה דקות. זה נורמלי.
- פזר העלאות גדולות — להעלות 50 קבצים בבת אחת יוצר תור ארוך. העלה במנות של 5–10 בשביל משוב מהיר יותר.
- הסר תוכן מיושן — מסמכים ישנים מגדילים את גודל האינדקס ועלולים לגרום לבוט לשלוף מידע לא רלוונטי. מחק קבצים שאתה כבר לא צריך.
- עקוב אחרי שינויים מרובים — אחרי שמעלים קבצים רבים או מרעננים את בסיס הידע, בדוק ב-Sync Jobs שהכל הושלם בהצלחה לפני שבודקים את הבוט.
- השתמש ב-sitemaps לאתרים — במקום להוסיף 50 URLים בודדים, תספק את ה-
sitemap.xmlשל האתר ותן למערכת לגלות את כל הדפים אוטומטית.
שאלות נפוצות
ש: עבודה תקועה ב-"Processing" הרבה זמן.
- קבצים גדולים או sitemaps עם דפים רבים יכולים באמת לקחת כמה דקות. אם עבודה תקועה יותר מ-15 דקות, נסה לנסות אותה שוב. אם היא ממשיכה להיכשל, צור קשר עם מנהל החשבון שלך.
ש: URL מציג "Error" שוב ושוב.
- סביר שהאתר חוסם סורקים אוטומטיים, דורש אימות, או מחזיר תוכן ריק. נסה: URL של דף אחר, לספק URL של sitemap במקום, או להעלות את תוכן הדף כקובץ.
ש: האם צריך להפעיל עבודות סנכרון ידנית?
- לא. עבודות סנכרון נוצרות אוטומטית כשמעלים קבצים, מוסיפים URLים, או יוצרים FAQs. הכפתור Refresh Knowledge Base בדף ה-Knowledge Base מפעיל אינדוקס מלא מחדש של כל המקורות.
ש: מה ההבדל בין עבודת סנכרון לבין re-index?
- עבודת סנכרון מעבדת מקור חדש או מעודכן בודד (קובץ אחד, URL אחד, FAQ אחד). re-index (שמופעל על ידי Refresh Knowledge Base) בונה מחדש את כל האינדקס הווקטורי מכל המקורות הנוכחיים. re-indexing שימושי אחרי מחיקת תוכן או כשרוצים לוודא שהכל טרי.
ש: האם עבודות הסנכרון הן לכל בוט בנפרד?
- כן. עבודות הסנכרון של כל בוט בלתי תלויות. העבודות שמוצגות הן רק לבוט שנבחר כרגע.

