مهام المزامنة وحالة البيانات
المسار: /dashboard/jobs · الصلاحية: وحدة مهام المزامنة (Sync Jobs module)
تتتبع "مهام المزامنة" كل مهمة خلفية تقوم بتحديث قاعدة معرفتك — مثل رفع الملفات، وزحف الروابط (URL crawls)، وفهرسة الأسئلة الشائعة. استخدم هذه الصفحة لمراقبة التقدم، وتحديد الإخفاقات، وإعادة محاولة تنفيذ المهام التي واجهت مشاكل.
كيف يتم إنشاء مهام المزامنة
لا تحتاج أبدًا إلى إنشاء مهام المزامنة يدويًا. يتم إنشاؤها تلقائيًا عندما تقوم بـ:
- رفع ملف في قاعدة المعرفة ← الملفات
- إضافة رابط (URL) في قاعدة المعرفة ← الروابط
- إضافة أو تحديث سؤال شائع في قاعدة المعرفة ← الأسئلة الشائعة
- النقر على "تحديث قاعدة المعرفة" لتشغيل إعادة فهرسة كاملة
- إعادة زحف رابط لتحديث المحتوى من موقع إلكتروني تم تغييره
تنشئ كل عملية مهمة واحدة أو أكثر تظهر في هذه الصفحة على الفور.
أعمدة قائمة المهام
| العمود | ما يظهره |
|---|---|
| النوع (Type) | نوع المهمة — رفع ملف، زحف رابط، مزامنة أسئلة شائعة، أو إعادة فهرسة كاملة |
| المصدر (Source) | اسم الملف أو الرابط الذي يتم معالجته — انقر لرؤية المسار الكامل |
| الحالة (Status) | الحالة الحالية: قيد الانتظار، قيد المعالجة، مكتمل، أو خطأ (ملونة) |
| المدة (Duration) | الوقت الذي استغرقته المهمة من البداية إلى النهاية |
| تاريخ الإنشاء (Created) | متى تم وضع المهمة في قائمة الانتظار لأول مرة |
| تاريخ التحديث (Updated) | آخر مرة تغيرت فيها الحالة |
شرح حالات المهام
| الحالة | اللون | ماذا تعني | ماذا تفعل |
|---|---|---|---|
| قيد الانتظار (Pending) | رمادي | في قائمة الانتظار، بانتظار بدء المعالجة | لا شيء — ستبدأ تلقائيًا |
| قيد المعالجة (Processing) | أزرق/كهرماني | يتم حاليًا استخراج النص، تقسيم المحتوى، وإنشاء التضمينات المتجهة (vector embeddings) | انتظر — العمل جارٍ |
| مكتمل (Completed) | أخضر | تمت فهرسة المحتوى بالكامل وأصبح قابلًا للبحث بواسطة البوت | لا شيء — يمكن للبوت الآن استخدام هذا المحتوى |
| خطأ (Error) | أحمر | حدث خطأ ما أثناء المعالجة | اقرأ رسالة الخطأ، أصلح السبب، وأعد المحاولة |
ماذا يحدث أثناء المعالجة
عند تشغيل مهمة مزامنة، يقوم النظام بالخطوات التالية:
- الاستخراج (Extraction) — يتم استخراج النص من المصدر (تحليل ملفات PDF، إزالة وسوم HTML، تنسيق الأسئلة الشائعة).
- التقسيم (Chunking) — يتم تقسيم المحتوى الطويل إلى أجزاء أصغر ومتداخلة لتحسين دقة البحث.
- التضمين (Embedding) — يتم تحويل كل جزء إلى متجه عددي باستخدام نموذج التضمين.
- الفهرسة (Indexing) — تُخزن المتجهات في محرك البحث ليتمكن البوت من استرجاع الأجزاء ذات الصلة عندما يطرح المستخدمون الأسئلة.
تستغرق هذه العملية بالكامل عادةً من 10 إلى 60 ثانية للملف الواحد، وعدة دقائق لخرائط المواقع الكبيرة أو عمليات الرفع الجماعي.
أنواع الأخطاء الشائعة وحلولها
| الخطأ | السبب المرجح | الحل |
|---|---|---|
| تنسيق غير مدعوم | نوع الملف غير معترف به | حوله إلى PDF أو DOCX أو TXT أو CSV أو Markdown وأعد رفعه |
| محمي بكلمة مرور | ملف PDF أو DOCX مشفر | أزل حماية كلمة المرور وأعد رفعه |
| PDF صوري فقط | مستند ممسوح ضوئيًا بدون نص قابل للتحديد | استخدم برنامج OCR للتحويل إلى PDF نصي أولاً |
| الرابط محظور / 403 | الموقع يحظر زواحف الأرشفة الآلية | جرب رابطًا مختلفًا، استخدم خريطة موقع، أو ارفع محتوى الصفحة كملف |
| انتهاء مهلة الرابط | استغرقت الصفحة وقتًا طويلاً للرد | قد يكون الموقع بطيئًا — حاول لاحقًا، أو ارفع المحتوى يدويًا |
| محتوى فارغ | الرابط لم يرجع أي نص قابل للقراءة | قد تكون الصفحة تعتمد بكثافة على JavaScript (SPA). ارفع المحتوى كملف بدلاً من ذلك |
| خطأ في الاتصال | تعذر الوصول إلى الرابط | تأكد من صحة الرابط وأنه متاح للعامة |
لإعادة محاولة مهمة فاشلة، انقر على زر إعادة المحاولة (retry button) في صف المهمة. سيقوم النظام بإعادتها إلى قائمة الانتظار بنفس المصدر.
تنسيقات الملفات المدعومة
| التنسيق | الامتداد | ملاحظات |
|---|---|---|
.pdf |
يجب أن يحتوي على نص قابل للتحديد (وليس صورًا ممسوحة ضوئيًا) | |
| Word | .docx |
مستندات Microsoft Word |
| نص مجرد | .txt |
ملفات نصية بسيطة |
| CSV | .csv |
بيانات مفصولة بفاصلة — ممتاز لقوائم المنتجات والأسعار |
| JSON | .json |
بيانات منظمة — مفيد لتوثيق واجهات البرمجة (API) |
| Markdown | .md |
التوثيق التقني وملفات README |
| PowerPoint | .pptx |
المحتوى النصي من شرائح العروض التقديمية |
نصائح للأداء
- ملفات PDF الكبيرة وخرائط المواقع تستغرق وقتًا أطول — قد يستغرق ملف PDF مكون من 100 صفحة أو خريطة موقع تضم أكثر من 500 رابط عدة دقائق. هذا أمر طبيعي.
- وزع عمليات الرفع الكبيرة — رفع 50 ملفًا في وقت واحد ينشئ قائمة انتظار طويلة. ارفع الملفات في مجموعات من 5-10 للحصول على نتائج أسرع.
- أزل المحتوى القديم — المستندات القديمة تزيد من حجم الفهرس وقد تجعل البوت يسترجع معلومات غير ذات صلة. احذف الملفات التي لم تعد بحاجة إليها.
- راقب بعد التغييرات الجماعية — بعد رفع العديد من الملفات أو تحديث قاعدة المعرفة، تحقق من "مهام المزامنة" للتأكد من اكتمال كل شيء بنجاح قبل اختبار البوت.
- استخدم خرائط المواقع (Sitemaps) — بدلاً من إضافة 50 رابطًا فرديًا، قدم رابط
sitemap.xmlالخاص بالموقع واترك النظام يكتشف جميع الصفحات تلقائيًا.
الأسئلة الشائعة
س: هناك مهمة عالقة في حالة "قيد المعالجة" لفترة طويلة.
- الملفات الكبيرة أو خرائط المواقع التي تحتوي على صفحات عديدة قد تستغرق عدة دقائق بشكل طبيعي. إذا ظلت المهمة عالقة لأكثر من 15 دقيقة، جرب إعادة المحاولة. إذا استمر الفشل، اتصل بمسؤول حسابك.
س: يظهر الرابط "خطأ" بشكل متكرر.
- من المرجح أن الموقع يحظر الزواحف الآلية، أو يتطلب مصادقة، أو يرجع محتوى فارغًا. جرب: رابط صفحة مختلف، تقديم رابط خريطة موقع بدلاً من ذلك، أو رفع محتوى الصفحة كملف.
س: هل أحتاج إلى تشغيل مهام المزامنة يدويًا؟
- لا. يتم إنشاء مهام المزامنة تلقائيًا عند رفع الملفات أو إضافة الروابط أو إنشاء الأسئلة الشائعة. زر تحديث قاعدة المعرفة (Refresh Knowledge Base) في صفحة قاعدة المعرفة يشغل إعادة فهرسة كاملة لجميع المصادر.
س: ما الفرق بين مهمة المزامنة وإعادة الفهرسة؟
- مهمة المزامنة (Sync Job) تعالج مصدرًا واحدًا جديدًا أو محدثًا (ملف واحد، رابط واحد، سؤال شائع واحد). أما إعادة الفهرسة (Re-index) (التي يتم تشغيلها عبر "تحديث قاعدة المعرفة") فتقوم بإعادة بناء فهرس المتجهات بالكامل من جميع المصادر الحالية. إعادة الفهرسة مفيدة بعد حذف المحتوى أو عندما تريد التأكد من تحديث كل شيء.
س: هل مهام المزامنة خاصة بكل بوت؟
- نعم. مهام المزامنة لكل بوت مستقلة عن غيرها. المهام المعروضة تخص البوت المحدد حاليًا فقط.

