Trabalhos de Sincronização e Status dos Dados
Caminho: /dashboard/jobs · Permissão: Módulo Sync Jobs
Os Trabalhos de Sincronização (Sync Jobs) rastreiam cada tarefa em segundo plano que atualiza sua base de conhecimento — uploads de arquivos, rastreamento de URLs e indexação de FAQs. Use esta página para monitorar o progresso, identificar falhas e repetir trabalhos problemáticos.
Como os trabalhos de sincronização são criados
Você nunca precisa criar trabalhos de sincronização manualmente. Eles são gerados automaticamente sempre que você:
- Faz upload de um arquivo em Base de Conhecimento → Arquivos
- Adiciona uma URL em Base de Conhecimento → URLs
- Adiciona ou atualiza um FAQ em Base de Conhecimento → FAQs
- Clica em Atualizar Base de Conhecimento para disparar uma reindexação completa
- Rastreia novamente uma URL para atualizar o conteúdo de um site que foi alterado
Cada ação cria um ou mais trabalhos que aparecem nesta página imediatamente.
Colunas da lista de trabalhos
| Coluna | O que mostra |
|---|---|
| Tipo | O tipo de trabalho — upload de arquivo, rastreamento de URL, sincronização de FAQ ou reindexação completa |
| Origem | O nome do arquivo ou URL que está sendo processado — clique para ver o caminho completo |
| Status | Estado atual: Pendente, Processando, Concluído ou Erro (codificado por cores) |
| Duração | Quanto tempo o trabalho levou do início ao fim |
| Criado | Quando o trabalho foi colocado na fila pela primeira vez |
| Atualizado | A última vez que o status foi alterado |
Explicação dos status dos trabalhos
| Status | Cor | O que significa | O que fazer |
|---|---|---|---|
| Pendente | Cinza | Na fila, aguardando um executor para iniciar | Nada — ele começará automaticamente |
| Processando | Azul/Âmbar | Ativamente extraindo texto, fragmentando conteúdo e criando embeddings vetoriais | Aguarde — o progresso está acontecendo |
| Concluído | Verde | O conteúdo está totalmente indexado e pesquisável pelo bot | Nada — o bot agora pode usar este conteúdo |
| Erro | Vermelho | Algo deu errado durante o processamento | Leia a mensagem de erro, corrija a causa e tente novamente |
O que acontece durante o processamento
Quando um trabalho de sincronização é executado, o sistema realiza estas etapas:
- Extração — O texto é extraído da origem (análise de PDF, limpeza de HTML, formatação de FAQ).
- Fragmentação (Chunking) — Conteúdos longos são divididos em segmentos menores e sobrepostos para melhor precisão na busca.
- Embedding — Cada fragmento é convertido em um vetor numérico usando o modelo de embedding.
- Indexação — Os vetores são armazenados no motor de busca para que o bot possa recuperar fragmentos relevantes quando os usuários fizerem perguntas.
Todo esse processo normalmente leva de 10 a 60 segundos para um único arquivo e vários minutos para sitemaps grandes ou uploads em massa.
Tipos comuns de erro e correções
| Erro | Causa provável | Correção |
|---|---|---|
| Formato não suportado | Tipo de arquivo não reconhecido | Converta para PDF, DOCX, TXT, CSV ou Markdown e faça o upload novamente |
| Protegido por senha | PDF ou DOCX está criptografado | Remova a proteção por senha e faça o upload novamente |
| PDF apenas com imagem | Documento digitalizado sem texto selecionável | Use um software de OCR para converter para um PDF baseado em texto primeiro |
| URL bloqueada / 403 | O site bloqueia rastreadores automatizados | Tente uma URL diferente, use um sitemap ou faça o upload do conteúdo da página como um arquivo |
| Timeout da URL | A página demorou muito para responder | O site pode estar lento — tente novamente mais tarde ou faça o upload manual do conteúdo |
| Conteúdo vazio | A URL não retornou texto legível | A página pode ser pesada em JavaScript (SPA). Faça o upload do conteúdo como um arquivo |
| Erro de conexão | A URL está inacessível | Verifique se a URL está correta e publicamente acessível |
Para repetir um trabalho que falhou, clique no botão de repetir na linha do trabalho. O sistema o colocará na fila novamente com a mesma origem.
Formatos de arquivo suportados
| Formato | Extensão | Notas |
|---|---|---|
.pdf |
Deve conter texto selecionável (não imagens digitalizadas) | |
| Word | .docx |
Documentos do Microsoft Word |
| Texto simples | .txt |
Arquivos de texto simples |
| CSV | .csv |
Dados separados por vírgula — ótimo para listas de produtos e preços |
| JSON | .json |
Dados estruturados — útil para documentação de API |
| Markdown | .md |
Documentação técnica e arquivos README |
| PowerPoint | .pptx |
Conteúdo de texto de slides de apresentação |
Dicas de desempenho
- PDFs grandes e sitemaps demoram mais — Um PDF de 100 páginas ou um sitemap com mais de 500 URLs pode levar vários minutos. Isso é normal.
- Escalone uploads grandes — Fazer upload de 50 arquivos de uma vez cria uma fila longa. Faça o upload em lotes de 5 a 10 para um feedback mais rápido.
- Remova conteúdo desatualizado — Documentos antigos aumentam o tamanho do índice e podem fazer com que o bot recupere informações irrelevantes. Exclua arquivos que você não precisa mais.
- Monitore após mudanças em massa — Depois de fazer upload de muitos arquivos ou atualizar a base de conhecimento, verifique os Trabalhos de Sincronização para confirmar se tudo foi concluído com sucesso antes de testar o bot.
- Use sitemaps para websites — Em vez de adicionar 50 URLs individuais, forneça o
sitemap.xmldo site e deixe o sistema descobrir todas as páginas automaticamente.
FAQ
P: Um trabalho está travado em "Processando" há muito tempo.
- Arquivos grandes ou sitemaps com muitas páginas podem legitimamente levar vários minutos. Se um trabalho estiver travado por mais de 15 minutos, tente repeti-lo. Se continuar falhando, entre em contato com seu gerente de conta.
P: Uma URL mostra "Erro" repetidamente.
- O site provavelmente bloqueia rastreadores automatizados, requer autenticação ou retorna conteúdo vazio. Tente: uma URL de página diferente, fornecer uma URL de sitemap ou fazer upload do conteúdo da página como um arquivo.
P: Preciso disparar manualmente os trabalhos de sincronização?
- Não. Os trabalhos de sincronização são criados automaticamente quando você faz upload de arquivos, adiciona URLs ou cria FAQs. O botão Atualizar Base de Conhecimento na página da Base de Conhecimento dispara uma reindexação completa de todas as fontes.
P: Qual é a diferença entre um trabalho de sincronização e uma reindexação?
- Um trabalho de sincronização processa uma única fonte nova ou atualizada (um arquivo, uma URL, um FAQ). Uma reindexação (disparada pelo botão Atualizar Base de Conhecimento) reconstrói todo o índice vetorial a partir de todas as fontes atuais. A reindexação é útil após deletar conteúdo ou quando você deseja garantir que tudo esteja atualizado.
P: Os trabalhos de sincronização são por bot?
- Sim. Os trabalhos de sincronização de cada bot são independentes. Os trabalhos exibidos referem-se apenas ao bot selecionado no momento.

