Ir para o conteúdo

Trabalhos de Sincronização e Status dos Dados

Caminho: /dashboard/jobs · Permissão: Módulo Sync Jobs

Monitoramento de Trabalhos de Sincronização Monitoramento de Trabalhos de Sincronização

Os Trabalhos de Sincronização (Sync Jobs) rastreiam cada tarefa em segundo plano que atualiza sua base de conhecimento — uploads de arquivos, rastreamento de URLs e indexação de FAQs. Use esta página para monitorar o progresso, identificar falhas e repetir trabalhos problemáticos.


Como os trabalhos de sincronização são criados

Você nunca precisa criar trabalhos de sincronização manualmente. Eles são gerados automaticamente sempre que você:

  • Faz upload de um arquivo em Base de Conhecimento → Arquivos
  • Adiciona uma URL em Base de Conhecimento → URLs
  • Adiciona ou atualiza um FAQ em Base de Conhecimento → FAQs
  • Clica em Atualizar Base de Conhecimento para disparar uma reindexação completa
  • Rastreia novamente uma URL para atualizar o conteúdo de um site que foi alterado

Cada ação cria um ou mais trabalhos que aparecem nesta página imediatamente.


Colunas da lista de trabalhos

Coluna O que mostra
Tipo O tipo de trabalho — upload de arquivo, rastreamento de URL, sincronização de FAQ ou reindexação completa
Origem O nome do arquivo ou URL que está sendo processado — clique para ver o caminho completo
Status Estado atual: Pendente, Processando, Concluído ou Erro (codificado por cores)
Duração Quanto tempo o trabalho levou do início ao fim
Criado Quando o trabalho foi colocado na fila pela primeira vez
Atualizado A última vez que o status foi alterado

Explicação dos status dos trabalhos

Status Cor O que significa O que fazer
Pendente Cinza Na fila, aguardando um executor para iniciar Nada — ele começará automaticamente
Processando Azul/Âmbar Ativamente extraindo texto, fragmentando conteúdo e criando embeddings vetoriais Aguarde — o progresso está acontecendo
Concluído Verde O conteúdo está totalmente indexado e pesquisável pelo bot Nada — o bot agora pode usar este conteúdo
Erro Vermelho Algo deu errado durante o processamento Leia a mensagem de erro, corrija a causa e tente novamente

O que acontece durante o processamento

Quando um trabalho de sincronização é executado, o sistema realiza estas etapas:

  1. Extração — O texto é extraído da origem (análise de PDF, limpeza de HTML, formatação de FAQ).
  2. Fragmentação (Chunking) — Conteúdos longos são divididos em segmentos menores e sobrepostos para melhor precisão na busca.
  3. Embedding — Cada fragmento é convertido em um vetor numérico usando o modelo de embedding.
  4. Indexação — Os vetores são armazenados no motor de busca para que o bot possa recuperar fragmentos relevantes quando os usuários fizerem perguntas.

Todo esse processo normalmente leva de 10 a 60 segundos para um único arquivo e vários minutos para sitemaps grandes ou uploads em massa.


Tipos comuns de erro e correções

Erro Causa provável Correção
Formato não suportado Tipo de arquivo não reconhecido Converta para PDF, DOCX, TXT, CSV ou Markdown e faça o upload novamente
Protegido por senha PDF ou DOCX está criptografado Remova a proteção por senha e faça o upload novamente
PDF apenas com imagem Documento digitalizado sem texto selecionável Use um software de OCR para converter para um PDF baseado em texto primeiro
URL bloqueada / 403 O site bloqueia rastreadores automatizados Tente uma URL diferente, use um sitemap ou faça o upload do conteúdo da página como um arquivo
Timeout da URL A página demorou muito para responder O site pode estar lento — tente novamente mais tarde ou faça o upload manual do conteúdo
Conteúdo vazio A URL não retornou texto legível A página pode ser pesada em JavaScript (SPA). Faça o upload do conteúdo como um arquivo
Erro de conexão A URL está inacessível Verifique se a URL está correta e publicamente acessível

Para repetir um trabalho que falhou, clique no botão de repetir na linha do trabalho. O sistema o colocará na fila novamente com a mesma origem.


Formatos de arquivo suportados

Formato Extensão Notas
PDF .pdf Deve conter texto selecionável (não imagens digitalizadas)
Word .docx Documentos do Microsoft Word
Texto simples .txt Arquivos de texto simples
CSV .csv Dados separados por vírgula — ótimo para listas de produtos e preços
JSON .json Dados estruturados — útil para documentação de API
Markdown .md Documentação técnica e arquivos README
PowerPoint .pptx Conteúdo de texto de slides de apresentação

Dicas de desempenho

  • PDFs grandes e sitemaps demoram mais — Um PDF de 100 páginas ou um sitemap com mais de 500 URLs pode levar vários minutos. Isso é normal.
  • Escalone uploads grandes — Fazer upload de 50 arquivos de uma vez cria uma fila longa. Faça o upload em lotes de 5 a 10 para um feedback mais rápido.
  • Remova conteúdo desatualizado — Documentos antigos aumentam o tamanho do índice e podem fazer com que o bot recupere informações irrelevantes. Exclua arquivos que você não precisa mais.
  • Monitore após mudanças em massa — Depois de fazer upload de muitos arquivos ou atualizar a base de conhecimento, verifique os Trabalhos de Sincronização para confirmar se tudo foi concluído com sucesso antes de testar o bot.
  • Use sitemaps para websites — Em vez de adicionar 50 URLs individuais, forneça o sitemap.xml do site e deixe o sistema descobrir todas as páginas automaticamente.

FAQ

P: Um trabalho está travado em "Processando" há muito tempo.

  • Arquivos grandes ou sitemaps com muitas páginas podem legitimamente levar vários minutos. Se um trabalho estiver travado por mais de 15 minutos, tente repeti-lo. Se continuar falhando, entre em contato com seu gerente de conta.

P: Uma URL mostra "Erro" repetidamente.

  • O site provavelmente bloqueia rastreadores automatizados, requer autenticação ou retorna conteúdo vazio. Tente: uma URL de página diferente, fornecer uma URL de sitemap ou fazer upload do conteúdo da página como um arquivo.

P: Preciso disparar manualmente os trabalhos de sincronização?

  • Não. Os trabalhos de sincronização são criados automaticamente quando você faz upload de arquivos, adiciona URLs ou cria FAQs. O botão Atualizar Base de Conhecimento na página da Base de Conhecimento dispara uma reindexação completa de todas as fontes.

P: Qual é a diferença entre um trabalho de sincronização e uma reindexação?

  • Um trabalho de sincronização processa uma única fonte nova ou atualizada (um arquivo, uma URL, um FAQ). Uma reindexação (disparada pelo botão Atualizar Base de Conhecimento) reconstrói todo o índice vetorial a partir de todas as fontes atuais. A reindexação é útil após deletar conteúdo ou quando você deseja garantir que tudo esteja atualizado.

P: Os trabalhos de sincronização são por bot?

  • Sim. Os trabalhos de sincronização de cada bot são independentes. Os trabalhos exibidos referem-se apenas ao bot selecionado no momento.