Перейти к содержанию

База знаний

Путь: /dashboard/ (вкладка Данные) · Права доступа: Модуль «База знаний»

Управление базой знаний Управление базой знаний

База знаний — это место, где вы обучаете своего ИИ-ассистента. Она определяет, что бот знает и на какие вопросы может ответить, используя ваши собственные документы, веб-страницы и подготовленные FAQ. Все, что вы загружаете, индексируется в поисковой системе векторов, чтобы бот мог искать по смыслу, а не просто по ключевым словам. Это фундамент интеллекта вашего бота.


Как работает векторный поиск

В отличие от традиционного поиска по ключевым словам, FRENZY.BOT использует семантический поиск (также называемый векторным поиском). Это означает:

  • Пользователь, спрашивающий «Сколько это стоит?», получит ответ из документа о «тарифных планах», даже если точные слова не совпадают.
  • Система понимает смысл, а не только текст.
  • Каждый фрагмент контента преобразуется в числовое «эмбеддинг-представление», которое фиксирует его значение.
  • Когда пользователь задает вопрос, система находит наиболее семантически похожий контент и отправляет его модели ИИ для генерации ответа.

Именно поэтому качество контента в вашей базе знаний напрямую определяет качество ответов вашего бота.


Файлы

Загружайте внутренние документы напрямую в базу знаний вашего бота.

Поддерживаемые форматы

Формат Лучше всего подходит для
PDF Регламенты, отчеты, спецификации (используйте текстовые PDF, а не сканированные изображения)
DOCX Внутренние документы, инструкции (SOP), руководства
TXT Обычный текст, логи, заметки
CSV Структурированные данные, таблицы цен, списки товаров
JSON Документация API, данные конфигураций
Markdown Техническая документация, файлы README
PPTX Презентации с текстовым наполнением

Пошаговая инструкция: загрузка файла

  1. Перейдите в раздел База знаний → Файлы.
  2. Перетащите файлы в область загрузки или нажмите Загрузить.
  3. Дождитесь, пока индикатор состояния изменится на Live.
  4. Задайте боту вопрос по информации из этого файла, чтобы подтвердить обучение.

Управление файлами

  • Включить/отключить — переключайте отдельные файлы без их удаления.
  • Предпросмотр — просмотрите извлеченный текст, чтобы проверить качество контента.
  • Удалить — удаляйте устаревшие документы (они также удаляются из векторного индекса).
  • Массовые операции — выберите несколько файлов для групповых действий.

Размеры и ограничения

Ограничение Значение
Максимальный размер файла 50 МБ на один файл
Рекомендуемый размер файла Менее 10 МБ для быстрой обработки
Количество файлов Нет жесткого лимита — зависит от ресурсов сервера
Время обработки 10–60 секунд на файл; большие PDF могут обрабатываться дольше

Рекомендации

  • Используйте чистые текстовые PDF. Сканы без возможности выделения текста дадут плохие результаты. Если у вас только сканы, пропустите их через OCR-программу.
  • Называйте файлы понятно (например, pricing_2026.pdf, return_policy_v3.docx) — это поможет вам идентифицировать контент позже.
  • Разбивайте большие документы на более мелкие для более быстрой индексации и точного поиска. Руководство на 200 страниц лучше разделить на главы.
  • Удаляйте устаревший контент, чтобы бот не давал неактуальные ответы. Старые прайс-листы или недействующие правила — частая причина ошибок.
  • Проверяйте извлеченный текст — используйте функцию предпросмотра, чтобы убедиться, что система корректно считала текст из вашего файла.

URL-адреса

Обучайте бота напрямую с публичных веб-страниц. Система загружает каждую страницу, удаляет навигацию, меню, скрипты и индексирует только полезный текст.

Режимы URL

  • Одна страница — добавление конкретных страниц по одной.
  • Sitemap — укажите URL к sitemap.xml, чтобы найти и импортировать все страницы сайта сразу.

Пошаговая инструкция: добавление URL

  1. Перейдите в раздел База знаний → URL-адреса.
  2. Вставьте публичный URL (должен начинаться с http:// или https://).
  3. Нажмите Добавить URL.
  4. Следите за статусом: Ожидание → Обработка → Live.

Управление сканированием

  • Отслеживание статуса — каждый URL показывает свое состояние (Live / В процессе / Ошибка).
  • Пересканировать — запускайте повторное сканирование при изменении контента на сайте, чтобы бот владел актуальной информацией.
  • Обработка ошибок — если URL не загружается, проверьте, не блокирует ли сайт ботов и не требуется ли авторизация.

Советы по работе с URL

  • Только публичные страницы. Страницы, защищенные паролем или формой входа, не будут проиндексированы.
  • Импорт Sitemap — самый быстрый способ проиндексировать весь сайт целиком.
  • Некоторые сайты блокируют краулеры. Если URL выдает ошибку, попробуйте сохранить контент в файл и загрузить его.
  • Сайты на JavaScript (SPA) могут возвращать пустой контент. Если после индексации текста нет, скачайте содержимое страницы вручную и загрузите как файл.
  • Регулярно обновляйте данные, если контент на сайте часто меняется — установите напоминание обновлять его раз в месяц.

Источники данных

Путь: /dashboard/data-sources

Источники данных Источники данных

Страница «Источники данных» предоставляет обзор всех источников контента, питающих вашу базу знаний. Она показывает:

Колонка Описание
Источник Имя файла, URL или идентификатор FAQ
Тип Файл, URL или FAQ
Статус Live (доступен для поиска), В процессе, Ошибка или Отключен
Размер Размер контента или количество проиндексированных фрагментов (чанков)
Последнее обновление Когда источник в последний раз индексировался или обновлялся

Синхронизация с WordPress

Если ваш сайт работает на WordPress, FRENZY.BOT может автоматически синхронизировать контент:

  1. Перейдите в Источники данных или База знаний → URL-адреса.
  2. Добавьте URL вашего sitemap.xml (обычно https://yoursite.com/sitemap.xml).
  3. Система найдет и проиндексирует все опубликованные страницы и записи.
  4. При публикации нового контента на WordPress пересканируйте sitemap, чтобы обновить бота.

Держите бота в курсе обновлений сайта

После публикации новых статей или обновления страниц товаров нажмите Обновить базу знаний, чтобы переиндексировать всё заново. Это гарантирует, что у бота всегда будет самая свежая информация.


FAQ (Часто задаваемые вопросы)

Добавляйте точные ответы на самые приоритетные вопросы. FAQ дают вам полный контроль над конкретными реакциями бота.

Почему FAQ эффективны

  • Приоритетные ответы — ответы из FAQ имеют приоритет над информацией из документов при совпадении вопроса.
  • Мгновенная индексация — FAQ доступны сразу, без задержек на обработку.
  • Точный контроль — вы пишете именно тот ответ, который должен выдать бот.
  • Легкое обновление — редактируйте или удаляйте отдельные пары «Вопрос-Ответ» без перезагрузки файлов.

Пошаговая инструкция: добавление FAQ

  1. Перейдите в раздел База знаний → FAQ.
  2. Нажмите Добавить FAQ.
  3. Введите вопрос, который могут задать пользователи.
  4. Введите точный ответ.
  5. Сохраните — FAQ активен немедленно.
  6. Проверьте результат в чате.

Когда использовать FAQ

Сценарий Пример
Вопросы о ценах «Сколько стоит тариф Pro?» → Точный ответ по прайсу
Официальные правила «Как вернуть товар?» → Официальный текст политики возврата
Контакты и график «Когда вы работаете?» → Часы работы компании
Частые возражения «Почему вы лучше, чем X?» → Подготовленный аргумент
Исправления Бот ошибся в теме → FAQ перекрывает ошибку правильным ответом

Обновление знаний

Нажмите Обновить базу знаний, чтобы переиндексировать весь контент. Это перестраивает векторный индекс на основе ваших текущих файлов, URL и FAQ.

Когда нужно обновление:

  • После загрузки или обновления файлов
  • После изменения контента на сайте
  • После пакетного добавления множества FAQ
  • После удаления устаревшего контента

Обновление не удаляет данные

Обновление не удаляет исходный контент. Оно заново обрабатывает всё, чтобы векторный индекс соответствовал вашим актуальным данным.


Изоляция данных для каждого бота

В настройке нескольких ботов каждый бот имеет свою отдельную векторную коллекцию. Это означает:

  • База знаний Бота А полностью невидима для Бота Б.
  • Загрузка файла для одного бота никак не влияет на остальных.
  • Удаление бота удаляет всю его векторную коллекцию и все загруженные файлы.
  • Каждый бот может иметь совершенно разный контент, оптимизированный под его аудиторию.

Часто задаваемые вопросы (Общие)

В: Файл показывает статус «Ошибка».

  • Файл может быть поврежден, защищен паролем или иметь неподдерживаемый формат. Попробуйте конвертировать его в PDF или DOCX и загрузить снова.

В: URL-адреса заблокированы или показывают пустой контент.

  • Некоторые сайты блокируют автоматические краулеры. Попробуйте другой URL, укажите sitemap или загрузите содержимое страницы в виде файла.

В: Бот неверно отвечает на тему.

  • Добавьте FAQ с точным правильным ответом — FAQ имеют приоритет. Также проверьте системный промпт в разделе Настройки → Модель поведения на наличие противоречивых инструкций.

В: Сколько времени занимает индексация?

  • Файлы: обычно 10–60 секунд в зависимости от размера. Большие PDF или карты сайта с множеством страниц могут занять несколько минут. Следите за прогрессом в разделе Задачи синхронизации.

В: Можно ли индексировать закрытый контент (база знаний за логином)?

  • Напрямую нет. Страницы, требующие авторизации, не загрузятся. Экспортируйте контент в файл и загрузите его вручную.