База знаний
Путь: /dashboard/ (вкладка Данные) · Права доступа: Модуль «База знаний»
База знаний — это место, где вы обучаете своего ИИ-ассистента. Она определяет, что бот знает и на какие вопросы может ответить, используя ваши собственные документы, веб-страницы и подготовленные FAQ. Все, что вы загружаете, индексируется в поисковой системе векторов, чтобы бот мог искать по смыслу, а не просто по ключевым словам. Это фундамент интеллекта вашего бота.
Как работает векторный поиск
В отличие от традиционного поиска по ключевым словам, FRENZY.BOT использует семантический поиск (также называемый векторным поиском). Это означает:
- Пользователь, спрашивающий «Сколько это стоит?», получит ответ из документа о «тарифных планах», даже если точные слова не совпадают.
- Система понимает смысл, а не только текст.
- Каждый фрагмент контента преобразуется в числовое «эмбеддинг-представление», которое фиксирует его значение.
- Когда пользователь задает вопрос, система находит наиболее семантически похожий контент и отправляет его модели ИИ для генерации ответа.
Именно поэтому качество контента в вашей базе знаний напрямую определяет качество ответов вашего бота.
Файлы
Загружайте внутренние документы напрямую в базу знаний вашего бота.
Поддерживаемые форматы
| Формат | Лучше всего подходит для |
|---|---|
| Регламенты, отчеты, спецификации (используйте текстовые PDF, а не сканированные изображения) | |
| DOCX | Внутренние документы, инструкции (SOP), руководства |
| TXT | Обычный текст, логи, заметки |
| CSV | Структурированные данные, таблицы цен, списки товаров |
| JSON | Документация API, данные конфигураций |
| Markdown | Техническая документация, файлы README |
| PPTX | Презентации с текстовым наполнением |
Пошаговая инструкция: загрузка файла
- Перейдите в раздел База знаний → Файлы.
- Перетащите файлы в область загрузки или нажмите Загрузить.
- Дождитесь, пока индикатор состояния изменится на Live.
- Задайте боту вопрос по информации из этого файла, чтобы подтвердить обучение.
Управление файлами
- Включить/отключить — переключайте отдельные файлы без их удаления.
- Предпросмотр — просмотрите извлеченный текст, чтобы проверить качество контента.
- Удалить — удаляйте устаревшие документы (они также удаляются из векторного индекса).
- Массовые операции — выберите несколько файлов для групповых действий.
Размеры и ограничения
| Ограничение | Значение |
|---|---|
| Максимальный размер файла | 50 МБ на один файл |
| Рекомендуемый размер файла | Менее 10 МБ для быстрой обработки |
| Количество файлов | Нет жесткого лимита — зависит от ресурсов сервера |
| Время обработки | 10–60 секунд на файл; большие PDF могут обрабатываться дольше |
Рекомендации
- Используйте чистые текстовые PDF. Сканы без возможности выделения текста дадут плохие результаты. Если у вас только сканы, пропустите их через OCR-программу.
- Называйте файлы понятно (например,
pricing_2026.pdf,return_policy_v3.docx) — это поможет вам идентифицировать контент позже. - Разбивайте большие документы на более мелкие для более быстрой индексации и точного поиска. Руководство на 200 страниц лучше разделить на главы.
- Удаляйте устаревший контент, чтобы бот не давал неактуальные ответы. Старые прайс-листы или недействующие правила — частая причина ошибок.
- Проверяйте извлеченный текст — используйте функцию предпросмотра, чтобы убедиться, что система корректно считала текст из вашего файла.
URL-адреса
Обучайте бота напрямую с публичных веб-страниц. Система загружает каждую страницу, удаляет навигацию, меню, скрипты и индексирует только полезный текст.
Режимы URL
- Одна страница — добавление конкретных страниц по одной.
- Sitemap — укажите URL к
sitemap.xml, чтобы найти и импортировать все страницы сайта сразу.
Пошаговая инструкция: добавление URL
- Перейдите в раздел База знаний → URL-адреса.
- Вставьте публичный URL (должен начинаться с
http://илиhttps://). - Нажмите Добавить URL.
- Следите за статусом: Ожидание → Обработка → Live.
Управление сканированием
- Отслеживание статуса — каждый URL показывает свое состояние (Live / В процессе / Ошибка).
- Пересканировать — запускайте повторное сканирование при изменении контента на сайте, чтобы бот владел актуальной информацией.
- Обработка ошибок — если URL не загружается, проверьте, не блокирует ли сайт ботов и не требуется ли авторизация.
Советы по работе с URL
- Только публичные страницы. Страницы, защищенные паролем или формой входа, не будут проиндексированы.
- Импорт Sitemap — самый быстрый способ проиндексировать весь сайт целиком.
- Некоторые сайты блокируют краулеры. Если URL выдает ошибку, попробуйте сохранить контент в файл и загрузить его.
- Сайты на JavaScript (SPA) могут возвращать пустой контент. Если после индексации текста нет, скачайте содержимое страницы вручную и загрузите как файл.
- Регулярно обновляйте данные, если контент на сайте часто меняется — установите напоминание обновлять его раз в месяц.
Источники данных
Путь: /dashboard/data-sources
Страница «Источники данных» предоставляет обзор всех источников контента, питающих вашу базу знаний. Она показывает:
| Колонка | Описание |
|---|---|
| Источник | Имя файла, URL или идентификатор FAQ |
| Тип | Файл, URL или FAQ |
| Статус | Live (доступен для поиска), В процессе, Ошибка или Отключен |
| Размер | Размер контента или количество проиндексированных фрагментов (чанков) |
| Последнее обновление | Когда источник в последний раз индексировался или обновлялся |
Синхронизация с WordPress
Если ваш сайт работает на WordPress, FRENZY.BOT может автоматически синхронизировать контент:
- Перейдите в Источники данных или База знаний → URL-адреса.
- Добавьте URL вашего
sitemap.xml(обычноhttps://yoursite.com/sitemap.xml). - Система найдет и проиндексирует все опубликованные страницы и записи.
- При публикации нового контента на WordPress пересканируйте sitemap, чтобы обновить бота.
Держите бота в курсе обновлений сайта
После публикации новых статей или обновления страниц товаров нажмите Обновить базу знаний, чтобы переиндексировать всё заново. Это гарантирует, что у бота всегда будет самая свежая информация.
FAQ (Часто задаваемые вопросы)
Добавляйте точные ответы на самые приоритетные вопросы. FAQ дают вам полный контроль над конкретными реакциями бота.
Почему FAQ эффективны
- Приоритетные ответы — ответы из FAQ имеют приоритет над информацией из документов при совпадении вопроса.
- Мгновенная индексация — FAQ доступны сразу, без задержек на обработку.
- Точный контроль — вы пишете именно тот ответ, который должен выдать бот.
- Легкое обновление — редактируйте или удаляйте отдельные пары «Вопрос-Ответ» без перезагрузки файлов.
Пошаговая инструкция: добавление FAQ
- Перейдите в раздел База знаний → FAQ.
- Нажмите Добавить FAQ.
- Введите вопрос, который могут задать пользователи.
- Введите точный ответ.
- Сохраните — FAQ активен немедленно.
- Проверьте результат в чате.
Когда использовать FAQ
| Сценарий | Пример |
|---|---|
| Вопросы о ценах | «Сколько стоит тариф Pro?» → Точный ответ по прайсу |
| Официальные правила | «Как вернуть товар?» → Официальный текст политики возврата |
| Контакты и график | «Когда вы работаете?» → Часы работы компании |
| Частые возражения | «Почему вы лучше, чем X?» → Подготовленный аргумент |
| Исправления | Бот ошибся в теме → FAQ перекрывает ошибку правильным ответом |
Обновление знаний
Нажмите Обновить базу знаний, чтобы переиндексировать весь контент. Это перестраивает векторный индекс на основе ваших текущих файлов, URL и FAQ.
Когда нужно обновление:
- После загрузки или обновления файлов
- После изменения контента на сайте
- После пакетного добавления множества FAQ
- После удаления устаревшего контента
Обновление не удаляет данные
Обновление не удаляет исходный контент. Оно заново обрабатывает всё, чтобы векторный индекс соответствовал вашим актуальным данным.
Изоляция данных для каждого бота
В настройке нескольких ботов каждый бот имеет свою отдельную векторную коллекцию. Это означает:
- База знаний Бота А полностью невидима для Бота Б.
- Загрузка файла для одного бота никак не влияет на остальных.
- Удаление бота удаляет всю его векторную коллекцию и все загруженные файлы.
- Каждый бот может иметь совершенно разный контент, оптимизированный под его аудиторию.
Часто задаваемые вопросы (Общие)
В: Файл показывает статус «Ошибка».
- Файл может быть поврежден, защищен паролем или иметь неподдерживаемый формат. Попробуйте конвертировать его в PDF или DOCX и загрузить снова.
В: URL-адреса заблокированы или показывают пустой контент.
- Некоторые сайты блокируют автоматические краулеры. Попробуйте другой URL, укажите sitemap или загрузите содержимое страницы в виде файла.
В: Бот неверно отвечает на тему.
- Добавьте FAQ с точным правильным ответом — FAQ имеют приоритет. Также проверьте системный промпт в разделе Настройки → Модель поведения на наличие противоречивых инструкций.
В: Сколько времени занимает индексация?
- Файлы: обычно 10–60 секунд в зависимости от размера. Большие PDF или карты сайта с множеством страниц могут занять несколько минут. Следите за прогрессом в разделе Задачи синхронизации.
В: Можно ли индексировать закрытый контент (база знаний за логином)?
- Напрямую нет. Страницы, требующие авторизации, не загрузятся. Экспортируйте контент в файл и загрузите его вручную.



