Was, wenn unsere Dokumente sich häufig ändern?

Die Wissensbasis ist inkrementell aktualisierbar: Sie laden ein neues PDF hoch oder ändern eine Seite — das System indiziert nur die geänderten Abschnitte neu, kein kompletter Re-Bau nötig. Bei sehr dynamischen Inhalten (z. B. Termine, Preise) lassen sich Wissensquellen direkt an eine Datenbank oder API anbinden, damit Aktualisierungen in Echtzeit greifen.

Wo liegen die Wissens-Daten physisch?

In Ihrer eigenen WordPress-Datenbank bzw. der lokalen Vektordatenbank auf Ihrem Server. Nichts wird zu einem externen Indexierungs-Anbieter geschickt. Wenn Sie ein API-LLM (Aleph Alpha, Mistral La Plateforme) nutzen, werden im laufenden Betrieb nur die jeweils relevanten Kontext-Abschnitte mit der Frage zusammen übertragen — keine pauschale Komplett-Übermittlung Ihrer Wissensbasis.

Wie groß darf die Wissensbasis sein?

Für KMU/Verbände/Verwaltungen typische Größen (hunderte bis wenige tausend Dokumente, 10–500 MB Text) sind unproblematisch. Vektordatenbanken skalieren bis in den Millionen-Chunk-Bereich. Bei sehr großen Wissensbasen prüfen wir vorab im Erstgespräch, ob eine Segmentierung in mehrere Bereiche sinnvoll ist.

Können wir Quellen-Sichtbarkeit pro Nutzer-Gruppe einschränken?

Ja. Die Wissensbasis ist segmentierbar (z. B. „öffentlich", „Mitglieder", „interne Mitarbeiter"). Bei mehrmandantenfähigem Einsatz (Dachverband mit Landesverbänden) sieht ein Landesverbands-Nutzer nur seine eigenen Wissens-Segmente plus die übergeordneten Dachverbands-Inhalte. Die Berechtigungssteuerung läuft über die WordPress-Rollen.

Чат-боты DigElite · База знаний · RAG

Чат-бот со своим собственным База знаний (РАГ).

База знаний чат-бота DigElite формируется на основе собственных документов клиента — руководств в формате PDF, файлов Word, контента веб-сайта, часто задаваемых вопросов, уставов и описаний услуг OZG — и запрашивается с помощью слоя расширенной генерации поиска (Retrieval Augmented Generation, RAG). Каждый ответ может включать источник (документ + раздел). Если система не может найти подходящий источник, чат-бот честно заявляет: „У меня нет информации по этому вопросу", вместо того чтобы строить предположения — этот порог настраивается для каждого приложения.

Смотрите прямую трансляцию с чат-ботом. Перейти к обзору чат-бота

Чего RAG может достичь с технической точки зрения

Ответы получены из ваших документов, а не из знаний модели.

Генерация с расширением поиска — это архитектурное решение проблемы «галлюцинаций», характерной для классических чат-ботов. Вместо того чтобы языковая модель отвечала сама за себя, мы сначала ищем релевантные разделы в документах клиентов, передаем их модели, а затем позволяем ей сформулировать ответ на их основе.

1 — Индексирование

Документы разбиваются на разделы (фрагменты), семантически кодируются в виде векторных представлений и сохраняются в локальной векторной базе данных (например, PostgreSQL с pgvector, Qdrant, Chroma). Все данные размещаются на сервере заказчика.

2 — Извлечение

Для каждого запроса вопрос преобразуется в векторное представление и сравнивается с базой данных векторов. Наиболее похожие разделы (обычно 3–5) объединяются в качестве контекста для ответа.

3 — Генерация ответа

Студенты, обучающиеся по программе LLM (Aleph Alpha, Mistral, Llama), получают вопрос и контекстные разделы и пишут ответ, основываясь исключительно на этих разделах. Источники также указываются — возможность отслеживания происхождения информации заложена изначально, а не добавлена позже.

Какие форматы документов подходят?

Исходя из того, что у вас уже есть.

PDF — Руководства, инструкции пользователя, аналитические отчеты, описания услуг OZG, законодательные акты.
Word / RTF — Внутренняя документация, правила внесения взносов, часто задаваемые вопросы в офисе.
Excel / CSV — структурированные таблицы (например, уровни взносов, расписание мероприятий).
Содержание сайта — индексируется или напрямую из контента WordPress (записи, страницы, пользовательские типы записей).
Markdown / Обычный текст — Содержимое вики, экспорт в Confluence, документация GitHub.
Источники API — Дополнительное подключение к существующим API-интерфейсам базы знаний (например, к внутренним данным CRM, базам данных продуктов).

Защита от галлюцинаций

„У меня нет информации по этому поводу" — это скорее описание функции, а не ошибки.

Самый большой риск традиционных чат-ботов с искусственным интеллектом — это свободное выдумывание ответов („галлюцинации"). В случае с DigElite генератор ответов связан договорными обязательствами: он может ответить только в том случае, если уровень поиска найдет совпадающие источники. При уровне сходства ниже настраиваемого порога чат-бот явно отвечает: „У меня нет информации по этому вопросу в нашей базе знаний — не хотите ли поговорить с сотрудником?" — и передает диалог в структурированном виде.

„Чат-бот, который свободно выдумывает что-либо, опасен. Мы создаем чат-боты, которые честно говорят, когда чего-то не знают — это самое важное качество, которым может обладать бизнес-чат-бот"."

— Филипп Херрманн, основатель DigElite

Часто задаваемые вопросы

Какие вопросы следует задать потенциальным клиентам перед внедрением.

Что если наши документы будут часто меняться?

Базу знаний можно обновлять поэтапно: вы загружаете новый PDF-файл или изменяете страницу — система переиндексирует только измененные разделы; полная перестройка не требуется. Для контента с высокой динамичностью (например, дат, цен) источники знаний могут быть напрямую подключены к базе данных или API, так что обновления вступают в силу в режиме реального времени.

Где физически находятся данные, содержащие знания?

В вашей собственной базе данных WordPress или в локальной векторной базе данных на вашем сервере. Ничего не отправляется внешнему поставщику индексирования. Если вы используете API-LLM (Aleph Alpha, Mistral La Plateforme), во время работы передаются только соответствующие контекстные разделы вместе с вопросом — никакой общей передачи всей вашей базы знаний.

Насколько обширной может быть база знаний?

Типичные размеры баз данных для малых и средних предприятий, ассоциаций и государственных учреждений (от сотен до нескольких тысяч документов, 10–500 МБ текста) не представляют проблемы. Векторные базы данных масштабируются до миллионов фрагментов. Для очень больших баз знаний мы обсудим на предварительной консультации целесообразность сегментации на несколько областей.

Можно ли ограничить видимость источника информации для каждой группы пользователей?

Да. База знаний сегментируема (например, „общедоступная", „члены", „внутренний персонал"). В многопользовательских развертываниях (зонтичная организация с региональными подразделениями) пользователь региональной организации видит только свои собственные сегменты знаний, а также общий контент зонтичной организации. Права доступа контролируются с помощью ролей WordPress.

Связанные темы

Где вы можете продолжить чтение.

Эта функция является частью семейства чат-ботов DigElite — ознакомьтесь с ней. Обзор продукта или тематически связанных кластеров.

Немецкие и европейские магистерские программы.

RAG раскрывает свой полный эффект только при использовании подходящей модели.

Узнать больше →

Чат службы поддержки на сайте

Наиболее распространенный канал для базы знаний RAG.

Узнать больше →

Чат-боты DigElite — Обзор

Столб со всеми темами кластера.

Узнать больше →

15 минут достаточно, чтобы составить впечатление.

Мы будем общаться в режиме реального времени с нашим собственным чат-ботом на nordzypern.live и покажем вам, как он реагирует на реальные документы, когда честно отвечает „Я не знаю", и как передает звонок оператору. Никакой рекламы, никаких слайдов №47.

Посмотрите прямую трансляцию с чат-ботом и получите первичную консультацию.