Поиск / RAG

Ответы, основанные на ваших собственных знаниях

Загрузите документы, укажите нам сайт или синхронизируйте облачное хранилище. Мы разбираем, разбиваем на фрагменты, обогащаем и встраиваем всё — а затем извлекаем нужные фрагменты в момент запроса, чтобы ваш агент отвечал по тому, что вы действительно написали, а не на основе догадок.

Что делает поисковый стек

  • Принимает что угодно

    PDF, документы Office, Markdown, HTML и целые сайты — плюс синхронизация с Google Drive, Dropbox, OneDrive и Box. Мы направляем каждый файл к нужному парсеру и держим всё в синхронизации с источником.

  • Контекстное разбиение на фрагменты

    Документы делятся на перекрывающиеся фрагменты с учётом иерархии, и каждый фрагмент обогащается коротким сводным контекстом перед встраиванием — чтобы фрагмент сохранял смысл сам по себе, когда извлекается вне порядка.

  • Гибридный поиск

    Каждый запрос параллельно выполняет плотный векторный поиск и поиск по ключевым словам (BM25), затем объединяет результаты — улавливая и смысловые совпадения, и точные термины вроде кодов товаров или строк ошибок, которые чистые векторы пропускают.

  • Переранжирование

    Кросс-энкодер заново ранжирует объединённых кандидатов относительно самого вопроса, поднимая действительно релевантные фрагменты наверх ещё до того, как они попадут в модель — меньше промахов, точнее ответы.

  • Родительский контекст

    Когда совпадает небольшой фрагмент, мы подтягиваем окружающий его родительский раздел, чтобы модель видела мысль целиком, а не обрезанное предложение — основание, которое читается так, будто оно поняло всю страницу.

  • Поиск с изоляцией арендаторов

    Каждый поиск ограничен вашей организацией. Ваша база знаний никогда не смешивается с базой другого арендатора, никогда не используется для обучения моделей и удаляется по запросу.

От загрузки до обоснованного ответа

Индексирование происходит один раз при загрузке; извлечение — на каждый вопрос. Более высокие тарифы открывают глубокие режимы запросов, добавляющие шаги вроде декомпозиции и более широкого переранжирования — немного жертвуя скоростью ради более тщательных ответов.

  1. Разобрать и разбить

    Каждый источник разбирается по формату и делится на фрагменты с учётом иерархии и перекрытием, сохраняя заголовки и структуру.

  2. Обогатить и встроить

    Каждый фрагмент получает короткий сводный контекст, затем встраивается и загружается в векторное хранилище — с кэшированием, чтобы переиндексация оставалась дешёвой.

  3. Проанализировать запрос

    Входящие вопросы переписываются и на более глубоких тарифах разбиваются на подзапросы, чтобы составные вопросы извлекали нужные данные для каждой части.

  4. Гибридный поиск и переранжирование

    Векторные и ключевые результаты объединяются, затем переранжируются кросс-энкодером относительно вопроса, чтобы выдвинуть самые сильные фрагменты.

  5. Собрать и ответить

    К лучшим фрагментам присоединяется их родительский контекст, и они передаются модели, которая отвечает строго на основе извлечённых данных — с кэшированием результатов для повторяющихся вопросов.

Открыть другие возможности