Récupération / RAG

Des réponses ancrées dans votre propre savoir

Importez vos documents, indiquez-nous un site web ou synchronisez depuis le stockage cloud. Nous analysons, segmentons, enrichissons et vectorisons tout — puis nous récupérons les bons passages au moment de la requête pour que votre agent réponde à partir de ce que vous avez réellement écrit, et non de suppositions.

Ce que fait la pile de récupération

  • Ingérer tout type de contenu

    PDF, documents Office, Markdown, HTML et sites web entiers — ainsi que la synchronisation avec Google Drive, Dropbox, OneDrive et Box. Nous orientons chaque fichier vers le bon analyseur et gardons tout en phase avec la source.

  • Segmentation contextuelle

    Les documents sont découpés en segments chevauchants respectant la hiérarchie, et chaque segment est enrichi d'un court résumé de contexte avant la vectorisation — pour qu'un fragment garde tout son sens lorsqu'il est récupéré hors séquence.

  • Recherche hybride

    Chaque requête lance en parallèle une recherche vectorielle dense et une recherche par mots-clés (BM25), puis fusionne les résultats — captant à la fois les correspondances sémantiques et les termes exacts comme les codes produit ou les messages d'erreur que les vecteurs seuls manquent.

  • Reranking

    Un cross-encoder reclasse les candidats fusionnés par rapport à la question réelle, faisant remonter les passages véritablement pertinents avant qu'ils n'atteignent le modèle — moins d'approximations, des réponses plus nettes.

  • Contexte parent

    Quand un petit segment correspond, nous récupérons la section parente qui l'entoure pour que le modèle voie l'idée complète, et non une phrase tronquée — un ancrage qui donne l'impression d'avoir compris toute la page.

  • Récupération isolée par locataire

    Chaque recherche est limitée à votre organisation. Votre base de connaissances n'est jamais mélangée à celle d'un autre locataire, jamais utilisée pour entraîner des modèles, et effacée sur demande.

De l'import à la réponse ancrée

L'indexation se fait une fois à l'import ; la récupération se fait à chaque question. Les forfaits supérieurs débloquent des modes de requête plus poussés qui ajoutent des étapes comme la décomposition et un reranking plus large — au prix d'un peu de rapidité pour des réponses plus complètes.

  1. Analyser et segmenter

    Chaque source est analysée selon son format et découpée en segments respectant la hiérarchie, avec chevauchement, en préservant les titres et la structure.

  2. Enrichir et vectoriser

    Chaque segment reçoit un court résumé de contexte, puis est vectorisé et inséré dans la base vectorielle — mis en cache pour que la réindexation reste peu coûteuse.

  3. Analyser la requête

    Les questions entrantes sont reformulées et, sur les forfaits plus poussés, décomposées en sous-requêtes pour que les questions à plusieurs volets récupèrent la bonne preuve pour chacun.

  4. Recherche hybride et reranking

    Les résultats vectoriels et par mots-clés sont fusionnés, puis reclassés par un cross-encoder selon la question pour faire ressortir les passages les plus solides.

  5. Assembler et répondre

    Les meilleurs passages reçoivent leur contexte parent et sont transmis au modèle, qui répond strictement à partir de la preuve récupérée — avec des résultats en cache pour les questions répétées.

Explorer les autres fonctionnalités