Récupération / RAG
Des réponses ancrées dans votre propre savoir
Importez vos documents, indiquez-nous un site web ou synchronisez depuis le stockage cloud. Nous analysons, segmentons, enrichissons et vectorisons tout — puis nous récupérons les bons passages au moment de la requête pour que votre agent réponde à partir de ce que vous avez réellement écrit, et non de suppositions.
Ce que fait la pile de récupération
Ingérer tout type de contenu
PDF, documents Office, Markdown, HTML et sites web entiers — ainsi que la synchronisation avec Google Drive, Dropbox, OneDrive et Box. Nous orientons chaque fichier vers le bon analyseur et gardons tout en phase avec la source.
Segmentation contextuelle
Les documents sont découpés en segments chevauchants respectant la hiérarchie, et chaque segment est enrichi d'un court résumé de contexte avant la vectorisation — pour qu'un fragment garde tout son sens lorsqu'il est récupéré hors séquence.
Recherche hybride
Chaque requête lance en parallèle une recherche vectorielle dense et une recherche par mots-clés (BM25), puis fusionne les résultats — captant à la fois les correspondances sémantiques et les termes exacts comme les codes produit ou les messages d'erreur que les vecteurs seuls manquent.
Reranking
Un cross-encoder reclasse les candidats fusionnés par rapport à la question réelle, faisant remonter les passages véritablement pertinents avant qu'ils n'atteignent le modèle — moins d'approximations, des réponses plus nettes.
Contexte parent
Quand un petit segment correspond, nous récupérons la section parente qui l'entoure pour que le modèle voie l'idée complète, et non une phrase tronquée — un ancrage qui donne l'impression d'avoir compris toute la page.
Récupération isolée par locataire
Chaque recherche est limitée à votre organisation. Votre base de connaissances n'est jamais mélangée à celle d'un autre locataire, jamais utilisée pour entraîner des modèles, et effacée sur demande.
De l'import à la réponse ancrée
L'indexation se fait une fois à l'import ; la récupération se fait à chaque question. Les forfaits supérieurs débloquent des modes de requête plus poussés qui ajoutent des étapes comme la décomposition et un reranking plus large — au prix d'un peu de rapidité pour des réponses plus complètes.
Analyser et segmenter
Chaque source est analysée selon son format et découpée en segments respectant la hiérarchie, avec chevauchement, en préservant les titres et la structure.
Enrichir et vectoriser
Chaque segment reçoit un court résumé de contexte, puis est vectorisé et inséré dans la base vectorielle — mis en cache pour que la réindexation reste peu coûteuse.
Analyser la requête
Les questions entrantes sont reformulées et, sur les forfaits plus poussés, décomposées en sous-requêtes pour que les questions à plusieurs volets récupèrent la bonne preuve pour chacun.
Recherche hybride et reranking
Les résultats vectoriels et par mots-clés sont fusionnés, puis reclassés par un cross-encoder selon la question pour faire ressortir les passages les plus solides.
Assembler et répondre
Les meilleurs passages reçoivent leur contexte parent et sont transmis au modèle, qui répond strictement à partir de la preuve récupérée — avec des résultats en cache pour les questions répétées.