রিট্রিভাল / RAG
উত্তর ভিত্তি করা আপনার নিজস্ব জ্ঞানে
আপনার ডকুমেন্ট আপলোড করুন, আমাদের একটি ওয়েবসাইটের দিকে নির্দেশ করুন, অথবা ক্লাউড স্টোরেজ থেকে সিঙ্ক করুন। আমরা সবকিছু পার্স, চাঙ্ক, সমৃদ্ধ ও এমবেড করি — তারপর কোয়েরির সময় সঠিক অংশগুলো তুলে আনি যাতে আপনার এজেন্ট আপনি যা সত্যিই লিখেছেন তা থেকে উত্তর দেয়, আন্দাজ থেকে নয়।
রিট্রিভাল স্ট্যাক যা করে
যেকোনো কিছু গ্রহণ করুন
PDF, Office ডকুমেন্ট, Markdown, HTML এবং সম্পূর্ণ ওয়েবসাইট — পাশাপাশি Google Drive, Dropbox, OneDrive ও Box সিঙ্ক। আমরা প্রতিটি ফাইল সঠিক পার্সারে পাঠাই এবং সবকিছু উৎসের সঙ্গে তাল মিলিয়ে রাখি।
কনটেক্সচুয়াল চাঙ্কিং
ডকুমেন্টগুলো ওভারল্যাপিং, শ্রেণিবিন্যাস-সচেতন চাঙ্কে বিভক্ত হয় এবং প্রতিটি চাঙ্ক এমবেডিংয়ের আগে একটি সংক্ষিপ্ত প্রসঙ্গ সারাংশে সমৃদ্ধ হয় — তাই একটি খণ্ড অগোছালোভাবে তুলে আনা হলেও নিজে নিজে অর্থবহ থাকে।
হাইব্রিড সার্চ
প্রতিটি কোয়েরি একইসাথে ডেন্স ভেক্টর সার্চ ও কীওয়ার্ড (BM25) সার্চ চালায়, তারপর ফলাফল একত্র করে — সিমান্টিক মিল এবং পণ্য কোড বা এরর স্ট্রিংয়ের মতো হুবহু টার্ম দুটোই ধরে, যা শুধু এমবেডিং মিস করে।
রির্যাঙ্কিং
একটি ক্রস-এনকোডার একত্রিত প্রার্থীদের প্রকৃত প্রশ্নের বিপরীতে রির্যাঙ্ক করে, সত্যিকারের প্রাসঙ্গিক অংশগুলোকে মডেলে পৌঁছানোর আগেই উপরে তুলে আনে — কম কাছাকাছি-মিস, তীক্ষ্ণ উত্তর।
প্যারেন্ট কনটেক্সট
একটি ছোট চাঙ্ক মিললে আমরা তার চারপাশের প্যারেন্ট সেকশন টেনে আনি যাতে মডেল কাটা বাক্য নয়, সম্পূর্ণ চিন্তাটি দেখে — এমন ভিত্তি যা পুরো পৃষ্ঠাটি বুঝেছে বলে মনে হয়।
টেন্যান্ট-বিচ্ছিন্ন রিট্রিভাল
প্রতিটি সার্চ আপনার প্রতিষ্ঠানে সীমাবদ্ধ। আপনার জ্ঞানভাণ্ডার কখনো অন্য টেন্যান্টের সঙ্গে মেশানো হয় না, কখনো মডেল প্রশিক্ষণে ব্যবহৃত হয় না এবং অনুরোধে মুছে ফেলা হয়।
আপলোড থেকে ভিত্তিযুক্ত উত্তর পর্যন্ত
আপনি আপলোড করার সময় ইনডেক্সিং একবার ঘটে; রিট্রিভাল প্রতিটি প্রশ্নে ঘটে। উঁচু প্ল্যানগুলো আরও গভীর কোয়েরি মোড আনলক করে যা ডিকম্পোজিশন ও ব্যাপকতর রির্যাঙ্কিংয়ের মতো ধাপ যোগ করে — সামান্য গতির বিনিময়ে আরও পুঙ্খানুপুঙ্খ উত্তর।
পার্স ও চাঙ্ক
প্রতিটি উৎস ফরম্যাট অনুযায়ী পার্স করা হয় এবং হেডিং ও কাঠামো রক্ষা করে ওভারল্যাপসহ শ্রেণিবিন্যাস-সচেতন চাঙ্কে বিভক্ত হয়।
সমৃদ্ধ ও এমবেড
প্রতিটি চাঙ্ক একটি সংক্ষিপ্ত প্রসঙ্গ সারাংশ পায়, তারপর এমবেড করে ভেক্টর স্টোরে আপসার্ট করা হয় — ক্যাশ করা হয় যাতে পুনরায় ইনডেক্সিং সাশ্রয়ী থাকে।
কোয়েরি বিশ্লেষণ করুন
আগত প্রশ্নগুলো পুনর্লিখিত হয় এবং গভীর টিয়ারে সাব-কোয়েরিতে ডিকম্পোজ করা হয় যাতে বহু-অংশের প্রশ্ন প্রতিটি অংশের জন্য সঠিক প্রমাণ তুলে আনে।
হাইব্রিড সার্চ ও রির্যাঙ্ক
ভেক্টর ও কীওয়ার্ড ফলাফল একত্র করা হয়, তারপর শক্তিশালী অংশগুলো তুলে আনতে একটি ক্রস-এনকোডার দিয়ে প্রশ্নের বিপরীতে রির্যাঙ্ক করা হয়।
একত্র করুন ও উত্তর দিন
শীর্ষ অংশগুলোর সঙ্গে তাদের প্যারেন্ট কনটেক্সট সংযুক্ত করে মডেলে দেওয়া হয়, যা কঠোরভাবে তুলে আনা প্রমাণ থেকেই উত্তর দেয় — পুনরাবৃত্ত প্রশ্নের জন্য ক্যাশ করা ফলাফলসহ।