Internet

لماذا لن يحل RAG مشكلة الهلوسة في الذكاء الاصطناعي الإنشاءي

الهلوسات - الأكاذيب التي ترويها نماذج الذكاء الاصطناعي الإنشاءي، في الأساس - مشكلة كبيرة بالنسبة للشركات التي تبحث عن دمج هذه التكنولوجيا في عملياتها.

نظرًا لعدم وجود ذكاء حقيقي في النماذج وببساطة توقع الكلمات والصور والخطاب والموسيقى وغيرها من البيانات وفقًا لمخطط خاص، قد تخطئ أحيانًا. وبشكل كبير. في تقرير حديث نشرته صحيفة وول ستريت جورنال، تتذكر مصدر حالة حيث اخترع الذكاء الاصطناعي الإنشاءي لمايكروسوفت الحاضرين في الاجتماعات ووحض أن مكالمات المؤتمر تتعلق بمواضيع لم يتم مناقشتها فعلًا في المكالمة.

كما كتبت منذ فترة، قد تكون الهلوسات مشكلة لا يمكن حلها مع هندسة النماذج القائمة على المحولات الحالية. ولكن يقترح عدد من بائعي الذكاء الاصطناعي الإنشاءي أنه يمكن التخلص منها، إلى حد ما، من خلال نهج تقني يسمى Recollection Augmented Generation أو RAG.

هكذا يقدمها أحد البائعين، Squirro:

في جوهر العرض هي مفهوم LLMs المعززة بالاسترجاع أو التوليد المعزز بالاسترجاع (RAG) المضمن في الحل… [ذكاء الاصطناعي الإنشائي لدينا] فريد في وعده بعدم وجود هلوسات. كل قطعة من المعلومات التي يولدها قابلة لتتبعها إلى مصدر، مما يضمن المصداقية.

هذا هو عرض مماثل من SiftHub:

باستخدام تقنية RAG ونماذج لغوية كبيرة مع تدريب المعرفة الخاص بالصناعة، يتيح SiftHub للشركات توليد ردود شخصية دون هلوسات. يضمن ذلك زيادة الشفافية وتقليل المخاطر ويلهم الثقة المطلقة في استخدام الذكاء الاصطناعي لجميع احتياجاتها.

تم تقديم RAG من قبل عالم البيانات باتريك لويس، باحث في شركة Meta وجامعة لندن، والكاتب الرئيسي لورقة البحث لعام 2020 التي ابتكرت هذا المصطلح. عند تطبيق RAG على نموذج، يُسترجع النموذج وثائق قد تكون ذات صلة بسؤال - على سبيل المثال، صفحة ويكيبيديا عن سوبر بول - باستخدام ما يشبه بحث الكلمات الرئيسية ويلجأ بعد ذلك إلى النموذج لإعطاء إجابات بناءً على هذا السياق الإضافي.

قال ديفيد وادن، عالم البحوث في AI2، القسم المتخصص في الذكاء الاصطناعي في معهد ألن الغير ربحي: “عندما تتفاعل مع نموذج ذكاء اصطناعي إشتائي مثل ChatGPT أو Llama وتسأل سؤالًا، التصور الافتراضي هو أن يجيب النموذج من ‘ذاكرته المنسقة’ - أي من المعرفة المخزنة في معلماته نتيجة للتدريب على بيانات ضخمة من الويب”. وأوضح: “لكن، مثلما من المرجح أن تقدم إجابات أكثر دقة إذا كان لديك مرجعًا [مثل كتاب أو ملف] أمامك، فإن الأمر نفسه صحيح في بعض الحالات للنماذج”.

لا شك أن RAG مفيد بلا جدال - فهو يسمح بتنسيب الأشياء التي يولدها النموذج إلى الوثائق المسترجعة للتحقق من صحتها (وكذلك تجنب الانتهاك المحتمل لحقوق النشر). كما يتيح RAG للشركات التي لا ترغب في استخدام وثائقها لتدريب نموذج - على سبيل المثال، الشركات في الصناعات ذات التنظيم الصارم مثل الرعاية الصحية والقانون - السماح للنماذج بالاعتماد على تلك الوثائق بطريقة أكثر أمانًا ومؤقتة.

ولكن RAG بالتأكيد لا يمكن أن يوقف النموذج عن الهلوسة. ولديها قيود يتناساها العديد من البائعين.

قال وادن إن RAG فعال للغاية في السيناريوهات ‘الغنية بالمعرفة’ حيث يرغب المستخدم في استخدام نموذج لتلبية ‘حاجة المعلومات’ - على سبيل المثال، لمعرفة من فاز بسوبر بول العام الماضي. في هذه السيناريوهات، من المرجح أن تحتوي الوثيقة التي تجيب عن السؤال على العديد من نفس الكلمات الرئيسية الموجودة في السؤال (على سبيل المثال، “سوبر بول”، “العام الماضي“)، مما يجعل من السهل نسبيًا العثور عليها عبر بحث الكلمات الرئيسية.

الأمور تصبح أكثر صعوبة في المهام ‘الغنية بالاستدلال’ مثل البرمجة والرياضيات، حيث يصعب تحديد المفاهيم اللازمة للإجابة عن طلب بناءً على استعلام قائم على الكلمات الرئيسية – فضلا عن تحديد ما إذا كانت الوثائق الممكنة ذات الصلة.

حتى مع الأسئلة الأساسية، يمكن للطرز أن تت ‘تشتيت’ بمحتوى غير مرتبط في الوثائق، وخاصة في الوثائق الطويلة حيث لا تكون الإجابة واضحة. أو أنها - لأسباب لم تُعرف بعد - يمكن أن تتجاهل ببساطة مضمون الوثائق المسترجعة، وتلجأ بدلاً من ذلك للإعتماد على ذاكرتها المنسقة.

كما أن RAG مكلفة من حيث الأجهزة المطلوبة لتطبيقها على نطاق واسع.

وذلك لأن الوثائق المسترجعة، سواء من الويب أو قاعدة بيانات داخلية أو في مكان آخر، يجب أن تحفظ في الذاكرة - على الأقل مؤقتًا - بحيث يمكن للنموذج الإشارة إليها مرة أخرى. ويشمل النفقات الأخرى الحوسبة من أجل السياق المتزايد الذي يجب على النموذج معالجته قبل توليد ردوده. وبالنسبة لتكنولوجيا مشهورة بالفعل بالكمية الهائلة من المعالجة والكهرباء التي تتطلبها حتى لعمليات بسيطة، هذا يُشكل اعتبارًا جديًا.

ليس ذلك ليقول RAG لا يمكن تحسينه. لاحظ وادن العديد من الجهود الجارية لتدريب النماذج على استخدام وثائق RAG بشكل أفضل.

تشمل بعض هذه الجهود نماذج تستطيع ‘قرار’ متى تستفيد من الوثائق، أو نماذج يمكن أن تختار عدم القيام بالاسترجاع في المرة الأولى إذا رأتها غير ضرورية. كما تركز الجهود الأخرى على طرق لفهرسة مجموعات البيانات الواسعة من الوثائق بشكل أكثر كفاءة، وعلى تحسين البحث من خلال تمثيلات أفضل للوثائق - تمثيلات تتجاوز الكلمات الرئيسية.

“نحن جيدون جدًا في استرجاع الوثائق بناءً على الكلمات الرئيسية، ولكن لسنا جيدين جدًا في استرجاع الوثائق بناءً على مفاهيم أكثر تجريدًا، مثل تقنية البرهان اللازمة لحل مشكلة رياضية”، وعلق وادن: “إن البحث مطلوب لبناء تمثيلات الوثائق وتقنيات البحث التي يمكن أن تحدد وثائق ذات صلة لمهام الإنتاج أكثر تجريدًا. أعتقد أن هذا مسألة مفتوحة في هذا الوقت.”

إذاً يمكن ل RAG المساعدة في تقليل هلوسات النموذج - لكنها ليست الإجابة على كل مشاكل الهلوسة في الذكاء الاصطناعي. احترس من أي بائع يحاول التأكيد على خلاف ذلك.

Related Articles

Back to top button Back to top button