Home الأخبار الولايات المتحدة: أداة مختبر لوس ألاموس الجديدة تكتشف الهلوسة في نماذج الرؤية...

الولايات المتحدة: أداة مختبر لوس ألاموس الجديدة تكتشف الهلوسة في نماذج الرؤية الآلية | itg-ar.com

2
0
الولايات المتحدة: أداة مختبر لوس ألاموس الجديدة تكتشف الهلوسة في نماذج الرؤية الآلية
| itg-ar.com
Aerial view of the Los Alamos National Lab. Stock image.Wikimedia Commons

الولايات المتحدة: أداة مختبر لوس ألاموس الجديدة تكتشف الهلوسة في نماذج الرؤية الآلية

قام الباحثون في مختبر لوس ألاموس الوطني بتطوير أداة جديدة تسمى Prelim Attention Score، أو PAS، للمساعدة في اكتشاف متى تكون مخرجات نموذج لغة الرؤية مرتكزة على الصورة ومتى قد تعتمد بشكل كبير على النص الذي تم إنشاؤه. وينظر إلى النظام كوسيلة لتعزيز سلامة نموذج لغة الرؤية والجدارة بالثقة. وقال مانيش بهاتاراي، عالم الكمبيوتر في لوس ألاموس: “إن نظام PAS هو مقياس للتوصيل والتشغيل في الوقت الفعلي، ويعمل كمراقب داخلي للذكاء الاصطناعي”. وأضاف: “يعمل النظام مع نماذج لغة الرؤية الرئيسية الحالية ويتطلب الحد الأدنى من النفقات الحسابية الإضافية، مما يجعله وسيلة فعالة للكشف عن الهلوسة المحتملة. ويحقق نظام PAS دقة متطورة في اكتشاف الهلوسة، مما يوفر للمطورين مسارًا عمليًا نحو أنظمة ذكاء اصطناعي متعددة الوسائط أكثر أمانًا وجديرة بالثقة”. تتبع المكان الذي يحصل فيه النموذج على إجابته. نماذج لغة الرؤية الأكثر استخدامًا هي نماذج انحدار ذاتي. إنهم يولدون كل رمز أو كلمة جديدة، جزئيًا من خلال الاعتماد على الكلمات التي قاموا بإنتاجها بالفعل. في حين أن هذه العملية تساعد النموذج على تكوين استجابات متماسكة، إلا أنها يمكن أن تتسبب أيضًا في اعتماد النظام بقوة على مخرجاته السابقة بدلاً من الصورة نفسها. يراقب نظام PAS تنبؤات نموذج لغة الرؤية لكل رمز مميز. ومن خلال القيام بذلك، فإنه يساعد في تحديد المكان الذي يستمد منه النموذج المعلومات والمكان الذي من المحتمل أن تحدث فيه الهلوسة. تقدم الأداة بعد ذلك نتيجة تنبه المستخدمين إلى احتمال وجود الهلوسة في الإخراج. كاشف الهلوسة المنخفضة تعتمد العديد من نماذج لغة الرؤية والرؤية ذاتية الانحدار على بنيات المحولات، وهي فئة من الشبكات العصبية للتعلم العميق التي تستخدم أنماط الانتباه لوزن المعلومات أثناء توليد المخرجات. قام فريق Los Alamos بدراسة كيفية اهتمام هذه النماذج بالصورة والموجه النصي والكلمات الأولية التي تم إنشاؤها بواسطة النموذج. عندما يتم دمج PAS في سير عمل نموذج لغة الرؤية، يمكن تشغيله جنبًا إلى جنب مع النموذج أثناء معالجته للطلب. بالنسبة إلى العناصر المذكورة في الاستجابة لإدخال الصورة والنص، يحسب نظام PAS درجة قائمة على الاهتمام توضح مدى قوة اعتماد النموذج على الكلمات التي تم إنشاؤها مسبقًا. كلما اقتربت درجة PAS من الصفر، قل احتمال أن يكون النموذج قد أنتج هلوسة. قال شوان نهات هوانغ، المتدرب في لوس ألاموس: “من خلال فهم الطريقة التي يهتم بها نموذج لغة الرؤية بالمعلومات الأولية، يمكن أن يساعد نظام PAS في تحديد الحالة الدقيقة التي يبدأ فيها النموذج في الاعتماد المفرط على كلماته الخاصة”. وأضاف: “تقرأ أداتنا الإشارات التي يصدرها الذكاء الاصطناعي بالفعل، مما يمثل طريقة منخفضة التكلفة للمساعدة في ضمان موثوقية المعلومات ومفيدتها”. يمكن استخدام اختبارات الموثوقية لسير العمل المرئي PAS في التطبيقات التي يتم فيها تحليل الصور والمستندات والرسوم البيانية والنصوص بواسطة نماذج لغة الرؤية. يقول الباحثون إنه يمكن أن يدعم في النهاية عمليات التحقق من الموثوقية في مجالات مثل التصوير الطبي، وتحليل المستندات العلمية، والرسوم البيانية الهندسية، والاستشعار عن بعد، وغيرها من مسارات العمل المرئية حيث يمكن أن تؤثر الادعاءات غير المدعومة على القرارات النهائية. يقدم فريق لوس ألاموس نظام PAS في مؤتمر رؤية الكمبيوتر والتعرف على الأنماط 2026، برعاية IEEE ومؤسسة رؤية الكمبيوتر، في دنفر هذا الشهر. تم دعم العمل من خلال برنامج البحث والتطوير الموجه للمختبر في لوس ألاموس.


تم النشر: 2026-06-15 10:48:00

مصدر: interestingengineering.com