Home الأخبار يُظهر العلماء أن التدريب الذي يمكن التنبؤ به يمكن أن يتفوق على...

يُظهر العلماء أن التدريب الذي يمكن التنبؤ به يمكن أن يتفوق على بيانات تعلم الروبوت المعقدة | itg-ar.com

1
0
يُظهر العلماء أن التدريب الذي يمكن التنبؤ به يمكن أن يتفوق على بيانات تعلم الروبوت المعقدة
| itg-ar.com
The research challenges the idea that more diverse training data always leads to better robot learning.NYU Center for Robotics and Embodied Intelligence

يُظهر العلماء أن التدريب الذي يمكن التنبؤ به يمكن أن يتفوق على بيانات تعلم الروبوت المعقدة

لا يزال تعليم الروبوتات كيفية التعامل مع الأشياء بمهارة تشبه البراعة البشرية أحد أكبر التحديات في مجال الروبوتات. تشير دراسة جديدة إلى أن الإجابة قد لا تكمن في تغذية الروبوتات ببيانات تدريب أكثر تعقيدًا، ولكن في منحها أمثلة أكثر اتساقًا للتعلم منها. وجد باحثون من كلية تاندون للهندسة بجامعة نيويورك ومعهد الروبوتات والذكاء الاصطناعي أن الروبوتات التي تم تدريبها على عروض توضيحية منظمة ويمكن التنبؤ بها كان أداؤها أفضل بكثير من تلك التي تم تدريبها على أمثلة شديدة التباين. يمكن أن يساعد هذا العمل في تحسين كيفية تعلم الروبوتات للمهام التي تتضمن حركات اليد المعقدة، وتغيير القبضة، والتنسيق بين الأطراف المتعددة. تعتمد العديد من أنظمة تعلم الروبوتات على التعلم بالتقليد، حيث تتعلم الآلات عن طريق نسخ العروض التوضيحية التي يؤديها البشر. لكن جمع العروض التوضيحية للمهام شديدة البراعة أمر صعب لأن أنظمة التشغيل عن بعد تكافح من أجل التقاط حركات الأصابع الدقيقة والتفاعلات الغنية بالاتصال المعنية. للتغلب على هذا القيد، لجأ الباحثون إلى خوارزميات تخطيط الحركة التي تولد تلقائيًا عروضًا توضيحية داخل عمليات المحاكاة الفيزيائية. وبدلاً من التعلم من البشر، تعلمت الروبوتات من الأمثلة الافتراضية التي أنشأتها البرمجيات. وسرعان ما اكتشف الفريق مشكلة. أنتجت أساليب التخطيط الشائعة المعروفة باسم الاستكشاف السريع للأشجار العشوائية (RRTs) حلولاً تختلف كثيرًا من عرض إلى آخر، مما يجعل من الصعب على الروبوتات تحديد السلوك الذي كان من المفترض أن يقلده. الاتساق يتغلب على العشوائية قال المؤلف الرئيسي هوايجيانغ تشو: “هؤلاء المخططون جيدون جدًا في إيجاد الحلول”. “ولكن عندما يبدو كل حل مختلفًا، فإن نظام التعلم يكافح من أجل معرفة السلوك الذي يجب أن يقلده.” ووفقا للباحثين، فإن العشوائية في العروض التوضيحية التي تم إنشاؤها بواسطة RRT تخلق ما يعرف بالبيانات عالية الإنتروبيا. وفي حين أن هذا التنوع يساعد خوارزميات التخطيط على استكشاف حلول مختلفة، إلا أنه يمكن أن يقلل من فعالية التعلم بالتقليد. ولمعالجة هذه المشكلة، قام الفريق بتطوير أساليب تخطيط بديلة مصممة لتوليد عروض توضيحية أكثر اتساقًا. أعطت إحدى الطرق الأولوية للتقدم المطرد نحو الهدف، بينما اعتمدت طريقة أخرى على مكتبة من الحركات المحددة مسبقًا لتقليل الاختلاف بين الأمثلة. قام الباحثون بتقييم النهج باستخدام مهمتين تلاعبيتين صعبتين. في إحدى التجارب، كان على ذراعين آليين تدوير أسطوانة كبيرة بمقدار 180 درجة مع ضبط قبضتيهما بشكل متكرر. وفي حالة أخرى، تعاملت يد آلية بارعة مع مكعب داخل راحة يدها لتتناسب مع اتجاهات الهدف. دروس افتراضية ونتائج حقيقية حققت الروبوتات التي تم تدريبها على العروض التوضيحية الأكثر اتساقًا معدلات نجاح أعلى بكثير من تلك التي تم تدريبها على البيانات القياسية التي تم إنشاؤها بواسطة RRT. وفي مهمة الذراع المزدوج، وصل النظام إلى أداء شبه مثالي باستخدام 100 عرض توضيحي فقط. قام الفريق أيضًا بنقل السياسات المستفادة مباشرةً من المحاكاة إلى الأجهزة المادية دون إعادة تدريب إضافية. ونجح الروبوت ثنائي الذراع في 90% من التجارب الواقعية، بينما أكملت اليد الآلية نحو 62% من محاولاتها. تسلط النتائج الضوء على اتجاه متزايد في مجال الروبوتات التي تجمع بين تخطيط الحركة التقليدي والتعلم الآلي. وبدلاً من التعامل مع النهجين بشكل منفصل، يستخدم الباحثون بشكل متزايد خوارزميات التخطيط لتوليد بيانات التدريب لأنظمة التعلم. وتعزز الدراسة أيضًا درسًا أوسع نطاقًا في الذكاء الاصطناعي: وهو أن الكميات الكبيرة من البيانات لا تؤدي دائمًا إلى تعلم أفضل. في بعض الحالات، قد تكون الأمثلة المنظمة بعناية أكثر قيمة من المجموعات الكبيرة من العروض التوضيحية الصاخبة أو غير المتسقة.


تم النشر: 2026-06-04 00:52:00

مصدر: interestingengineering.com