Home الأخبار فيديو: روبوت يتقن لعبة الهوكي الهوائي، ويتعلم التغلب على البشر دون لمس...

فيديو: روبوت يتقن لعبة الهوكي الهوائي، ويتعلم التغلب على البشر دون لمس الطاولة الحقيقية | itg-ar.com

1
0
فيديو: روبوت يتقن لعبة الهوكي الهوائي، ويتعلم التغلب على البشر دون لمس الطاولة الحقيقية
| itg-ar.com
Screenshot of the AI air hockey system in action.HudsonNock/YouTube

فيديو: روبوت يتقن لعبة الهوكي الهوائي، ويتعلم التغلب على البشر دون لمس الطاولة الحقيقية

قام ثلاثة طلاب من جامعة كولومبيا البريطانية بوضع خبراتهم على المحك من خلال بناء طاولة هوكي هوائي يتم التحكم فيها من قبل لاعب واحد بواسطة الذكاء الاصطناعي (AI). هذا أمر مثير للاهتمام بما فيه الكفاية، ولكن ما يلفت الانتباه حقًا هو أن الذكاء الاصطناعي تمكن من تعلم اللعب في المحاكاة البحتة. عادة، يتم تدريب الروبوتات التي يتم التحكم فيها بواسطة الذكاء الاصطناعي من خلال التجربة والخطأ في “العالم الحقيقي” من خلال الفشل والتعلم من آلاف التدريبات. وعلى الرغم من فعاليته، إلا أنه يستغرق وقتًا طويلاً ويمكن أن يؤدي إلى تلف الأجهزة. ومع ذلك، قرر فريق جامعة كولومبيا البريطانية معرفة ما إذا كان بإمكانهم تدريب الذكاء الاصطناعي في الفضاء الرقمي، وارتكاب الأخطاء هناك أولاً، ثم إطلاق العنان لهم على طاولة هوكي الهواء الحقيقية. ولتحقيق هذه الغاية، قاموا ببناء توأم رقمي عالي الدقة للطاولة لتدريب الذكاء الاصطناعي. وبمجرد اكتمال التدريب، قاموا بعد ذلك بنسخ الذكاء الاصطناعي المُدرب في الروبوت الحقيقي لمعرفة كيفية أدائه ضد خصم بشري. وكانت النتائج مفاجئة. على الرغم من أي تجربة في العالم الحقيقي، كان لاعب الهوكي الهوائي الآلي الذي يتم التحكم فيه بواسطة الذكاء الاصطناعي قادرًا على طرح تحدي حقيقي. كل هذا “خارج الصندوق” مباشرة، كما كان. مخفف رقميًا للعالم الحقيقي، الأمر المثير للاهتمام هنا أيضًا هو أن الذكاء الاصطناعي عادةً ما يكافح لتعلم مهام مثل لعبة الهوكي الهوائي. وذلك لأن القرص، على وجه الخصوص، يتحرك بسرعة كبيرة، ويمكن أن يتحرك بشكل غير متوقع، ويتأثر بشدة بالتغيرات الطفيفة الناتجة عن التفاعلات مع المجاذيف والجدران. يتعين على أي لاعب روبوت أيضًا أن يأخذ في الاعتبار التأخير الزمني الناتج عن المحركات والكاميرات وتقلبات الجهد الكهربي والاهتزازات الميكانيكية وتتبع القرص غير الكامل. لذلك، حتى الأخطاء الصغيرة يمكن أن تؤدي إلى حسابات خاطئة تؤدي إلى خسارة اللعبة. ولتحقيق هذه الغاية، صمم الفريق بشكل مقصود بيئة تدريب الذكاء الاصطناعي بحيث تكون غير مثالية. يعد هذا تحويلًا عن معظم سيناريوهات التدريب، والتي يمكن أن تكون “مثالية للغاية”، ولكن من الواضح أن العالم الحقيقي ليس كذلك. لذلك، أخذ الفريق في الاعتبار أشياء مثل القضبان غير المستوية، والطاولات الملتوية، والارتدادات غير المتسقة، وانخفاض إمدادات الطاقة، وزمن وصول الكاميرا. يُطلق على ذلك اسم “التوزيع العشوائي للمجال”، وقد مكّن هذا الذكاء الاصطناعي من تعلم توقع ما هو غير متوقع والرد بأفضل ما يمكنه، تمامًا كما يفعل اللاعب البشري. يوضح الفريق أن هذا يعلم الذكاء الاصطناعي التنبؤ بمجموعة من النتائج المحتملة من ارتداد القرص بدلاً من النتيجة الدقيقة بناءً على خوارزمية محددة. لذا، تعلم الذكاء الاصطناعي أن يتوقع وجود القرص في مكان تقريبي في المستقبل ويتفاعل وفقًا لذلك. لتسريع التدريب، تخلى الفريق عن فكرة استخدام محركات فيزيائية عادية مثل Unity وUnreal وتحول بدلاً من ذلك إلى ما يسمى تدريب “الممثل الناقد الناعم”. باختصار، هذا نوع من بيئة التعلم القائمة على سياسة العصا والجزرة. تعتبر لعبة الهوكي الهوائي رياضة عقابية، حيث يتخذ الذكاء الاصطناعي إجراءً ويحصل على مكافآت أو عقوبات بناءً على أدائه. عبر الملايين من ألعاب المحاكاة، يتحسن الذكاء الاصطناعي في لعب اللعبة والتكيف مع كل الفوضى المضمنة في اللعبة. عند تطبيقه على العالم الحقيقي، كان لاعب الذكاء الاصطناعي يقدم أيضًا يد المساعدة باستخدام كاميرا علوية خاصة وقرص مغطى بشريط عاكس للضوء. وهذا يساعد الذكاء الاصطناعي على “رؤية” القرص بشكل أكثر وضوحًا بمعدل 120 إطارًا في الثانية. إلى جانب لعبة الهوكي الهوائي، يتضمن ابتكار الفريق أيضًا بعض التطبيقات المحتملة لتدريب أنظمة مستقلة أخرى مثل الطائرات بدون طيار، والمركبات، والروبوتات، وما إلى ذلك. وإذا كان من الممكن تسريع تدريب هذه المنصات وجعلها أكثر واقعية، فقد تكون عمليات النقل المماثلة من المحاكاة إلى الواقع بمثابة نعمة كبيرة. إذا كنت تريد معرفة المزيد، التفاصيل متاحة على صفحة GitHub الرسمية للمشروع.


تم النشر: 2026-06-07 12:44:00

مصدر: interestingengineering.com