لماذا تعتبر النماذج اللغوية الكبيرة سيئة للغاية في ألعاب الفيديو؟
لقد تحسنت نماذج اللغات الكبيرة (LLMs) بسرعة كبيرة بحيث تطورت المعايير نفسها، مما أضاف مشاكل أكثر تعقيدًا في محاولة لتحدي أحدث النماذج. ومع ذلك، لم يتحسن طلاب ماجستير القانون في جميع المجالات، ولا تزال هناك مهمة واحدة بعيدة عن متناولهم: ليس لديهم أي فكرة عن كيفية لعب ألعاب الفيديو. في حين تمكن عدد قليل من اللاعبين من التغلب على عدد قليل من الألعاب (على سبيل المثال، فاز Gemini 2.5 Pro على Pokemon Blue في مايو 2025)، إلا أن هذه الاستثناءات تثبت القاعدة. أكمل الذكاء الاصطناعي المنتصر الألعاب بشكل أبطأ بكثير من اللاعب البشري العادي، وارتكب أخطاء غريبة ومتكررة في كثير من الأحيان، واحتاج إلى برامج مخصصة لتوجيه تفاعلاته مع اللعبة. واستكشف جوليان توجيليوس، مدير مختبر ابتكار الألعاب بجامعة نيويورك والمؤسس المشارك لشركة اختبار ألعاب الذكاء الاصطناعي Modl.ai، الآثار المترتبة على قيود LLM في ألعاب الفيديو في ورقة بحثية حديثة. لقد تحدث مع IEEE Spectrum حول ما يمكن أن يخبرنا به هذا النقص في مهارات ألعاب الفيديو عن الحالة الأوسع للذكاء الاصطناعي في عام 2026. لقد تحسنت LLMs بسرعة في البرمجة، وترميز إطارات الورق الخاصة بك كنوع من الألعاب الجيدة التصرف. ماذا تقصد بذلك؟ جوليان توجيليوس: البرمجة سلوك جيد للغاية، بمعنى أن لديك مهام. هذه مثل المستويات. تحصل على المواصفات، وتكتب الكود، ثم تقوم بتشغيله. المكافأة فورية وحبيبية. يجب تجميع التعليمات البرمجية، ويجب تشغيلها دون أن تتعطل، وبعد ذلك يتعين عليها عادةً اجتياز الاختبارات. وفي كثير من الأحيان، يكون هناك أيضًا تفسير لكيفية فشلها وسبب فشلها. هناك نظرية من مصمم الألعاب راف كوستر مفادها أن الألعاب ممتعة لأننا نتعلم اللعب بها أثناء لعبنا لها. ومن هذا المنظور، تعد كتابة التعليمات البرمجية لعبة مصممة بشكل جيد للغاية. وفي الواقع، فإن كتابة التعليمات البرمجية هو شيء يستمتع به كثير من الناس. وعلى عكس البرمجة، يواجه طلاب ماجستير إدارة الأعمال صعوبة في التعامل مع ألعاب الفيديو. وهذا يبدو مفاجئًا نظرًا لنجاحهم في البرمجة، وكذلك في ألعاب مثل الشطرنج وGo. ما الذي يسبب مشاكل في ألعاب الفيديو؟ توجيليوس: ليس فقط حاملي شهادة الماجستير في القانون سيئون في هذا الأمر. ليس لدينا ذكاء اصطناعي عام للعبة. هناك تصور واسع النطاق بأنه نظرًا لأنه يمكننا بناء ذكاء اصطناعي يلعب ألعابًا معينة بشكل جيد، فيجب أن نكون قادرين على بناء ذكاء اصطناعي يلعب أي لعبة. لست متأكدًا من أننا سنصل إلى هناك. سيذكر الناس أن AlphaZero من Google (وهو ليس حاصلًا على شهادة LLM) يمكنه لعب كل من لعبة Go والشطرنج. ومع ذلك، كان لا بد من إعادة تدريبها وإعادة هندستها لكل منها. وهذه هي الألعاب المتشابهة من حيث مساحة الإدخال والإخراج. تختلف معظم الألعاب عن بعضها البعض. لديهم آليات مختلفة وتمثيلات مدخلات مختلفة. هناك أيضًا مشكلة في البيانات. بعض الألعاب التي يمكن للذكاء الاصطناعي لعبها بنجاح، مثل Minecraft وPokémon، هي من بين أكثر الألعاب المدروسة جيدًا في العالم مع ملايين الساعات من الأدلة. بالنسبة للعبة أقل شهرة، هناك أقل بكثير. معايير ألعاب الفيديو لأداء LLM أحد العوامل التي يبدو أنها تساعد طلاب LLM على تحسين البرمجة هو انتشار المعايير. لدينا العديد من المعايير التي يمكن أن يحاول طلاب LLM حلها، ويمكننا تسجيل النتائج، ثم تعديل LLM لتحسين الأداء. ومع ذلك، فإن تطوير معيار للعب لعبة فيديو ليس واضحًا تمامًا. لماذا هذا؟ توجيليوس: لقد قمت ببناء العديد من معايير الذكاء الاصطناعي القائمة على الألعاب على مر السنين. الأولى، مسابقة الذكاء الاصطناعي لألعاب الفيديو العامة، استمرت لمدة سبع سنوات. لقد اختبرنا وكيلًا على ألعابنا المتاحة للعامة، وفي كل مرة أجرينا فيها المنافسة، اخترعنا 10 ألعاب جديدة لاختبارها. أحد أسباب توقفنا هو أننا توقفنا عن رؤية التقدم. أصبح الوكلاء أفضل في بعض الألعاب ولكنهم أصبحوا أسوأ في ألعاب أخرى. كان هذا قبل دورات LLM. ومؤخرًا، قمنا بتحديث إطار العمل هذا لبرامج LLM. لقد فشلوا. إنهم سيئون تمامًا. كل منهم. إنهم لا يقومون حتى بعمل خوارزمية بحث بسيطة. لماذا؟ لم يتم تدريبهم مطلقًا على هذه الألعاب، كما أنهم سيئون جدًا في التفكير المكاني. وهذا لا ينبغي أن يكون مفاجئًا، لأن هذا أيضًا غير موجود في بيانات التدريب. وهذا يقودنا إلى ما يبدو وكأنه تناقض. LLMs سيئة في ممارسة الألعاب. ولكن في الوقت نفسه، فإنهم يتحسنون بسرعة في البرمجة، وهي مجموعة مهارات يمكن استخدامها لإنشاء لعبة. كيف تتوافق هذه الحقائق معًا؟ توجيليوس: إنه أمر غريب للغاية. يمكنك الدخول إلى Cursor أو Claude وكتابة مطالبة واحدة والحصول على لعبة قابلة للعب. ستكون اللعبة نموذجية للغاية، نظرًا لأن قدرات كتابة التعليمات البرمجية الخاصة بـ LLM تكون أفضل كلما كان الأمر أكثر نموذجية. لذا، إذا طلبت منها أن تعطيك شيئًا مثل الكويكبات، فسوف تنجح. هذا أمر مثير للإعجاب. ومع ذلك، فإنه لن يمنحك لعبة جيدة أو جديدة. يبدو ذلك غريبًا. والسبب هو أن LLM لا يمكنه تشغيلها. تطوير اللعبة هو عملية تكرارية. أنت تكتب، وتختبر، وتضبط إحساس اللعبة. LLM لا تستطيع أن تفعل ذلك. وإلى حد ما، لا أعتقد أن الأمر مختلف عند تصميم برامج أخرى. نعم، يمكنك أن تطلب من LLM إنشاء واجهة مستخدم رسومية تحتوي على مجموعة من الأزرار. لكن LLM لا يعرف الكثير عن كيفية استخدامه. تحدثت شركات مثل Nvidia وGoogle عن استخدام عمليات المحاكاة، بما في ذلك البيئات الشبيهة بالألعاب، لتحسين أداء الذكاء الاصطناعي. إذا كان الذكاء الاصطناعي لا يستطيع إتقان الألعاب بشكل عام، فما مدى تفاؤلنا بشأن هذا النهج؟ توجيليوس: الألعاب أسهل وأصعب من العالم الحقيقي. إنها أسهل لأن هناك مستويات أقل من التجريد. إنها أصعب لأن الألعاب أكثر تنوعًا. العالم الحقيقي لديه نفس الفيزياء في كل مكان. أحد الأمثلة على ذلك هو Waymo، الذي يستخدم النماذج العالمية في حلقة التدريب الخاصة به. وهذا أمر منطقي لأن القيادة هي نفسها في كل مكان. إنها أقل تنوعًا من الألعاب. هذا مربك للناس. يرى الناس ماجستير في القانون وهو يكتب مقالًا أكاديميًا عن فيزياء الكم ويتساءلون: “كيف لا يمكنه لعب كل من Halo وSpace Invaders؟” ومع ذلك، فإن تلك الألعاب أكثر اختلافًا عن بعضها البعض، إلى حد ما، من مقالتين أكاديميتين. من مقالات موقعكمقالات ذات صلة حول الويب (العلامات للترجمة)الصين، أخبار
تم النشر: 2026-06-01 10:14:00
مصدر: spectrum.ieee.org








