
يوفر DiffusionGemma من Google إمكانية إنشاء نص أسرع بأربع مرات باستخدام فك التشفير المتوازي
كشفت Google النقاب عن DiffusionGemma، وهو نموذج تجريبي جديد للذكاء الاصطناعي يقوم بإنشاء نص باستخدام الانتشار بدلاً من أسلوب الانحدار الذاتي الذي تستخدمه معظم نماذج اللغات الكبيرة اليوم. وتقول الشركة إن النموذج يمكن أن يوفر إنشاء نص أسرع بما يصل إلى أربع مرات على وحدات معالجة الرسومات المخصصة أثناء تشغيله على الأجهزة الاستهلاكية. يعتمد النموذج على عائلة Gemma 4 من Google وأبحاث Gemini Diffusion. على عكس نماذج اللغة التقليدية التي تولد نصًا مميزًا واحدًا في كل مرة من اليسار إلى اليمين، يقوم DiffusionGemma بإنشاء وتحسين كتل النص بالتوازي. وفقًا لـ Google، يتيح هذا النهج سرعات إخراج تتجاوز 1000 رمزًا مميزًا في الثانية على وحدة معالجة الرسومات NVIDIA H100 وأكثر من 700 رمزًا مميزًا في الثانية على NVIDIA GeForce RTX 5090. وتقول الشركة إن DiffusionGemma يستهدف المطورين الذين يعملون على تطبيقات حساسة للسرعة مثل التحرير التفاعلي، والتكرار السريع للمحتوى، وملء التعليمات البرمجية، وسير العمل الأخرى حيث يكون زمن الوصول المنخفض أكثر أهمية من الحد الأقصى للإنتاج. الجودة. كسر اختناقات النص تولد معظم نماذج اللغات الكبيرة النص بشكل تسلسلي، وتتنبأ برمز مميز تلو الآخر. على الرغم من فعاليتها، إلا أن هذه العملية يمكن أن تترك الأجهزة المحلية غير مستغلة بشكل كافٍ عند خدمة مستخدم واحد. DiffusionGemma يأخذ نهجا مختلفا. بدلاً من إنشاء نص كلمة بكلمة، فإنه يقوم بإنشاء كتلة مكونة من 256 رمزًا مميزًا مرة واحدة ثم يقوم بتحسينها بشكل متكرر من خلال تمريرات متعددة. يقارن Google الفرق بالانتقال من الآلة الكاتبة إلى المطبعة. بدلاً من انتظار إنشاء كل رمز مميز قبل إنتاج الرمز التالي، يقوم النموذج بمعالجة قسم كامل من النص في وقت واحد. وتقول الشركة إن هذا يحول عنق الزجاجة من عرض النطاق الترددي للذاكرة إلى حساب الأداء، مما يسمح لوحدات معالجة الرسوميات الحديثة بالعمل بكفاءة أكبر أثناء الاستدلال المحلي. ميزة رئيسية أخرى هي الاهتمام ثنائي الاتجاه. نظرًا لأن النموذج يقوم بإنشاء نص بالتوازي، يمكن لكل رمز مميز أن يعتني بكل رمز مميز آخر أثناء الإنشاء. وهذا يجعله أكثر ملاءمة للمهام التي يكون فيها السياق المستقبلي مهمًا، مثل إكمال التعليمات البرمجية، والتحرير المباشر، والهياكل الرياضية، والتسلسلات البيولوجية. سلطت Google الضوء على العرض التوضيحي الذي تم فيه ضبط DiffusionGemma لحل ألغاز Sudoku، وهي مهمة يمكن أن تشكل تحديًا لنماذج الانحدار الذاتي التقليدية لأن الرموز المميزة اللاحقة تؤثر على القرارات السابقة. مصمم للذكاء الاصطناعي المحلي. يستخدم النموذج بنية مكونة من 26 مليار معلمة من مزيج من الخبراء ولكنه ينشط 3.8 مليار معلمة فقط أثناء الاستدلال. وفقًا لـ Google، يسمح هذا للنموذج بأن يتلاءم مع ما يقرب من 18 جيجابايت من VRAM عند قياسها، مما يجعله متاحًا على وحدات معالجة الرسومات الاستهلاكية المتطورة. يتضمن DiffusionGemma أيضًا آلية تصحيح ذاتي متكررة. ونظرًا لأنه يقوم بتقييم كتلة نصية بأكملها أثناء التحسين، فيمكنه تحديد الأخطاء وإصلاحها مع تقدم عملية الإنشاء. ومع ذلك، أقرت جوجل بأن النموذج يعطي الأولوية للسرعة على الجودة. وقالت الشركة إن نماذج Gemma 4 القياسية تظل الخيار المفضل لبيئات الإنتاج حيث تكون جودة الإنتاج هي الاهتمام الأساسي. تظهر ميزة السرعة أيضًا بشكل أكثر وضوحًا في عمليات النشر المحلية والبيئات منخفضة التزامن. في الإعدادات السحابية التي تخدم أعدادًا كبيرة من المستخدمين في وقت واحد، يمكن لنماذج الانحدار التلقائي التقليدية في كثير من الأحيان استخدام الأجهزة بكفاءة من خلال التجميع، مما يقلل من فوائد التوليد القائم على الانتشار. أصدرت Google DiffusionGemma بموجب ترخيص Apache 2.0 من خلال Hugging Face وتدعم النشر من خلال أدوات تشمل MLX وvLLM وHugging Face Transformers وNVIDIA NeMo وUnsloth.
تم النشر: 2026-06-11 00:53:00







