Home تقنية كيف تمحورت Zoho Labs حول هندسة الاستدلال | itg-ar.com

كيف تمحورت Zoho Labs حول هندسة الاستدلال | itg-ar.com

3
0
كيف تمحورت Zoho Labs حول هندسة الاستدلال
| itg-ar.com

كيف تمحورت Zoho Labs حول هندسة الاستدلال

لقد غيرت النماذج ذات الوزن المفتوح، ونماذج الذكاء الاصطناعي التي أصبحت معلماتها متاحة للعامة حتى يتمكن أي شخص من تنزيلها وتشغيلها مجانا، غيرت اقتصاديات تطوير الذكاء الاصطناعي بين عشية وضحاها تقريبا. بالنسبة لفرق الذكاء الاصطناعي الداخلية التي أمضت سنوات في بناء نماذجها الخاصة، أثار هذا التحول سؤالًا مباشرًا: ما الذي نحن هنا لنفعله الآن؟ في DevSparks 2026 في بنغالورو، وهي حركة وطنية نظمتها YourStory ركزت على تمكين النظام البيئي للمطورين في الهند بتقنيات الجيل التالي، تتبع رامبراكاش رامامورثي، مدير أبحاث الذكاء الاصطناعي في Zoho Corp، كيف تعاملت Zoho Labs مع هذا السؤال، ولماذا أصبحت هندسة الاستدلال هي الإجابة. تم إنشاء Zoho Labs المحورية لحل المشكلات الهندسية التي ظلت تتكرر عبر مجموعة Zoho التي تضم أكثر من 100 منتج. كانت المشكلة بسيطة: بدون وحدة مركزية، استمرت الفرق المختلفة في الوصول إلى نفس الطرق المسدودة بشكل مستقل، غير مدركين أن شخصًا آخر كان هناك بالفعل. كانت مهمة المختبر هي اكتشاف هذه المشكلات في وقت مبكر، وحلها مرة واحدة، ومشاركة الإصلاح عبر الفرق. بدأ عمل الذكاء الاصطناعي في المختبر في عام 2011 وتوسع بشكل مطرد ليشمل التعلم الآلي، ورؤية الكمبيوتر، ومعالجة المستندات، وأدوات اللغة. وبحلول عام 2023، تجاوزت النماذج ذات الوزن المفتوح الكثير مما أمضى الفريق سنوات في بنائه. قال رامامورثي: “لقد قمنا ببناء 15 زوجًا لغويًا من عام 2018 إلى عام 2023. لمدة خمس سنوات. وكانت النماذج التي تم طرحها في عام 2023 تدعم 90 زوجًا لغويًا وكانت مجانية ومفتوحة المصدر”. استجاب الفريق من خلال تشغيل ثلاثة اتجاهات في وقت واحد: Zoho AI Bridge، الذي يتيح للعملاء الاتصال بموفري الطرف الثالث أو استخدام نماذج مفتوحة الوزن مستضافة على خوادم Zoho الخاصة؛ نموذج داخلي أصغر حجمًا للمهام اليومية مثل البريد الإلكتروني وملخصات المستندات؛ وهندسة الاستدلال، التي أصبحت محور التركيز الأساسي للمختبر. استخلاص المزيد مما هو موجود بالفعل. قبل الاستقرار على الاستدلال، استكشف الفريق بدائل لهندسة المحولات، بما في ذلك RWKV، وMamba، وZamba، وكل منها يَعِد بأداء أفضل وبتكلفة أقل. لكن النظام البيئي للمحولات استمر في التحسن بشكل أسرع من أن يتمكن أي بديل من اللحاق به. تحول المختبر إلى ما أسماه مشروع 101%: استخراج أقصى قدر من الكفاءة من المحولات الموجودة بالفعل في الإنتاج. تعاملت أنظمة الذكاء الاصطناعي من Zoho مع حوالي ستة مليارات مكالمة لواجهة برمجة التطبيقات شهريًا بميزانية محدودة لوحدة معالجة الرسومات، مما يجعل ذلك ضرورة عملية. وقد استعرض رامامورثي التقنيات الأساسية. قام التكميم بضغط الأرقام باستخدام نموذج مستخدم داخليًا، مما جعل تشغيله أسرع وأرخص. الإصدار الأكثر ذكاءً ضغط فقط الأجزاء الأقل أهمية مع ترك الأجزاء المهمة سليمة، واكتسب السرعة دون فقدان الكثير من الدقة. وقال: “اكتشف الأوزان ذات الصلة. لا تقم بقياسها. وبهذه الطريقة لا تفقد الكثير من الدقة ولكنك تكتسب السرعة”. تعمل إدارة ذاكرة التخزين المؤقت لـ KV مثل نظام ذاكرة قصير المدى: احتفظ بما وصل إليه النموذج في كثير من الأحيان، وامسح ما نادرًا ما يستخدمه. يؤدي التجميع المستمر إلى تجميع الطلبات الواردة معًا بدلاً من التعامل معها واحدًا تلو الآخر. استخدم فك التشفير التأملي نموذجًا صغيرًا لصياغة الاستجابة، مع نموذج أكبر للتحقق منه، مما يوفر جودة نموذج أكبر دون التكلفة الكاملة. وقال: “حتى المهندسين الذين أعمل معهم يقومون بذلك، فهم يكتبون التعليمات البرمجية باستخدام Sonnet ثم يستخدمون Opus لتصحيح الأخطاء”. كانت الحجة لصالح الاستدلال واضحة حول السبب الذي يجعل هذا الأمر منطقيًا بالنسبة لشركة ذات موارد تمهيدية. “مهمة المختبر هي تدريب النماذج، لكنني أعتقد أن هذا القطار قد مر، لأن جميع النماذج ذات الأغراض العامة موجودة. ولكن بعد ذلك تستمر في تشغيل هذه النماذج. لذلك هناك حفرة عميقة يمكنك النزول إليها على مستوى الاستدلال.” بالنسبة للفرق ذات الموارد المحدودة، اختتمت الجلسة بنقطة واضحة: لم تعد الفرصة في الذكاء الاصطناعي تتعلق فقط بالنماذج التي يمكن للفريق أن يبنيها، ولكن حول مدى كفاءة تشغيل النماذج الموجودة بالفعل.


تم النشر: 2026-06-14 08:00:00

مصدر: yourstory.com