لماذا تكاليف LLM الحالية ليست مستدامة
تتعرض الكثير من الشركات لضغوط بسبب ارتفاع تكاليف الذكاء الاصطناعي. استهلكت شركة Uber ميزانية الذكاء الاصطناعي للعام بأكمله في 4 أشهر فقط، وتتخذ Microsoft وSalesforce وGithub خطوات لتقليل إنفاق الموظفين على الذكاء الاصطناعي. ومن ناحية أخرى، يجعل الذكاء الاصطناعي العديد من مهام البرمجة سهلة للغاية ويستمر أيضًا في المساعدة في مجالات أخرى مثل تفسير البيانات وإنشاء شرائح جميلة وتصميم التطبيقات ومواقع الويب. حاليًا، تمتلك مختبرات الذكاء الاصطناعي الكبيرة ما نسميه النماذج الحدودية، وهذه النماذج تؤدي أداءً جيدًا بشكل استثنائي لمجموعة واسعة من المهام. تقوم مختبرات Frontier AI بإجراء الأبحاث والاستضافة بنفسها، وبالتالي فإن تكاليف هذه النماذج هي الأعلى. على سبيل المثال، تبلغ تكلفة GPT 5.5 5 دولارات لكل مليون رمز إدخال و30 دولارًا لكل مليون رمز إخراج. هذا هو النموذج الأكثر تكلفة حاليًا وفقًا لـ OpenRouter. على سبيل المثال، مجرد إجراء إصلاحات نوع Typescript مع هذا النموذج عبر 50 ملفًا كلفني 54 دولارًا بعد ظهر هذا اليوم. ثبات أداء النموذج، وإصدارات نماذج الوزن المفتوح، وتحسينات الرقائق والنماذج، وتكاليف التبديل الصفرية والنماذج المحلية هي الأسباب التي قد تجعل مختبرات الذكاء الاصطناعي غير قادرة على تحمل السعر المرتفع الذي تطلبه الآن. نحن نشهد تحسينات مع كل إصدار من النماذج هذه الأيام ولكن من الواضح أن التحسينات أصبحت أصغر وأصغر. وما لم يتم اختراع اختراق جديد تمامًا، فإن قدرات التعلم والاستدلال الحالية لا يمكن أن تتوسع إلا بشكل كبير. هناك مشكلة في بيانات التدريب أيضًا. من المحتمل أن تكون معظم مختبرات الذكاء الاصطناعي قد استوعبت كل ما هو متاح في الوسائط الرقمية والمطبوعة للتدريب النموذجي. سيكون تحسين مجموعة بيانات التدريب أمرًا صعبًا للغاية. وهذا يعني أن الاتجاه المستمر للارتفاع في سعر النموذج بسبب الأداء الأفضل لن يكون سهلاً. لقد رأينا دليلاً على ذلك حيث أن تكلفة Claude Opus 4.8 هي نفس تكلفة Claude Opus 4.7. بمجرد أن تتوقف النماذج عن التحسن بشكل كبير وتشابه بيانات وأساليب التدريب، فمن المرجح أن تنخفض أسعار النماذج بسبب المنافسة. كان لدى OpenAI تقدم كبير عندما أطلقوا ChatGPT في عام 2022 ولكن هذا التقدم يتلاشى ببطء وشاهدنا Anthropic تتصدر المركز الأول في 2025-2026. الآن نماذج مثل GLM-5.2 وهو نموذج ذو وزن مفتوح، تتفوق على GPT وOpus في معايير الترميز. تبلغ تكلفة هذا النموذج 1/10 مقارنة بـ GPT 5.5. ما يحدث هنا هو أن مختبرات الذكاء الاصطناعي الرائدة لا تتقاضى رسومًا مقابل الاستدلال فحسب، بل أيضًا مقابل البحث في بنية النموذج، وجمع بيانات التدريب وتنظيمها، وتكلفة تدريب النموذج (التي يمكن أن تصل إلى عشرات أو حتى مئات الملايين من الدولارات)، ودفع رواتب موظفيها واسترداد تكاليف التسويق. من ناحية أخرى، بمجرد إصدار نموذج الوزن المفتوح، يمكن لأي مزود استدلال استضافته بسهولة وإجراء بعض العلامات على تكلفة الاستدلال. وهذا يثبت أنه أرخص بكثير من تشغيل مختبر الذكاء الاصطناعي الحدودي. وقد أدركت شركات مثل Cerebras وGroq وGoogle والعديد من الشركات الأخرى أن الذكاء الاصطناعي يحتاج إلى السيليكون الخاص به وأن وحدات معالجة الرسوميات العادية لا تكفيه. يعد تصميم الرقائق المتخصصة مكلفًا للغاية، ولكن بمجرد أن تصبح البنية جاهزة، يصبح صنع الملايين منها أمرًا سهلاً وتصبح تكلفة الاستدلال أرخص بكثير. على سبيل المثال، يمكن أن تكون مادة TPU أرخص بنسبة 30-70% من وحدة معالجة الرسوميات Nvidia H100. سوف تستمر مثل هذه التطورات في الظهور وستستمر في انخفاض سعر الرمز المميز. كما تتطور بنية النموذج أيضًا. لقد رأينا التخزين المؤقت بمثابة تحسين أساسي، والآن تعمل نماذج MoE والأساليب الأخرى على جعل النماذج أسرع مع الحفاظ على نفس مستويات الدقة. البرامج التقليدية مثل Windows OS وMS Office وAdobe Suite وSaaS مثل Salesforce وHubspot وFigma لديها خندق مهم جدًا لا تمتلكه نماذج الذكاء الاصطناعي. لم يكن كل برنامج تم إنشاؤه قابلاً للتبديل. لا يمكنك تبديل نظام إدارة علاقات العملاء (CRM) في فترة ما بعد الظهر؛ استغرق الأمر أشهرًا. عندما يدخل المزيد من مختبرات الذكاء الاصطناعي إلى الفضاء ويتوفر المزيد من نماذج الوزن المفتوح، سيكون هذا العامل مسؤولاً عن انهيار سريع جدًا في الأسعار. يجعل موفرو بوابة الذكاء الاصطناعي مثل OpenRouter.ai من السهل للغاية تبديل النماذج. يمكن أن يحدث ذلك في ثوانٍ، وفي الواقع، يمكننا برمجته لتغيير مقدمي الخدمة بسرعة. تعني تكاليف التبديل الصفرية أنه في حالة ظهور نموذج أفضل، يمكن للمستهلكين التحول إليه دون أي استثمار للوقت. وأخيرًا وليس آخرًا، وفي الواقع، العامل الأكثر أهمية هو قدرة المستخدمين على تشغيل النماذج المحلية. حتى الآن، يستخدم الجميع تقريبًا النماذج المستضافة على السحابة، وتكون النماذج المحلية إما كبيرة جدًا بحيث لا يمكن نشرها أو بطيئة جدًا في العمل معها. ومع التقدم في مجال الرقائق، سوف يتغير هذا في غضون 4-5 سنوات. ستعمل الرقائق الأحدث على تشغيل النماذج محليًا، كما أن الانهيار شبه المؤكد في أسعار ذاكرة الوصول العشوائي (RAM) سيجعل من السهل نشر النماذج على أجهزة الكمبيوتر والهواتف الذكية. أتوقع أن توفر معظم أنظمة التشغيل طريقة لنشر نموذج وستوفر أيضًا واجهة حتى تتمكن التطبيقات التي تعمل محليًا من الاتصال بالنموذج. وعندما يحدث ذلك، سيتم استخدام النماذج السحابية فقط للمهام الأكثر تعقيدًا والمهام البسيطة مثل إكمال علامة تبويب التعليمات البرمجية، وسيتم إجراء التدقيق اللغوي والتحقق من الحقائق محليًا. وهذا يعني أن العملاء لن يحتاجوا بعد الآن إلى اشتراك بقيمة 20 دولارًا أو 200 دولار. هذه هي مدونتي الأولى على المستوى الشخصي وقد قمت ببعض التوقعات الجريئة هنا. الوقت وحده هو الذي سيحدد كيف سينتهي الأمر، لكن هناك شيء واحد مؤكد. سيأتي ضغط الأسعار نتيجة لسبب أو أكثر من الأسباب المذكورة أعلاه وفي النهاية، كل ذلك في صالح المستهلكين.
تم النشر: 2026-06-26 08:44:00
مصدر: aditya.patadia.org








