Home تقنية ظهور طبقة البنية التحتية لبيانات الويب للذكاء الاصطناعي | itg-ar.com

ظهور طبقة البنية التحتية لبيانات الويب للذكاء الاصطناعي | itg-ar.com

2
0
ظهور طبقة البنية التحتية لبيانات الويب للذكاء الاصطناعي
| itg-ar.com

ظهور طبقة البنية التحتية لبيانات الويب للذكاء الاصطناعي

قد تعتمد الحدود التالية في الذكاء الاصطناعي على طبقة بنية تحتية جديدة لبيانات الويب يمكنها تمكين النماذج من اكتشاف ورسم خريطة لهذا العالم الرقمي الآخذ في التوسع. يجب أن تكون هذه الطبقة قادرة على التنقل عبر مئات الملايين من نطاقات الويب الحالية ومليارات عناوين URL الجديدة التي يتم إنشاؤها كل أسبوع، مما يوفر معلومات في الوقت الفعلي ويتغلب على الحواجز التقنية. يقول أور لينشنر، الرئيس التنفيذي لشركة برايت داتا، وهي منصة لجمع البيانات على شبكة الإنترنت: “تشير البيانات إلى وجود بيانات أكثر بكثير”. “فكر في الكون: إنه موجود في الخارج، لكنك لا تعرف ما لا تعرفه.” تمكين الوصول إلى بيانات جديدة وذات صلة وجديرة بالثقة في حين أن الاختراقات المبكرة للذكاء الاصطناعي كانت مدفوعة بتوسيع نطاق بيانات التدريب وحجم النموذج، تواجه المؤسسات الآن اختناقًا أساسيًا: فهي بحاجة إلى مواكبة الطبيعة الديناميكية وغير المنظمة والمتطورة باستمرار لبيانات الويب من أجل إرساء المخرجات في المعلومات الحالية والتي يمكن التحقق منها. لا يعتمد أداء الذكاء الاصطناعي بشكل متزايد على بنية النموذج فحسب، بل أيضًا على قدرات النظام في مجال الحوسبة والشبكات والاسترجاع وهندسة البيانات – أي قدرة النظام على استرداد البيانات الجديدة وذات الصلة والجديرة بالثقة بسرعة وبشكل موثوق. يعتمد التدريب النموذجي التقليدي على لقطات من المعلومات التي تم جمعها في وقت معين. ولم يعد تدريب الذكاء الاصطناعي على مثل هذه البيانات الثابتة كافيا. لتتبع التقلبات مثل أسعار المنافسين ومعنويات المستهلكين واتجاهات السوق، تحتاج الشركات إلى تغذية مستمرة بالمعلومات الجديدة، وسحب البيانات في الوقت الفعلي جنبًا إلى جنب مع السياق ذي الصلة. ولذلك يجب أن تكون البنية التحتية الخاصة بهم قادرة على التعامل مع ملايين التفاعلات المتزامنة عبر مواقع الويب التي تختلف حسب الجغرافيا واللغة والتنسيق وقواعد الوصول. يقول لينشنر: “إذا لم يتمكن من استرجاع المعلومات في الوقت الفعلي، فإنه يفتقر إلى السياق”. “في بيئة الأعمال، لم يعد هذا مقبولا بعد الآن. الإجابات التي لا معنى لها تؤدي إلى قرارات سيئة وتؤدي إلى خيبة أمل المستهلكين.” السرعة ليست مجرد مسألة راحة؛ إنها مسألة ضرورة. تعمل المؤسسات اليوم في بيئات تتغير فيها الأسعار والمخزون والأسواق والتهديدات الأمنية وسلوك العملاء بشكل مستمر. يمكن أن يؤدي تأخير استرجاع البيانات إلى تقليل فائدة النموذج المعقد. يمكن أن يؤدي استخدام بيانات الويب المباشرة عالية الجودة أيضًا إلى تقليل هلوسة الذكاء الاصطناعي لأن النموذج يحتوي على قاعدة معرفية أكثر صلة. وهذا يبني ثقة المستخدم. في الواقع، وجدت إحدى الدراسات الاستقصائية أن 56% من ممارسي الذكاء الاصطناعي قالوا إن الشركات بحاجة إلى الوصول إلى بيانات الويب في الوقت الفعلي لتحسين الثقة في مخرجات الذكاء الاصطناعي. ولضمان تشغيل النموذج بكفاءة وفعالية، يجب أيضًا تقليص المعلومات إلى الأساسيات المناسبة. على الرغم من تقديم تقنية الاسترجاع المعزز (RAG)، حيث تقوم النماذج بسحب البيانات الخارجية في لحظة الاستعلام، لا تزال العديد من أنظمة الذكاء الاصطناعي تكافح من أجل تقديم مخرجات حديثة وذات صلة بالسياق وجديرة بالثقة في الإعدادات التشغيلية. وفقًا لشركة Gartner، سيتم التخلي عن 60% من مشاريع الذكاء الاصطناعي التي لا تدعمها بيانات جاهزة للذكاء الاصطناعي – دقيقة ومنظمة ومنظمة ومحددة السياق – بحلول نهاية العام.


تم النشر: 2026-06-24 12:59:00

مصدر: www.technologyreview.com