Home تقنية TabFM: نموذج أساس صفري للبيانات الجدولية | itg-ar.com

TabFM: نموذج أساس صفري للبيانات الجدولية | itg-ar.com

2
0
TabFM: نموذج أساس صفري للبيانات الجدولية
| itg-ar.com

TabFM: نموذج أساس صفري للبيانات الجدولية

تشكل البيانات الجدولية العمود الفقري للبنية التحتية لبيانات المؤسسة وتدعم جزءًا كبيرًا من تطبيقات التعلم الآلي التنبؤية المهمة. من التنبؤ بتقلب العملاء إلى تحديد الاحتيال المالي، فإن مهام الانحدار الجدولي والتصنيف موجودة في كل مكان. لسنوات عديدة، هيمنت الخوارزميات المستندة إلى الأشجار الخاضعة للإشراف، مثل AdaBoost وXGBoost والغابات العشوائية، على سبيل المثال لا الحصر، على هذا الفضاء، حيث قدمت أداءً قويًا على البيانات المنظمة. ومع ذلك، فإن دورة حياة نشر هذه النماذج التقليدية تمثل عنق الزجاجة الكبير. لا يعد ملاءمة نموذج XGBoost لمجموعة بيانات جديدة مجرد خطوة واحدة .fit()؛ فهو يتطلب دائمًا جهدًا يدويًا شاقًا. يجب على علماء البيانات استثمار ساعات لا حصر لها في التحسين الشامل للمعلمات الفائقة وهندسة الميزات الخاصة بالمجال فقط لاستخراج إشارة موثوقة من البيانات الأولية. ومن ناحية أخرى، فإن التطورات الحديثة في المشهد الأوسع للتعلم الآلي – وخاصة تطور نماذج اللغة الكبيرة (LLMs) – قد غيرت كيفية تفاعلنا مع المهام الجديدة. لقد أثبتت LLMs القوة الرائعة للتنبؤ الصفري من خلال التعلم في السياق (ICL). تتيح هذه التقنية للنموذج الذي تم تدريبه مسبقًا تعلم مهمة جديدة من خلال تقديم الأمثلة والتعليمات في سياق الإدخال، دون تحديث أي أوزان نموذجية أساسية. اليوم، نقدم TabFM، وهو نموذج أساسي مصمم خصيصًا لتصنيف البيانات الجدولية وانحدارها. من خلال تأطير التنبؤ الجدولي باعتباره مشكلة ICL، يلغي TabFM الحاجة إلى التدريب اليدوي على النماذج، وضبط المعلمات الفائقة، وهندسة الميزات المعقدة. يسعدنا أن نشارك كيف يتيح هذا الأسلوب للمستخدمين إنشاء تنبؤات عالية الجودة على جداول لم يسبق رؤيتها من قبل في تمريرة أمامية واحدة. TabFM متاح الآن على مستودعات Hugging Face وGitHub.


تم النشر: 2026-06-30 23:08:00

مصدر: research.google