أنشأت مجلة The Atlantic قاعدة بيانات قابلة للبحث عن الموسيقى المستخدمة لتدريب الذكاء الاصطناعي
كشف مراسل أتلانتيك أليكس ريزنر مؤخرًا عن أربع مجموعات بيانات من الموسيقى تُستخدم لتدريب نماذج الذكاء الاصطناعي وجعلها قابلة للبحث بالكامل للجمهور. اثنتان من المجموعات هائلة للغاية حيث تحتوي على 12 مليونًا و9 ملايين مقطع صوتي. المجموعتان الأخريان أصغر بكثير، لكنهما لا تزالان تمثلان قدرًا كبيرًا من بيانات التدريب لأكثر من 100000 أغنية لكل منهما. وفقًا لريزنر، تم تنزيل المجموعات آلاف المرات، وعلى الرغم من أنه من المستحيل معرفة من استخدمها بالضبط، فقد أكدت كل من Google وStability أنهما قاما بذلك في أوراق بحثية. بعض المصادر، مثل مجموعة بيانات Free Music Archive، مجانية للبث للاستخدام الشخصي ولكنها تتطلب ترخيصًا للتطبيقات التجارية. في حين أن مجموعات البيانات متاحة مجانًا على الإنترنت من الناحية النظرية، فإن استخدامها كبيانات تدريب ليس بسيطًا مثل تنزيل ملف ZIP وإدخاله في نموذج الذكاء الاصطناعي. كما يوضح ريزنر: تم توزيع ثلاث من مجموعات البيانات التي وجدتها كقائمة روابط للأغاني على YouTube أو Spotify. يقوم مطورو الذكاء الاصطناعي بتنزيل الصوت الفعلي باستخدام الأدوات التي تعمل على أتمتة المهمة، والتي يسمح بعضها للمطورين بتجاوز عمليات تسجيل الدخول والإعلانات والآليات التي قد تكسب المال أو المشتركين للمبدعين. تنتهك هذه الأدوات شروط خدمة هذه المنصات.
تم النشر: 2026-06-20 19:46:00
مصدر: www.theverge.com








