استمع للمقال النص المسموع تلقائي ناتج عن نظام آلي
أظهرت دراسة حديثة أن نموذج الذكاء الاصطناعي "Llama 3.1" من شركة ميتا تذكر 42% من أول كتاب من سلسلة هاري بوتر، وهو ما يمثل انتهاكًا لحقوق النشر.
ووجدت الدراسة، التي أجرتها جامعات "ستانفورد" و"كورنيل و"وست فرجينيا"، أن نموذج "Llama 3.1"، الذي أُطلق في يوليو 2024، لا يتذكر فقط أحداث القصة، بل يمكنه إعادة إنتاج فقرات كاملة من النص إذا أُعطي الجملة الأولى.
وللمقارنة، فإن النموذج الأقدم لم يكن يتذكر سوى 4.4% فقط من الكتاب، بحسب تقرير لموقع "Gagadget"، اطلعت عليه "العربية Business".
وفحص الباحثون مدى تذكر نموذج لاما الجديد للكتب، حيث تبين أنه إذا كان النص شائعًا جدًا -مثل "هاري بوتر" أو "ذا هوبيت"- فإن الذكاء الاصطناعي قادر على تكرار مقاطع كبيرة منه. لكن مع الكتب الأقل شهرة -مثل "Sandman Slim"- فقد تذكر النموذج أقل من 1% منها.
واستخدم الباحثون طريقة خاصة تُظهر مدى ثقة النموذج في كل كلمة تالية، وكانت هذه الثقة عالية جدًا لدرجة أنه أصبح من الواضح أن النموذج قد رأى هذا النص من قبل بالفعل.
ويمثل هذا الأمر انتهاكًا لحقوق الطبع والنشر، لأن هذه الكتب محمية بهذه الحقوق، وهو ما يعني أنه لا ينبغي للذكاء الاصطناعي إعادة إنتاجها ببساطة كما لو كان طابعة.
وحدث هذا على الأرجح لأن "ميتا" دربت هذا النموذج على 15 تريليون كلمة، وهو عدد هائل، ومن المحتمل أن التدريب لم يقتصر على الكتب فقط، بل شمل أيضًا المنتديات، والمواقع المخصصة للمعجبين، والمراجعات التي تحتوي على اقتباسات، فكلما تكرّر ظهور نص معين في مجموعة البيانات، زاد تأثيره على النموذج.
-
"ميتا" تطلق نموذج ذكاء اصطناعي لتطوير الروبوتات والسيارات ذاتية القيادة
يفهم العالم المادي حوله ويتخذ قرارات أقرب للإنسان
الذكاء الاصطناعي -
جماعة ألمانية تفشل في منع استخدام "ميتا" للبيانات لتدريب الذكاء الاصطناعي
تتعلق القضية بمنشورات مستخدمي فيسبوك وإنستغرام
وسائل التواصل الاجتماعي -
"ميتا" تتوقع إيرادات بقيمة 1.4 تريليون دولار للذكاء الاصطناعي التوليدي في 2035
تنفق مبالغ طائلة على مجموعات منتجات الذكاء الاصطناعي الخاصة بها
الذكاء الاصطناعي