تسريبات تكشف عن جهود ميتا لتفوق على GPT-4
كشفت وثائق قضائية جديدة تم الإفراج عنها في قضية حقوق الطبع والنشر بين شركتي Kadrey وميتا، أن قادة شركة ميتا كانوا مهووسين بالتفوق على نموذج GPT-4 الذي تمتلكه OpenAI أثناء تطويرهم لنموذج Llama 3 المفتوح.
وفقًا لرسالة داخلية أُرسلت في أكتوبر 2023، ذكر أحمد الدحل، نائب رئيس الذكاء الاصطناعي التوليدي في ميتا، للباحث هوغو توفرون: “هدفنا يجب أن يكون بوضوح هو التفوق على GPT-4.
لدينا 64 ألف وحدة معالجة رسومات (GPU) في الطريق! يجب أن نتعلم كيفية بناء نموذج متقدم والفوز في هذا السباق.”
على الرغم من أن ميتا كانت قد أطلقت نماذج ذكاء اصطناعي مفتوحة المصدر، إلا أن الرسائل الداخلية أظهرت أن التركيز الرئيس كان على التفوق على المنافسين الذين يحتفظون بنماذجهم خلف واجهات برمجية مغلقة، مثل OpenAI وشركة Anthropic.
كما أظهرت الوثائق أن ميتا لم تعتبر شركة Mistral الفرنسية، التي تُعد من الشركات المنافسة لها في مجال النماذج المفتوحة، تهديدًا حقيقيًا. فقد وصفها الدحل بأنها “لا تُقارن بنا، ويجب أن نكون قادرين على تقديم الأفضل.”
وفي إطار المنافسة الشديدة، أظهرت الوثائق أن قادة ميتا كانوا مستعدين أحيانًا لتجاوز الحدود الأخلاقية. ففي مناقشاتهم، تم طرح فكرة استخدام مجموعة بيانات من منصة LibGen التي تحتوي على مواد محمية بحقوق الطبع والنشر من دور نشر تعليمية كبرى.
ويكشف النقاش داخل ميتا عن محاولة لتحسين جودة بيانات التدريب، حيث اعترف باحثو الشركة بأن مزيج البيانات المستخدم في تدريب نموذج Llama 2 “كان سيئًا”، حسب تعبيرهم.
وفي رسالة داخلية أخرى في يوليو 2024، قال مارك زوكربيرج، الرئيس التنفيذي لشركة ميتا: “في هذا العام، نماذج Llama 3 تتنافس مع النماذج الأكثر تقدمًا، وتتفوق في بعض المجالات. وبداية من العام المقبل، نتوقع أن تصبح نماذج Llama المستقبلية الأكثر تطورًا في المجال.”
تم إطلاق نماذج Llama 3 في أبريل 2024، ونجحت في منافسة النماذج المغلقة من OpenAI وجوجل وAnthropic، وتفوقت أيضًا على النماذج المفتوحة من Mistral.
ومع ذلك، فإن البيانات المستخدمة في تدريب هذه النماذج تخضع الآن لتدقيق قانوني مكثف.
تُظهر هذه الوثائق الضغط الكبير داخل ميتا للتفوق في سباق الذكاء الاصطناعي، لكنها تسلط الضوء أيضًا على التحديات القانونية والأخلاقية التي تواجه الشركة، حيث تواجه اتهامات باستخدام بيانات محمية بحقوق الطبع والنشر دون إذن. هذه القضية قد تعرض نماذجها المفتوحة لخطر قانوني كبير.