باحث يعلن اختراق قيود نموذج ذكاء اصطناعي متقدم بعد أيام من إطلاقه

أعاد اختبار أمني جديد الجدل حول مدى قدرة شركات الذكاء الاصطناعي على حماية نماذجها المتطورة، بعدما أعلن باحث متخصص في الأمن السيبراني والذكاء الاصطناعي نجاحه في تجاوز بعض القيود الأمنية المدمجة في نموذج Claude Fable 5 التابع لشركة Anthropic، وذلك بعد فترة وجيزة من طرحه للمستخدمين.
وأوضح الباحث المعروف باسم Pliny the Liberator أنه تمكن من التحايل على مجموعة من آليات الحماية التي يعتمد عليها النموذج، عبر استخدام تقنيات اختبار متقدمة ونسخ معدلة من نماذج سابقة، من بينها إصدار معدل من نموذج Opus 4.8، بهدف دراسة حدود أنظمة الأمان ومدى قدرتها على منع بعض أنواع الطلبات الحساسة.
ويأتي هذا الإعلان في وقت تسعى فيه شركات الذكاء الاصطناعي إلى تطوير نماذج أكثر قوة مع إضافة طبقات حماية تمنع استخدامها في أنشطة ضارة.
وكانت Anthropic قد قدمت Claude Fable 5 باعتباره إصدارًا يعتمد على تقنيات أمان إضافية مقارنة بنموذج Mythos الأكثر تطورًا، الذي اعتبرته الشركة من النماذج ذات القدرات العالية التي تتطلب ضوابط دقيقة قبل توسيع نطاق استخدامها.
وأشار الباحث إلى أن بعض إجراءات الحماية المدمجة في النموذج قد تحتوي على نقاط ضعف تسمح بتجاوز القيود الموضوعة على أنواع معينة من الاستفسارات أو المخرجات، مؤكدًا أن الهدف من الاختبار هو تقييم فعالية أنظمة السلامة وليس استغلال النموذج لأغراض غير مشروعة.
وأثارت هذه القضية اهتمامًا خاصًا داخل قطاعات التكنولوجيا والأمن الرقمي، لا سيما مع تصاعد المخاوف من إمكانية استخدام نماذج الذكاء الاصطناعي المتقدمة في اكتشاف الثغرات البرمجية أو تنفيذ هجمات تستهدف أنظمة مالية وتقنيات ناشئة، بما فيها مشاريع البلوكشين والتمويل اللامركزي.
ولم تصدر Anthropic، حتى الآن، توضيحًا رسميًا بشأن هذه الادعاءات، غير أن الواقعة تسلط الضوء على تحدٍ متزايد أمام مطوري الذكاء الاصطناعي: كيفية تحقيق التوازن بين تطوير قدرات النماذج وتسريع الابتكار، مع ضمان وجود أنظمة حماية فعالة تقلل من مخاطر سوء الاستخدام.




