Patronus AI تطلق منصة مبتكرة للكشف عن “هلوسات الذكاء الاصطناعي” ومنعها في الوقت الفعلي
أطلقت شركة *Patronus AI* الناشئة أول منصة ذاتية الخدمة مصممة لاكتشاف ومنع ما يُعرف بـ”هلوسات الذكاء الاصطناعي” في الوقت الفعلي.
وتُوصف هذه المنصة بأنها “مدقق إملائي متقدم” لأخطاء أنظمة الذكاء الاصطناعي، وهي تهدف إلى الكشف عن هذه الأخطاء قبل وصولها إلى المستخدمين.
وأوضح أناند كانابان، الرئيس التنفيذي لشركة *Patronus AI*، أن العديد من الشركات تواجه تحديات متزايدة تتعلق بمشاكل الذكاء الاصطناعي، بما في ذلك “الهلوسات”، الثغرات الأمنية، والسلوك غير المتوقع، ما يشكل عائقًا أمام استخدامها في البيئات التشغيلية.
وحسب دراسة أجرتها الشركة، أظهرت النماذج الرائدة مثل *GPT-4* أنها تقوم بإعادة إنتاج محتوى محمي بحقوق النشر بنسبة تصل إلى 44% عند التفاعل مع المستخدمين، كما فشلت هذه النماذج في اجتياز اختبارات السلامة الأساسية بنسبة تفوق 20%.
من جانبه، أكد فاروق جوشي، مدير المنتجات في *Patronus AI*، على أن تقييم النماذج والردود التي تقدمها للمستخدمين لا يقتصر على تجنب النتائج السلبية فقط، بل يساعد أيضًا في تحسين النماذج والمنتجات بشكل عام.
وأشار إلى أهمية التحسين المستمر للنماذج بدلاً من الاعتماد فقط على إجراءات السلامة والأمان.
في ظل تزايد اعتماد الشركات على تقنيات الذكاء الاصطناعي التوليدي في مجالات متعددة مثل خدمة العملاء وأنظمة توليد المحتوى، أصبح من الواضح أن أدوات السلامة الحالية مثل *Meta’s LlamaGuard* لم تعد فعالة بما يكفي، حيث أن دقتها أقل من 50%.
وتقدم *Patronus AI* مجموعة من الأدوات المتطورة، أبرزها أداة “تقييم القضاة” (*Judge Evaluators*), التي تمكن الشركات من كتابة قواعد مخصصة بلغة إنجليزية بسيطة، ما يسمح لها بتحديد المعايير التي تتناسب مع احتياجات منتجاتها، مثل الامتثال التنظيمي في القطاع المالي أو الحفاظ على الخصوصية والدقة الطبية في القطاع الصحي.
ويعتبر “Lynx” أحد الركائز الأساسية للنظام، وهو نموذج متطور للكشف عن الأخطاء الطبية، حيث يتفوق على *GPT-4* بنسبة 8.3% في اكتشاف الأخطاء الطبية.
تعتمد منصة *Patronus AI* على سرعتين في عملها: الأولى للاستجابة الفورية للمراقبة الحية، والثانية لتحليل أعمق، مما يسمح بتكييف النظام وفقًا لاحتياجات الاستخدام الفوري أو التحليل الشامل.
وقد طورت الشركة أيضًا أدوات متخصصة مثل “CopyrightCatcher” للكشف عن إعادة إنتاج المحتوى المحمي بحقوق النشر، و”FinanceBench”، أول معيار لتقييم أداء الذكاء الاصطناعي في الإجابة على أسئلة متعلقة بالقطاع المالي.
من حيث التسعير، تقدم الشركة نموذجًا يعتمد على الاستخدام، حيث يبدأ من 10 دولارات لكل 1000 استدعاء واجهة برمجية للسرعة المنخفضة، و20 دولارًا للسرعة العالية، مما يجعل أدوات سلامة الذكاء الاصطناعي متاحة حتى للشركات الناشئة والشركات الصغيرة.
وقد نجحت *Patronus AI* في جذب عملاء كبار مثل *HP* و*AngelList* و*Pearson*، كما أبرمت شراكات مع شركات عملاقة مثل *Nvidia* و*MongoDB* و*IBM*.
يأتي إطلاق المنصة في وقت بالغ الأهمية، مع التطورات السريعة في نماذج الذكاء الاصطناعي، حيث تشير التشريعات الأخيرة، مثل الأمر التنفيذي للرئيس الأمريكي جو بايدن، وقانون الاتحاد الأوروبي للذكاء الاصطناعي، إلى أن الشركات قد تواجه قريبًا متطلبات قانونية لضمان سلامة أنظمة الذكاء الاصطناعي.