غوغل تطلق نموذج Gemini 2.5 المدعوم بالذكاء الاصطناعي

كشفت شركة “غوغل” عن إطلاق سلسلة جديدة من نماذج الذكاء الاصطناعي تحت اسم “Gemini 2.5″، والتي تتميز بقدرتها على التوقف مؤقتًا للتفكير قبل تقديم إجابة على الأسئلة المطروحة.
وفي إطار هذه الإطلاقات، قدمت الشركة أيضًا نموذج “Gemini 2.5 Pro Experimental”، الذي يعتبر من أذكى النماذج التي طورتها غوغل حتى الآن.
و سيتمكن المطورون من الوصول إلى هذا النموذج عبر منصة “Google AI Studio”، كما سيكون متاحًا للمشتركين في باقة “Gemini Advanced” للذكاء الاصطناعي مقابل 20 دولارًا شهريًا، وفقًا لتقرير نشره موقع “تك كرانش”.
تتميز نماذج “Gemini 2.5” الجديدة بقدرتها على تضمين قدرات استدلالية مدمجة، وهو تطور مهم في نماذج الذكاء الاصطناعي، خاصة بعد أن أطلقت “OpenAI” أول نموذج استدلالي في سبتمبر 2024. تسابقت شركات التكنولوجيا الكبرى مثل “غوغل”، “أنثروبيك”، “ديب سيك”، و”xAI” لتطوير نماذج استدلالية التي تعزز التفكير والتأكد من صحة الإجابات قبل تقديمها.
تساهم تقنيات الاستدلال هذه في تحسين أداء النماذج في مهام مثل الرياضيات والبرمجة، وهي جزء أساسي من التطور نحو وكلاء الذكاء الاصطناعي المستقلين القادرين على أداء مهام متنوعة دون الحاجة لتدخل بشري.
تدعي “غوغل” أن نموذج “Gemini 2.5 Pro” يتفوق على النماذج الرائدة السابقة، مثل سلسلة نماذج “o” من “OpenAI”. وأكدت الشركة أن هذا النموذج مصمم لتحقيق أداء ممتاز في إنشاء تطبيقات ويب جذابة بصريًا وتطوير البرمجيات المعقدة.
وفي اختبار Aider Polyglot، الذي يقيم أداء النماذج في تحرير التعليمات البرمجية، حصل “Gemini 2.5 Pro” على 68.6%، متفوقًا على نماذج “OpenAI” و”أنثروبيك” و”ديب سيك”.
لكن في اختبار SWE-bench، الذي يركز على تطوير البرمجيات، حصل النموذج على 63.8%، متفوقًا على “o3-mini” من “OpenAI” و”R1″ من “ديب سيك”، لكنه كان أقل من “Claude 3.7 Sonnet” من “أنثروبيك”، الذي حصل على 70.3%.
وفي اختبار متعدد الوسائط، الذي يغطي مجالات مثل الرياضيات والعلوم الإنسانية والعلوم الطبيعية، أظهر “Gemini 2.5 Pro” أداءً قويًا بنسبة 18.8%، متفوقًا على العديد من النماذج المنافسة.
أعلنت “غوغل” أيضًا أن “Gemini 2.5 Pro” يأتي مع نافذة سياقية تدعم مليون رمز، مما يعني أنه قادر على استيعاب حوالي 750,000 كلمة دفعةً واحدة. وهذا يعادل تقريبًا طول سلسلة روايات “سيد الخواتم” بأكملها، مع خطط لدعم ضعف هذه السعة (مليوني رمز) في المستقبل القريب.