الاقتصاديةالتكنولوجيا

ثورة الكفاءة..GDPval يضع الذكاء الاصطناعي في اختبار حقيقي لقياس قيمته الاقتصادية

لم يعد السؤال حول ما إذا كان الذكاء الاصطناعي (AI) سيحل محل العمال البشريين مجرد خيال علمي، بل أصبح محور اختبارات عملية صارمة.

ففي عصر تتسارع فيه التكنولوجيا وتتصاعد رهانات الكفاءة الاقتصادية، تبحث الشركات عن إجابة واقعية: هل يمكن للنماذج الذكية أن تضاهي سنوات من الخبرة البشرية في أهم المهام الاقتصادية؟

لتقديم إجابة قائمة على الأدلة، أطلقت شركة “أوبن إيه آي” (OpenAI) معياراً جديداً يُعرف بـ “جي دي بي فال – GDPval”. يمثل هذا المعيار أول اختبار شامل يهدف إلى قياس قدرة النماذج الذكية على إنجاز الأعمال التي ظلت لعقود حكراً على العقول الإنسانية المحترفة.

AI's Golden Handshake with Banking: Redefining Trust and Transformation -  FinTech Weekly

ما هو أساس هذا المعيار؟

  • مهام واقعية: يستند “GDPval” إلى 1320 مهمة رقمية تمثل جوهر العمل المهني.
  • وظائف حيوية: تغطي هذه المهام 44 وظيفة رئيسية موزعة على 9 قطاعات تساهم بنحو 75% من الناتج المحلي الأمريكي (GDP).
  • خبرة بشرية كمرجع: تم تطوير المهام بالتعاون مع خبراء يمارسون هذه الوظائف فعليًا، بمتوسط خبرة يبلغ 14 عامًا، لضمان القيمة العملية للقياس.

تم اختيار القطاعات والمهن بعناية، حيث يساهم كل قطاع مشمول بأكثر من 5% من الناتج المحلي، ورُكز على المهن ذات الأجور المرتفعة التي تكون 60% على الأقل من مهامها رقمية وقابلة للأتمتة.

كما يُحاكي المعيار بيئة العمل الواقعية، ويتطلب من الذكاء الاصطناعي التعامل مع جميع أنواع الملفات الرقمية، بما في ذلك جداول البيانات، والعروض التقديمية، ومقاطع الفيديو، وملفات التصميم الهندسي.

ويشمل هذا الاختبار مهناً تُغطي مجمل أجور سنوية يتجاوز 3 تريليونات دولار.

في محاكاة الاختبار، تُعرض نتائج النماذج الذكية والبشر على محكِّمين محايدين دون معرفة مصدرها، ويتم التقييم بناءً على جودة التسليم النهائي، والدقة، والاتساق، والكفاءة.

أظهرت الدراسة أن دمج النماذج الذكية مع الإشراف البشري يحقق وفورات ملحوظة:

  • سجل نموذج “جي بي تي-5” (GPT-5) زيادة في السرعة تبلغ نحو 1.39 ضعف العمل البشري.
  • شهد تراجعاً في التكاليف بما يقارب 1.63 ضعف.

أكدت النتائج أن تزويد النماذج الذكية بمعلومات دقيقة وسياق كافٍ، إلى جانب تقديم خطوات تحليلية منظَّمة (الإرشادات المرحلية – Scaffolding)، يحسن بشكل كبير من دقة وجودة النتائج لتتوافق مع معايير المحترفين.

أظهرت النماذج الرائدة مستويات أداء متفاوتة:

  • حقق نموذج “كلود أوبس 4.1” (Claude Opus 4.1) أفضل أداء إجمالي، حيث كانت 47.6% من مهامه مساوية أو متفوقة على أداء البشر، مع تفوق واضح في الجوانب الجمالية مثل تنسيق الوثائق وتصميم الشرائح.
  • برز نموذج “جي بي تي -5” في الدقة واستخراج المعرفة المتخصصة واتباع التعليمات، محققاً معدل تفوق يبلغ 39% في المهام المعرفية المركبة.
  • بينما تراوح أداء معظم النماذج الأخرى بين 12.5% و35% مقارنة بالبشر.

رغم هذا التقدم المذهل، لا تزال هناك فجوة.

حيث يُظهر تحليل النتائج أن سبب تفضيل المحكمين للمخرجات البشرية في أغلب الأحيان يعود إلى إخفاق النماذج في الالتزام الكامل بالتعليمات أو تقديم جودة أقل في التنفيذ. لا تزال المهام المعقدة التي تعتمد على اجتهاد أو تقدير شخصي عالٍ تشكل تحدياً للذكاء الاصطناعي.

أبرز القطاعات والمهن التي يغطيها مقياس “جي دي بي فال” لتقييم الذكاء الاصطناعي

القطاع

نسبة من الناتج المحلي (%)

أمثلة على المهن المشمولة وإجمالي

التعويض السنوي للعاملين بالمهنة

العقارات والتأجير

13.80%

مديرو الممتلكات (أي المتخصصين في إدارة وتشغيل العقارات سواء كانت سكنية أو تجارية بالنيابة عن مالكيها) — 24.54 مليار دولار
مبيعات العقارات — 13.53 مليار دولار
وسطاء العقارات — 4.55 مليار دولار
موظفو الاستقبال— 1.80 مليار دولار

التصنيع

10.00%

مشرفو الخطوط الأمامية للإنتاج والعمال التشغيليون — 51.07 مليار دولار

موظفو الشراء — 39.79 مليار دولار

الشحن والاستلام والمخزون — 38.50 مليار دولار

المهندسون الميكانيكيون — 31.57 مليار دولار

الخدمات المهنية والعلمية والتقنية

8.10%

مطورو البرمجيات — 239.18 مليار دولار

المحامون — 136.66 مليار دولار

المحاسبون والمدققون — 135.44 مليار دولار

مديرو نظم المعلومات والحواسيب — 121.44 مليار دولار

أخصائيو إدارة المشاريع — 108.77 مليار دولار

الحكومة

11.30%

مسؤولو الامتثال — 33.80 مليار دولار

مديرو الخدمات الإدارية — 32.03 مليار دولار

عمال الخدمة الاجتماعية للأسرة والطفل— 24.10 مليار دولار

عمال الترفيه — 11.51 مليار دولار

الرعاية الصحية والمساعدة الاجتماعية

7.60%

الممرضون — 323.05 مليار دولار

مشرفو دعم الإدارة — 107.02 مليار دولار

مدير الخدمات الطبية — 77.93 مليار دولار

ممارسو التمريض — 40.58 مليار دولار

الأمناء الطبيون والمساعدون الإداريون — 37.87 مليار دولار

التمويل والتأمين

7.40%

المديرون الماليون — 147.74 مليار دولار

ممثلو خدمة العملاء — 123.70 مليار دولار

مبيعات الأوراق المالية والسلع والخدمات— 52.14 مليار دولار

المحللون الماليون الشخصيون — 43.33 مليار دولار

محللو الاستثمار والمالية — 39.67 مليار دولار

تجارة التجزئة

6.30%

مديرو التشغيل والعمليات — 47.16 مليار دولار

مشرفو موظفي المبيعات بالتجزئة — 58.27 مليار دولار

الصيادلة — 45.12 مليار دولار

تجارة الجملة

5.80%

مندوبو المبيعات بالجملة والتصنيع (باستثناء التقني/العلمي) — 103.21 مليار دولار

مديرو المبيعات — 97.16 مليار دولار

مندوبو المبيعات بالجملة والتصنيع (تقني/علمي) — 33.66 مليار دولار

مشرفو عمال غير التجزئة — 21.43 مليار دولار

مكاتب الطلب — 3.86 مليار دولار

المعلومات

5.40%

المنتجون والمخرجون — 16.60 مليار دولار

المحررون — 8.18 مليار دولار

محللو الأخبار والصحفيون — 4.41 مليار دولار

تقنيو الصوت والفيديو — 4.30 مليار دولار

محررو الأفلام والفيديو — 2.41 مليار دولار

ومع ذلك، يكشف معيار “GDPval” عن وتيرة سريعة في تضييق الفجوة. فالسيناريو الأكثر واقعية في الأمد القريب هو التكامل؛ أي نماذج هجينة يعمل فيها الذكاء الاصطناعي تحت إشراف وتدقيق البشر.

هذا النهج يعزز الإنتاجية ويختصر الوقت، ويدفع باتجاه مستقبل يكون فيه الذكاء الاصطناعي شريكًا أساسيًا، دون أن يكون بديلاً كاملاً عن الخبرة الإنسانية الجوهرية في الحكم السياقي المتغير والمهام شديدة التعقيد.

 

 

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى