أعلنت شركة OpenAI عن إطلاق ميزة جديدة تحت اسم “وضع الصوت المتقدم مع الرؤية” لتطبيق ChatGPT، والتي تتيح له القدرة على فهم مقاطع الفيديو وتحليل الصور في الوقت الفعلي بطريقة غير مسبوقة.
و جاء هذا الإعلان بعد سبعة أشهر من تقديم الشركة لهذه التقنية لأول مرة.
يمكن لمشتركي باقات “Plus”، “Team”، و “Pro” في تطبيق ChatGPT الآن توجيه كاميرات هواتفهم نحو الأجسام أو العناصر المختلفة للحصول على استجابة فورية من التطبيق.
كما يستطيع ChatGPT أيضاً تحليل الشاشة نفسها عبر ميزة “مشاركة الشاشة”، ما يسمح بشرح قوائم الإعدادات أو تقديم حلول لمسائل رياضية معقدة، وفقًا لتقرير نشره موقع “تك كرانش”.
و لتفعيل ميزة فهم مقاطع الفيديو والصور على تطبيق ChatGPT، يمكن اتباع الخطوات التالية:
اضغط على رمز الصوت بجانب شريط المحادثة.
اختر رمز الفيديو أسفل الشاشة لبدء وضع الفيديو.
لمشاركة الشاشة، توجه إلى قائمة النقاط الثلاث واختر “مشاركة الشاشة”.
وأوضحت OpenAI أن إطلاق الميزة بدأ يوم الخميس وستكتمل خلال أسبوع. ومع ذلك، لن تكون الميزة متاحة لجميع المستخدمين على الفور، حيث ستُتاح فقط لمشتركي “ChatGPT Enterprise” و”Edu” اعتبارًا من يناير المقبل.
ورغم أن التقنية قدمت عرضًا مميزًا في فهم الرسومات البسيطة، مثل الأشكال التشريحية التي يرسمها المستخدم، إلا أن هناك بعض الأخطاء التي ارتكبتها التقنية، مثل خطأ في حل مسألة هندسية.
كما كشفت شركة Google عن مشروعها الجديد “Project Astra” الذي يجمع بين المحادثة بالذكاء الاصطناعي وتحليل الفيديو في الوقت الفعلي، مما يضع OpenAI أمام تحدٍ أكبر في مجال الذكاء الاصطناعي.
كجزء من تحديثات أخرى، قدمت OpenAI ميزة “وضع سانتا”، التي تضيف صوت شخصية “سانتا كلوز” كخيار صوتي مميز، مما يعكس التزام الشركة بتطوير تقنيات الذكاء الاصطناعي بشكل أكثر تفاعليًا وواقعيًا.
من خلال هذه الميزة الجديدة، تسعى OpenAI إلى تعزيز قدرتها التنافسية في مجال الذكاء الاصطناعي، مع تحقيق فهم أعمق وأكثر تفاعلية للعالم الحقيقي.