أوبن إيه آي تختبر نموذجاً جديداً لتحويل النص إلى فيديو
أعلنت “أوبن إيه آي” مطورة روبوت الدردشات المدعوم بالذكاء الاصطناعي “شات جي بي تي”، أنها تختبر نموذجاً جديداً يدعى “سورا – Sora” لتحويل النصوص إلى مقاطع فيديو واقعية عبر مجموعة بسيطة من الأوامر.
وقالت الشركة المدعومة من “مايكروسوفت” عبر موقعها الإلكتروني، إن نموذج “سورا” باستطاعته توليد مشاهد معقدة تحتوي على شخصيات متعددة، وأنواع معينة للحركة، وتفاصيل دقيقة حول الموضوعات وخلفياتها.
وأضافت أن النموذج الجديد لا يستوعب فقط طلبات المستخدم، بل يمتلك أيضاً فهماً لطبيعة وجود الأشياء في العالم المادي، كما يستطيع “سورا” توليد مقاطع فيديو تصل مدتها إلى دقيقة مع الحفاظ على جودتها البصرية، والالتزام بالأوامر.
وذكر “سام ألتمان” الرئيس التنفيذي لدى “أوبن إيه آي” في منشور على منصة “إكس”، أن شركته توفر إمكانية الوصول للنموذج لعدد محدود من المبدعين في مرحلة الاختبار.
وأوضحت “أوبن إيه آي” أن النموذج لديه بعض نقاط الضعف، حيث من المحتمل أن يجد صعوبة في فهم محاكاة فيزيائية أحد المشاهد المعقدة، وحالات بعينها من الأسباب والنتائج، وقد يخلط بين التفاصيل المتعلقة بالمكان والاتجاهات الموجودة في الأوامر.