لتعزيز قدراتها الذكية.. غوغل تدرب روبوتاتها باستخدام Gemini AI

detafour 15 يوليو 2024

0 دقيقة واحدة

تعمل شركة غوغل على تحسين قدرات روبوتاتها باستخدام الذكاء الاصطناعي Gemini AI، حيث أوضح فريق الروبوتات في شركة DeepMind في ورقة بحثية جديدة كيفية استخدام نافذة السياق الطويلة في Gemini 1.5 Pro.

هذه النافذة تحدد مقدار المعلومات التي يمكن لنموذج الذكاء الاصطناعي معالجتها، مما يسمح للمستخدمين بالتفاعل بسهولة أكبر مع روبوتات RT-2 باستخدام تعليمات اللغة الطبيعية.

تعمل التقنية عن طريق تصوير جولة فيديو لمنطقة محددة، مثل المنزل أو مساحة المكتب، حيث يشاهد الروبوت الفيديو للتعرف على البيئة. بعد ذلك، يمكن للروبوت تنفيذ الأوامر بناءً على ما لاحظه باستخدام مخرجات لفظية أو صورية، مثل توجيه المستخدمين إلى منفذ طاقة عند عرض هاتف عليه وسؤاله “أين يمكنني شحنه؟”.

و حقق الروبوت الذي يعمل بنظام Gemini معدل نجاح بنسبة 90% عبر أكثر من 50 تعليمًا للمستخدم في منطقة تزيد مساحتها عن 9000 قدم مربع.

أظهرت الأبحاث أن برنامج Gemini 1.5 Pro مكّن الروبوتات من التخطيط لتنفيذ التعليمات بما يتجاوز مجرد التوجيه. على سبيل المثال، عند سؤال مستخدم لديه الكثير من علب الكوكاكولا على مكتبه الروبوت عما إذا كان مشروبه المفضل متاحًا، يعرف الروبوت أنه يجب عليه التنقل إلى الثلاجة، والتحقق من وجود علب كوكاكولا، ثم يعود لإبلاغ المستخدم بالنتيجة.

على الرغم من أن العروض التوضيحية بالفيديو التي تقدمها غوغل تبدو مثيرة للإعجاب، إلا أن الروبوت يستغرق ما بين 10 إلى 30 ثانية لمعالجة هذه التعليمات، مما يشير إلى أنه قد يستغرق بعض الوقت قبل أن نتمكن من مشاركة منازلنا مع روبوتات أكثر تقدمًا في رسم الخرائط البيئية، ولكنها قد تكون قادرة على العثور على مفاتيحنا أو محافظنا المفقودة في المستقبل.

detafour 15 يوليو 2024

0 دقيقة واحدة