تكنولوجيا

محاولة لتقليد الدماغ البشري .. ما هي الرؤية الحاسوبية؟

الرؤية الحاسوبية (Computer Vision) هي مجال من مجالات الذكاء الاصطناعي يستخدم التعلم الآلي والشبكات العصبية لتعليم أجهزة الكمبيوتر والأنظمة لاستخلاص معلومات ذات مغزى من الصور الرقمية ومقاطع الفيديو والمدخلات البصرية الأخرى – وتقديم توصيات أو اتخاذ إجراءات عندما يرون عيوبًا أو مشكلات.

تقوم الرؤية الحاسوبية بتدريب الآلات على أداء هذه الوظائف، ولكن يجب أن تفعل ذلك في وقت أقل بكثير باستخدام الكاميرات والبيانات والخوارزميات بدلاً من شبكية العين والأعصاب البصرية والقشرة البصرية.

كيف تعمل الرؤية الحاسوبية؟

تحتاج الرؤية الحاسوبية إلى الكثير من البيانات لتقليد قدرات الدماغ البشري المسؤول عن التعرف على الأشياء وتصنيفها.

ثم تقوم بإجراء تحليلات للبيانات مرارًا وتكرارًا حتى تميز الفروق وتتعرف في النهاية على الصور.

على سبيل المثال، لتدريب جهاز كمبيوتر على التعرف على إطارات السيارات، يجب تغذيته بكميات هائلة من صورها والعناصر المتعلقة بها لمعرفة الاختلافات والتعرف على الإطارات، خاصة تلك التي لا تحتوي على عيوب.

تُستخدم تقنيتان أساسيتان لتحقيق ذلك: نوع من التعلم الآلي يسمى التعلم العميق، والشبكة العصبية الالتفافية.

التعلم العميق

96fb5164 b32e 4fc9 9f8f 2b05266af60c Detafour

التعلم العميق هو نوع من تعلم الآلة يستخدم الشبكات العصبية، والتي تتكون من عدة طبقات من وحدات البرامج تسمى الخلايا العصبية الاصطناعية التي تعمل معًا داخل الكمبيوتر.

هذه الخلايا العصبية تستخدم الحسابات الرياضية لمعالجة جوانب مختلفة من بيانات الصورة تلقائيًا وتطوير فهم مشترك للصورة تدريجيًا.

الشبكة العصبية الالتفافية

تستخدم الشبكات العصبية الالتفافية (CNNs) نظاما لتصنيف البيانات المرئية وفهم الصورة بأكملها.

وهي تقوم بتحليل الصور على هيئة وحدات بكسل وتعطي كل بكسل قيمة تصنيفية. يتم إدخال القيمة لإجراء عملية رياضية تسمى الالتفاف وعمل تنبؤات حول ما يراه.

تطبيقات الرؤية الحاسوبية

هناك الكثير من الأبحاث التي يتم إجراؤها في مجال الرؤية الحاسوبية، لكنها لا تتوقف عند هذا الحد. تُظهر التطبيقات الواقعية مدى أهمية الرؤية الحاسوبية في المساعي المبذولة في مجالات الأعمال والترفيه والنقل والرعاية الصحية والحياة اليومية.

المحرك الرئيسي لنمو هذه التطبيقات هو تدفق المعلومات المرئية من الهواتف الذكية وأنظمة الأمن وكاميرات المرور وغيرها من الأجهزة المرئية.

تنشئ المعلومات قاعدة اختبار لتدريب تطبيقات الرؤية الحاسوبية ومنصة إطلاق لها لتصبح جزءًا من مجموعة من الأنشطة البشرية:

يعتمد تطوير المركبات ذاتية القيادة على الرؤية الحاسوبية لفهم المدخلات المرئية من كاميرات السيارة وأجهزة الاستشعار الأخرى.

من الضروري تحديد السيارات الأخرى وعلامات المرور وعلامات الحارات والمشاة والدراجات وجميع المعلومات المرئية الأخرى التي تتم مواجهتها على الطريق.

تقوم شركة آي بي إم (IBM) بتطبيق تقنية الرؤية الحاسوبية مع شركاء مثل Verizon لتسخير الذكاء الاصطناعي الذكي في مساعدة مصنّعي السيارات على تحديد عيوب الجودة قبل خروج السيارة من المصنع.

أمثلة على الرؤية الحاسوبية

e29fdf20 cf31 4b37 a2d2 337114f7f8c8 Detafour

لسوء الحظ، لا تملك الكثير من المنظمات الموارد اللازمة لتمويل مختبرات الرؤية الحاسوبية وإنشاء نماذج التعلم العميق والشبكات العصبية.

قد تفتقر أيضًا إلى القدرة الحاسوبية المطلوبة لمعالجة مجموعات ضخمة من البيانات المرئية. تساعد شركات مثل آي بي إم من خلال تقديم خدمات تطوير برامج الرؤية الحاسوبية.

توفر هذه الخدمات نماذج تعليمية مسبقة الصنع متاحة من السحابة – كما تخفف الطلب على موارد الحوسبة.

يتصل المستخدمون بالخدمات من خلال واجهة برمجة التطبيقات (API) ويستخدمونها لتطوير تطبيقات الرؤية الحاسوبية.

فيما يلي بعض الأمثلة على مهام الرؤية الحاسوبية الراسخة:

تصنيف الصور

تصنيف الصور هو أول تقنية رؤية حاسوبية يتم التعامل معها عن طريق تعلّم الآلة، وعلى الرغم من أنّ خوارزميّات تعلم الآلة كانت فعّالة في التعامل مع مشاكل البيانات المنظمة، فإنها كانت تعمل بشكل جيد فقط في المهامّ البسيطة مثل تصنيف الأشكال الهندسيّة المختلفة.

يمكن استخدام تصنيف الصور في تصنيف الأشعة السينيّة بأنها سرطانيّة أم لا، أو تصنيف رقم مكتوب بخطّ اليد (تصنيف متعدّد الفئات). أو تخصيص اسم لصورة وجه (تصنيف متعدّد الأصناف).

تحديد موقع الكائن واكتشافه

هي إحدى تقنيات الرؤية الحاسوبية التي تسمح لنا بتحديد نوع وموقع الكائنات في صورة أو فيديو وبالتالي تمكننا هذه التقنية من معرفة عدد الكائنات وتحديد كل عنصر من العناصر المكتشفة ضمن إطار، إضافة إلى تحديد موقع هذا العنصر.

لذلك تعد هذه التقنية أكثر صعوبة من تصنيف الصور، حيث غالبًا ما توجد كائنات متعدّدة من أنواع مختلفة في الصورة.

تُستخدم هذه التقنية بكثافة في تطبيقات مختلفة مثل السيارات ذاتيّة القيادة والروبوتات والواقع المعزز والتطبيقات الطبيّة.

ترميم الصورة

هي إحدى تقنيات الرؤية الحاسوبية التي تسمح لنا بترميم الأجزاء المفقودة أو التالفة من الصورة، ويمكن اعتبار هذه المهمة نوعًا من مرشح الصور.

على سبيل المثال: ترميم الصور الفوتوغرافيّة والأفلام بالأبيض والأسود القديمة والتالفة.

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى