بعد فترة قصيرة من إطلاق OpenAI لنموذج الذكاء الاصطناعي “الاستدلالي” o1، بدأ المستخدمون يلاحظون ظاهرة غريبة:
في بعض الأحيان، كان النموذج يبدأ في “التفكير” بلغات غير اللغة التي تم طرح السؤال بها، مثل الصينية أو الفارسية، حتى عندما كان السؤال مكتوبًا باللغة الإنجليزية.
هذه الظاهرة ظهرت عندما واجه o1 مشكلة من نوع معين، مثل سؤال حول عدد حروف الراء في كلمة “فراولة”. أثناء عملية الاستدلال، كان النموذج ينفذ خطوات بلغة أخرى قبل الوصول إلى استنتاجه.
و على الرغم من أن الإجابة النهائية كانت دائمًا باللغة الإنجليزية، فإن بعض خطوات التفكير تمت بلغة أخرى.
أحد المستخدمين على منصة Reddit أشار إلى أن o1 “بدأ بشكل عشوائي يفكر باللغة الصينية في منتصف الطريق”، في حين تساءل آخر على منصة X: “لماذا بدأ o1 في التفكير باللغة الصينية بشكل عشوائي؟ لم يكن هناك أي جزء من المحادثة باللغة الصينية.”
حتى الآن، لم تقدم OpenAI أي تفسير لهذا السلوك الغريب أو تعترف به علنًا. ومع ذلك، ظهرت بعض النظريات التي تحاول تفسير هذا الظرف.
أشار العديد من الأشخاص على منصة X، بما في ذلك كليمنت ديلانج، الرئيس التنفيذي لشركة Hugging Face، إلى أن النماذج مثل o1 يتم تدريبها على مجموعات بيانات تحتوي على العديد من النصوص بلغة الصينية.
هذا يشير إلى أن بعض التأثيرات اللغوية قد تنتقل إلى طريقة عمل النموذج خلال عملية الاستدلال.
الباحث في Google DeepMind، تيد شياو، اعتبر أن هذا التحول في التفكير إلى اللغة الصينية قد يكون نتيجة لتوظيف شركات خارجية لتصنيف البيانات، والتي غالبًا ما تكون مقراتها في الصين.
وكتب شياو في منشور على X: “العديد من الشركات مثل OpenAI وAnthropic تستخدم خدمات تصنيف البيانات الخارجية، حيث يتوفر العمال المتخصصون بتكلفة منخفضة، مما يجعل الصين وجهة رئيسية لهذه الخدمات.”
أيضًا، تلعب التعليقات التوضيحية دورًا في تدريب النماذج على فهم البيانات وتفسيرها. الدراسات أظهرت أن التعليقات المتحيزة يمكن أن تؤدي إلى نماذج متحيزة أيضًا.
ماثيو جوزديال، الباحث في الذكاء الاصطناعي بجامعة ألبرتا، أشار إلى أن النموذج لا يعالج اللغة بالمعنى التقليدي، بل يعالج النصوص باستخدام الرموز.
“النموذج لا يعرف ما هي اللغة، أو أن اللغات مختلفة. كل شيء يتعلق بالنص فقط”، يقول جوزديال. هذه الرموز قد تكون كلمات، أو مقاطع لفظية، أو حتى حروف فردية.
المهندس تيزين وانج من شركة Hugging Face اتفق مع جوزديال، موضحًا أن التناقضات اللغوية في النماذج يمكن أن تفسر من خلال الارتباطات التي تم إنشاؤها أثناء عملية التدريب.
وأضاف: “من خلال تبني كل الفروق الدقيقة اللغوية، نقوم بتوسيع نطاق فهم النموذج للعالم، مما يسمح له بالتعلم من الطيف الكامل للمعرفة البشرية.”