ديب مايند تطلق Genie 3 نموذج تفاعلي جديد يقود مستقبل الذكاء الاصطناعي

ديب مايند تطلق Genie 3 نموذج تفاعلي جديد يقود مستقبل الذكاء الاصطناعي

كشفت شركة Google DeepMind عن نموذجها الجديد Genie 3، والذي يمثل خطوة بارزة نحو تحقيق الذكاء الاصطناعي العام، أي الذكاء القادر على محاكاة وظائف التفكير والتعلم البشرية. وأوضح شلومي فروختر، مدير الأبحاث في ديب مايند، خلال مؤتمر صحفي أن Genie 3 هو النموذج الأول القادر على إنشاء عوالم تفاعلية لحظية وعامّة، مما يجعله يتخطى نماذج الذكاء الاصطناعي المحدودة السابقة، بفضل قدرته على توليد عوالم فوتوغرافية واقعية أو خيالية بالكامل، بالإضافة إلى أي تركيبات بينهما.

يُعتبر Genie 3 تطويرًا جذريًا مقارنة بسابقه Genie 2، الذي كان يقتصر فقط على إنشاء بيئات جديدة لعوامل الذكاء الاصطناعي، كما أنه يستند إلى نموذج الفيديو Veo 3 الذي يتمتع بفهم متقدم للفيزياء. يسمح Genie 3 للمستخدمين بإنشاء عوالم ثلاثية الأبعاد تفاعلية بدقة 720p وبمعدل 24 إطارًا في الثانية، من خلال إدخال نصوص بسيطة، ويقدم ميزة جديدة تعرف بأحداث العوالم الموجهة بالنصوص، ما يمكّن المستخدمين من تعديل البيئة أثناء التفاعل معها.

من أهم إنجازات Genie 3 هي الحفاظ على التناسق الفيزيائي للعوالم التي يولّدها مع مرور الوقت، حيث تمكن النموذج من تذكر ما تم إنشاؤه سابقًا بصورة تلقائية ضمن عملية التعلم الذاتي. وفي إطار ذلك، أشار جاك باركر-هولدر، باحث في فريق الانفتاح في ديب مايند، إلى أن نماذج العوالم مثل Genie 3 تعتبر مفتاحًا للوصول إلى الذكاء الاصطناعي العام، خاصة بخصوص العوامل المجسّدة التي تتطلب محاكاة دقيقة ومعقدة.

يتعلم Genie 3 كيفية عمل العالم من خلال تحليل ما تم توليده سابقًا، مما يمنحه فهمًا للمنطق الفيزيائي كما يحدث عند سقوط الأجسام أو كيفية تفادي الاصطدامات. وأضاف فروختر أن النموذج يولّد العالم إطارًا تلو الآخر، باستخدام آلية توليد تلقائي متسلسل، مع اتخاذ قراراته بناءً على سياق الإطارات السابقة.

في تجارب عملية، تم دمج Genie 3 مع وكيل ذكاء عام متعدد العوالم يُسمى SIMA، حيث كُلِّف بإتمام مهام مثل الاقتراب من ضاغط القمامة الأخضر والمشي نحو الرافعة الحمراء، ونجح في تنفيذ تلك المهام بدقة عالية بفضل البيئة التفاعلية المتسقة التي تولدها Genie 3. تؤمن ديب مايند بأن التطبيقات المحتملة لهذا النموذج تتوسع لتشمل التعليم التفاعلي وألعاب الفيديو، فضلاً عن تصميم النماذج الأولية، كما يُعتبر Genie 3 أداة لتدريب عوامل ذكية قادرة على التعلم والتخطيط والاستكشاف وتحقيق الأهداف بشكل مستقل، وهي ميزات أساسية في الذكاء البشري.

رغم هذه الإنجازات، لا يزال Genie 3 يواجه بعض التحديات، مثل محدودية الزمن التفاعلي الذي لا يسمح له بدعم سوى دقائق قليلة من التفاعل المستمر، في حين تحتاج نماذج التدريب الواقعي إلى ساعات طويلة. كما أن الفيزياء ليست مثالية، إذ لم تُحاكي الثلوج بدقة في أحد العروض حركة متزلج على الجبل. بالإضافة إلى ذلك، رغم أن هناك إمكانية لإدخال أحداث بالنصوص، فإن هذه الأحداث ليست دائمًا من تنفيذ العامل الذكي.

اختتم باركر-هولدر حديثه بالإشارة إلى لحظة “Move 37” التاريخية في عام 2016 عندما أذهل نموذج AlphaGo العالم بلعبته غير التقليدية ضد بطل العالم في لعبة Go، مؤكدًا أن هذه اللحظة أصبحت رمزًا لقدرة الذكاء الاصطناعي على التفكير خارج النمط البشري. وقال إننا لم نصل بعد إلى لحظة مماثلة مع العوامل المجسّدة، لكن Genie 3 قد يُمثل بداية عصر جديد في هذا الاتجاه.