OpenAI تعلن عن تقدم كبير في تطوير نظام ذكاء اصطناعي متقدم لخدمتك

OpenAI تعلن عن تقدم كبير في تطوير نظام ذكاء اصطناعي متقدم لخدمتك

بعد انضمامه إلى OpenAI كباحث في عام 2022، شهد هانتر لايتمان زملاءه وهم يطلقون ChatGPT، الذي يعد أحد أسرع المنتجات في عالم التكنولوجيا نموا، في الوقت نفسه، كان لايتمان يعمل بهدوء ضمن فريق متخصص في تعليم نماذج الذكاء الاصطناعي كيفية حل مسائل رياضيات الأولمبياد. اليوم، يُعرف هذا الفريق باسم MathGen، ويعتبر ركيزة أساسية في مساعي OpenAI لتطوير نماذج قادرة على التفكير والاستنتاج، وهو ما يمثل جوهر فكرة وكلاء الذكاء الاصطناعي، أي الأنظمة التي تستطيع إنجاز المهام الرقمية كما يفعل الإنسان.

قال لايتمان: كنا نحاول تحسين قدرة النماذج على التفكير الرياضي، ولم تكن جيدة في ذلك الوقت، ورغم أن نماذج OpenAI لا تزال بعيدة عن الكمال، إذ أنها تخطئ أحيانًا وتفشل في أداء مهام معقدة، إلا أن أدائها شهد تطورًا لافتًا، حيث نجح أحد هذه النماذج مؤخرًا في الحصول على ميدالية ذهبية في أولمبياد الرياضيات العالمي.

تعتبر OpenAI أن هذه القدرات المنطقية ستفتح الطريق نحو تطوير وكلاء عامين يمكنهم تنفيذ مهام متعددة بكفاءة عالية، كما أضاف الرئيس التنفيذي سام ألتمان خلال مؤتمر المطورين الأول في 2023 بأن المستقبل سيشهد طلب الناس من الكمبيوتر أن يقوم بكل المهام نيابةً عنهم، وهذا يمثل قفزة هائلة للأمام. ورغم أن هذه الرؤية لا تزال قيد التحقيق، فإن OpenAI حققت قفزة نوعية بإطلاق أول نموذج استدلالي لها يسمى “o1” في خريف 2024، وهو الأمر الذي جعل الباحثين الـ21 الذين عملوا على تطويره في صدارة الأسماء المطلوبة في وادي السيليكون، حيث استقطب مارك زوكربيرج خمسة منهم للعمل في وحدة الذكاء الفائق الجديدة في ميتا بعروض تصل قيمتها إلى أكثر من 100 مليون دولار.

ترتبط نماذج الاستدلال الحديثة بتقنية “التعلم المعزز”، التي تُقيم اختيارات النموذج من خلال بيئات محاكاة، وهذه التقنية قديمة نسبيًا، فقد استخدمتها جوجل ديب مايند لتطوير AlphaGo الذي هزم بطل العالم في لعبة “غو” عام 2016. ومنذ عام 2015، بدأ باحثو OpenAI في التفكير في كيفية استغلال هذه التقنية لبناء وكيل يمكنه استخدام الكمبيوتر كما يفعل الإنسان، ولكنهم احتاجوا لسنوات من البحث وتطوير النماذج والأساليب.

في عام 2018، طورت OpenAI أول نموذج لغوي ضخم من سلسلة GPT، ورغم براعته في معالجة النصوص، إلا أنه كان ضعيفًا في حل المسائل الرياضية. جاءت القفزة الكبرى في عام 2023، حيث جمعت الشركة بين النماذج اللغوية الكبيرة والتعلم المعزز وتقنية جديدة تسمى “الحوسبة عند وقت الاختبار”، ما سمح للنموذج بالتخطيط والتحقق من خطواته قبل تقديم الإجابة، وهنا ظهرت تقنية “سلسلة التفكير” التي حسّنت بشكل كبير أداء الذكاء الاصطناعي في حل المسائل غير المسبوقة.

يقول أحد الباحثين: كنت أرى النموذج يلاحظ أخطاءه ويعيد التفكير، وكأنك تقرأ أفكار شخص حقيقي، ورغم أن هذه الأساليب ليست جديدة في حد ذاتها، إلا أن OpenAI كانت أول من جمعت بينها بنجاح في نموذج “Strawberry” الذي قاد مباشرةً إلى تطوير “o1”.

بعد النجاح الأولي، أنشأت OpenAI فريق “Agents” بقيادة دانيال سيلسام، بينما كان الهدف هو بناء أنظمة قادرة على تنفيذ مهام معقدة، ولم تميز الشركة حينها بين “النماذج الاستدلالية” و”الوكلاء”، بل كانت تطور القدرات ذاتها. شارك في تطوير “o1” شخصيات بارزة مثل إيليا سوتسكيفر ومارك تشن وجاكوب باتشوتسكي، وقد تطلب تطوير “o1” تخصيص موارد ضخمة، خاصة من حيث المعالجات والكوادر البشرية، وتفيد شهادات من داخل الشركة أن مهمتها في تطوير ذكاء عام اصطناعي قد ساهمت في تسريع هذه الإنجازات، بعكس مختبرات أخرى تركز أكثر على المنتجات.

ضحايا الاستدلال في الذكاء الاصطناعي، فمع إدخال “o1″، أضافت OpenAI لمسة إنسانية على واجهة ChatGPT من خلال مصطلحات مثل التفكير والاستنتاج، ومع ذلك، لا يتفق الباحثون دائمًا على معنى الاستدلال الحقيقي في الذكاء الاصطناعي. يوضح لايتمان أن النماذج، إن أنجزت مهامًا صعبة، فهي تمارس شكلًا من أشكال الاستدلال، حتى لو كان مختلفًا عن الاستنتاج البشري التقليدي.

بينما يرى باحثون آخرون أن النماذج الاستدلالية تشبه الطائرات، فهي مستوحاة من الطبيعة لكنها لا تطير مثل الطيور، ومع ذلك تظل فعالة ومفيدة. حاليًا، يعمل وكلاء الذكاء الاصطناعي بشكل جيد في المجالات الدقيقة مثل البرمجة، مثل وكيل Codex من OpenAI ومساعد Claude Code من Anthropic، ولكنهم يجدون صعوبة في المهام ذات الطابع الشخصي مثل التسوق أو التخطيط للسفر.

يشير لايتمان إلى أن المشكلة تتعلق بالبيانات، حيث نحتاج لطرق جديدة لتدريب النماذج على مهام يصعب التحقق منها، ولفت إلى أن الشركة تطور تقنيات جديدة لتدريب النماذج على المهام الذاتية، وهي نفس الطريقة التي جعلت أحد نماذج OpenAI يحصل على الميدالية الذهبية في أولمبياد الرياضيات. وتعتمد هذه النماذج الجديدة على فكرة تعدد الوكلاء داخل النموذج ذاته، حيث يتعاون عدد من الوكلاء الداخليين في حل المشكلة ثم يختارون أفضل إجابة، وقد تبنت كل من غوغل وxAI تقنيات مشابهة لهذا الأمر مؤخرًا.

هذه الإنجازات قد تمهد الطريق لإطلاق GPT-5، الذي تعوّل عليه OpenAI لاستعادة تفوقها وسط منافسة شرسة من جوجل وأنثروبيك وxAI وميتا، ولكن إلى جانب القوة، تسعى الشركة أيضًا نحو البساطة، حيث تسعى لتطوير وكلاء يفهمون نوايا المستخدم دون الحاجة لتحديد إعدادات معقدة. يقول الباحثون إن الهدف النهائي هو إنشاء مساعد رقمي يفهمك وينفذ المهام عنك ويتفاعل مع الإنترنت بالنيابة عنك، باختصار، تحويل ChatGPT إلى مساعد رقمي شامل يمكنه فعل كل شيء.