
أعلنت شركة OpenAI عن إطلاق نموذجين جديدين من نماذج الذكاء الاصطناعي مفتوحة الأوزان، وتحمل هذه النماذج خصائص مشابهة لسلسلة نماذجها المغلقة المعروفة بالفئة o-series، والجدير بالذكر أن الشركة أكدت توفر النموذجين للتنزيل المجاني عبر منصة “Hugging Face” ووصفتهم بأنهم الأفضل في فئتهم بناءً على مقاييس محددة لأداء النماذج مفتوحة المصدر.
النموذجان الجديدان هما gpt-oss-120b، وهو نموذج كبير وقوي يمكن تشغيله على وحدة معالجة رسوميات واحدة من نوع Nvidia، بينما الثاني gpt-oss-20b يعتبر نموذجًا أخف يمكن تشغيله على أي جهاز لابتوب عادي بذاكرة عشوائية لا تقل عن 16 جيجابايت، وتعتبر هذه الخطوة الأولى من نوعها لطرح نموذج لغوي مفتوح منذ إطلاق GPT-2 في عام 2019، حيث تم التأكيد على قدرة النماذج الجديدة على معالجة استفسارات معقدة عبر النماذج السحابية المغلقة مما يتيح دمجها لمهام مثل تحليل الصور.
رغم أن OpenAI بدأت بشكل مفتوح، فقد اتجهت لاحقًا إلى تطوير نماذج مغلقة تهدف لتحقيق أرباح عبر واجهات برمجة التطبيقات، لكن الرئيس التنفيذي سام ألتمان أشار في يناير الماضي إلى ضرورة العودة إلى قيم الانفتاح، خاصة فيما يتعلق بقضايا المصدر المفتوح. تواجه الشركة ضغوطًا متزايدة من منافسيها في الصين مثل DeepSeek وQwen من علي بابا، والتي بدأت بإصدار نماذج مفتوحة تعتبر من بين الأفراد الأقوى على الساحة.
في اختبار Codeforces للبرمجة التنافسية، سجل النموذج gpt-oss-120b درجة 2622 وgpt-oss-20b درجة 2516، مما يعتبر أداءً أفضل من DeepSeek R1 لكنه لا يزال أقل من نماذج OpenAI المغلقة o3 وo4-mini. وفي اختبار Humanity’s Last Exam، حصل gpt-oss-120b على 19% وgpt-oss-20b على 17.3%، وهذا الأداء يتفوق على بعض النماذج المفتوحة لكنه يظل دون مستوى النماذج المغلقة الحديثة.
رغم هذه الإنجازات، تعاني النماذج الجديدة من معدلات “هلوسة” مرتفعة، حيث أظهرت gpt-oss-120b معدل هلوسة 49% بينما سجلت gpt-oss-20b 53%، بالمقارنة مع 16% لنموذج o1 و36% لأحدث نماذجها. وتعود OpenAI السبب وراء ذلك إلى نقص المعرفة العالمية في النماذج الأصغر حجمًا.
استخدمت OpenAI تقنيات مشابهة لتلك المستخدمة في نماذجها المغلقة مثل نظام Mixture-of-Experts، حيث يتم تفعيل عدد أقل من المعاملات لكل كلمة ما يسهم في تحسين الكفاءة، يعد نموذج gpt-oss-120b مخصصًا لـ117 مليار معامل لكنه يشغل 5.1 مليار فقط في كل عملية، كما تم استخدام تقنيات التعلم المعزز لتعزيز قدرة النموذج على التمييز بين الصواب والخطأ، بينما تقتصر قدرة النماذج على معالجة النصوص فقط دون القدرة على التعامل مع الصور أو الأصوات.
النماذج الجديدة متاحة بموجب رخصة Apache 2.0، التي تسمح باستخدامها التجاري بحرية دون الحاجة للحصول على إذن مسبق، ومع ذلك، لن تُفصح OpenAI عن بيانات التدريب بسبب القضايا القانونية المتعلقة باستخدام محتوى محمي في تدريب نماذجها. وقد أكدت الشركة تأجيل إطلاق هذه النماذج لأسباب تتعلق بالأمان، إذ أظهرت الاختبارات أن النماذج قد تزيد من قدرات المستخدمين قليلاً في مجالات حساسة لكن لم تصل إلى مستوى “الخطورة العالية”.
مع تزايد المنافسة في هذه الصناعة، يتطلع المطورون حول العالم لصدور نموذج DeepSeek R2 ونموذج جديد من مختبر Meta للذكاء الفائق.