ذكاء اصطناعي

OpenAI تُطلق O3-Pro: النموذج الأذكى حتى الآن يفكر أسرع ويحل أعقد المسائل

OpenAI تُطلق O3-Pro: النموذج الأذكى حتى الآن يفكر أسرع ويحل أعقد المسائل
مجد الشيخ
مجد الشيخ

3 د

أطلقت شركة "أوبن إيه آي" نموذجها الجديد o3-pro الأكثر تطورًا في الذكاء الاصطناعي.

يعتمد النموذج على التفكير المنطقي، ويستخدم في البرمجة والرياضيات والعلوم الطبيعية.

ستمنح المؤسسات التعليمية والشركات إمكانية الوصول إلى النموذج اعتبارًا من الأسبوع المقبل.

تعتبر الشركة o3-pro متفوقًا على نماذج الشركات الأخرى في اختبارات الأداء.

واجه النموذج الجديد تحديات تقنية ويحتاج وقتًا أطول في الاستجابة مقارنة بالنموذج السابق.

أعلنت شركة "أوبن إيه آي" إطلاق نموذجها الجديد o3-pro، والذي وصفته بأنه النموذج الأكثر تطورًا وقدرة على الإطلاق، في خطوة تعكس السباق المتسارع بمجال الذكاء الاصطناعي التوليدي وتطوير النماذج اللغوية المتقدمة. ويعد هذا النموذج بمثابة ترقية هائلة لنموذجها السابق "o3" الذي برع سابقًا في مهام التفكير المنطقي والخطوات الحسابية المعقدة.

ولكن ماذا يُقصد تحديدًا بـ "نماذج التفكير المنطقي"؟ ببساطة، هي أنظمة ذكاء اصطناعي تتعامل مع المسائل والمشكلات خطوة بخطوة، مثلما يفكر الإنسان في حل تمرين رياضي أو معادلة فيزيائية. وبفضل هذه القدرة على الاستنتاج التدريجي، تصبح هذه النماذج مفيدة بشكل خاص في مجالات تقنية وعلمية مثل البرمجة والرياضيات والعلوم الطبيعية.

هذا الأمر يربط بين خطة الشركة الحالية وطموحاتها المستقبلية، حيث تسعى "أوبن إيه آي" للبقاء رائدة في السوق عبر تقديم تحسينات كبيرة على خدماتها السابقة. ومنذ الثلاثاء الحالي، أصبح النموذج الجديد o3-pro مُتاحًا للمستخدمين المنضمين لخطط ChatGPT Pro وفرق العمل (Team). وستُمنح المؤسسات التعليمية والشركات إمكانية الوصول الأسبوع المقبل، إضافة إلى توفره للمطورين من خلال واجهة برمجة التطبيقات (API).

وحددت "أوبن إيه آي" تسعير النموذج الجديد بـ 20 دولارًا لكل مليون رمز إدخال (Input tokens)، و80 دولارًا لكل مليون رمز ناتج (Output tokens). ولتوضيح ما المقصود بـ "رمز": هو وحدة بسيطة من النص تتكون عادة من بضع حروف أو كلمات قصيرة، والمليون رمز يعادل تقريبًا 750 ألف كلمة، وهو حجمٌ أكبر بقليل من رواية "الحرب والسلام" الشهيرة.

لكن ماذا عن ميزات الأداء؟ تؤكد "أوبن إيه آي" عبر اختبارات أجرتها أنّ مراجعيها الخبراء يفضلون o3-pro باستمرار على النسخة السابقة من "o3"، خصوصًا في المجالات الحيوية مثل البرمجة، العلوم، التعليم، الأعمال، والمساعدة في الكتابة. وتلقى النموذج تقييمات مرتفعة فيما يتعلق بالدقة والوضوح والتزام التعليمات وجودة المحتوى.

ويبقى السؤال: على مستوى الأداء الواقعي، هل يمكنه منافسة الشركات العملاقة الأخرى؟ الجواب: نعم وبجدارة! في تنافس واضح لأكبر نماذج الذكاء الاصطناعي العالمية، تمكن o3-pro – بحسب الاختبارات الداخلية للشركة – من التفوق على النموذج الأقوى لدى جوجل "Gemini 2.5 Pro" في اختبار القدرات الرياضية AIME 2024. كذلك تغلب o3-pro على نموذج "Claude 4 Opus" الأحدث من شركة Anthropic في اختبار GPQA Diamond، المخصص للحكم على المعرفة العلمية على مستوى الدكتوراه.

مع ذلك، لا تخلو الصورة من تحديات؛ فشركة "أوبن إيه آي" حذرت أن النموذج الجديد يتطلب وقتًا أطول في تقديم ردوده مقارنة بالنموذج السابق o1-pro، ولم تدعم هذه النسخة بعد ميزات كإنشاء الصور أو استخدام مساحة عمل OpenAI Canvas المتطورة. كما واجه المستخدمون مؤخرًا بعض المشاكل التقنية المؤقتة أثناء إعطاء الأوامر في المحادثات المؤقتة مع النموذج.

ويأتي إصدار o3-pro في فترة مفصلية لشركة "أوبن إيه آي"، خاصة بعد تأجيل نموذجها المفتوح (Open Model)، الذي شغل الاهتمام وأثار توقعات عالية كونه النموذج الأول المفتوح المصدر الذي سيصدر عن الشركة منذ سنوات. وأوضح سام آلتمان ، الرئيس التنفيذي للشركة على منصة إكس (X - تويتر سابقًا)، أن التأجيل نتج عن اكتشافات مذهلة قام بها الفريق البحثي، وهو ما يستدعي توفير وقت إضافي لطرح النسخة المنتظرة بجودة لا تضاهى.

ذو صلة

وبالنظر إلى الصورة الكاملة، نرى أن استراتيجية "أوبن إيه آي" الحالية تتجه نحو بناء نماذج تسمح للمستخدمين بإجراء عمليات بحث على الإنترنت، وتحليل الملفات، والتفاعل مع الأدوات المختلفة، وحتى "تذكر" بعض عناصر المحادثة السابقة لأغراض التخصيص وتحسين تجربة الاستخدام.

في نهاية الأمر، يجب أن نشير إلى أهمية الحرص على معالجة المشاكل التقنية الحالية بسرعة لضمان مستوى الخدمة الجيد للمستخدمين. كما يجدر إضافة المزيد من التوضيح في المستقبل حول الفروقات بين النماذج السابقة وهل تستحق الزيادات الملحوظة في الأسعار بالفعل؟ إجابات كهذه ستساعد المستخدمين على اتخاذ قرارات مستنيرة حول الخدمة والاشتراكات، وقد تكون الخطوة المقبلة المثالية لتعزيز الحوار بين الشركة وعملائها بشكل مستمر.

ذو صلة