أطلقت شركة Anthropic نموذجًا جديدًا للذكاء الاصطناعي “يفكر” فقط عندما تريد

5 د
أطلقت أنتروبيك نموذج Claude 3,7 Sonnet، وهو أول نموذج ذكاء اصطناعي هجين يجمع بين الإجابة الفورية والتفكير العميق وفقًا لاختيار المستخدم.
يتميز النموذج بأداء متقدم، متفوقًا على منافسيه في اختبارات البرمجة والتفاعل مع المستخدمين.
يتيح للمستخدمين رؤية خطوات التفكير بوضوح، مع تقليل نسبة الرفض غير الضروري للأسئلة بنسبة 45%.
قدمت الشركة أيضًا أداة Claude Code للمطورين، والتي تتيح تنفيذ المهام البرمجية مباشرة من سطر الأوامر.
بعد أن أعلنت شركة OpenAI عن إلغاء نموذج الذكاء الاصطناعي O3 لصالح إصدار GPT-5 في الأسابيع أو الأشهر المقبلة، أعلنت شركة أنتروبيك عن إطلاق نموذج الذكاء الاصطناعي الجديد Claude 3.7 Sonnet، الذي يُعدّ طفرة جديدة في مجال الذكاء الاصطناعي، حيث يمنح المستخدمين إمكانية التحكم في طريقة استجابته، سواء عبر إجابات سريعة وفورية أو عبر تحليل معمّق يأخذ وقتًا أطول للوصول إلى إجابة مدروسة.
وصفت أنتروبيك هذا النموذج بأنه "أول نموذج هجين في مجال الذكاء الاصطناعي الاستنتاجي"، إذ يجمع بين القدرة على الإجابة الفورية والقدرة على التفكير المعمّق وفقاً لرغبة المستخدم. يمكن لمستخدمي Claude 3.7 Sonnet تفعيل وضع "التفكير"، مما يسمح للنموذج بتحليل الأسئلة لفترة قصيرة أو طويلة قبل تقديم الإجابة.
تبسيط تجربة المستخدم وإلغاء الحاجة لاختيار النماذج يدويًا
تسعى أنتروبيك إلى تبسيط تجربة المستخدم من خلال إزالة التعقيدات المتعلقة باختيار النماذج المختلفة، وهي مشكلة تواجه مستخدمي العديد من أدوات الذكاء الاصطناعي اليوم، حيث يتوجب عليهم الاختيار بين نماذج مختلفة تختلف في الأداء والتكلفة. الفكرة الأساسية التي تحاول الشركة تطبيقها هي جعل نموذج واحد يؤدي جميع الوظائف المطلوبة دون الحاجة إلى تدخل المستخدم في اختيار النموذج المناسب لكل مهمة.
سيتم توفير النموذج الجديد لجميع المستخدمين والمطورين بدءًا من يوم الاثنين، وفقًا لما أعلنته أنتروبيك. ومع ذلك، فإن ميزة التفكير المعمّق ستكون متاحة فقط لمشتركي الخطط المدفوعة من منصة Claude، بينما سيتمكن المستخدمون المجانيون من استخدام الإصدار العادي من Claude 3.7 Sonnet، الذي رغم ذلك يُقال إنه يتفوق على الإصدار السابق Claude 3.5 Sonnet.
التسعير والمقارنة مع النماذج المنافسة
بالنسبة للأسعار، فإن استخدام Claude 3.7 Sonnet سيكلف المستخدمين 3 دولارات لكل مليون "توكن" مدخلة (ما يعادل تقريبًا 750 ألف كلمة)، و15 دولارًا لكل مليون "توكن" مخرجة. ورغم أن هذا السعر أعلى من بعض النماذج المنافسة مثل o3-mini من OpenAI (بتكلفة 1.10 دولار لكل مليون توكن مدخل و4.40 دولار لكل مليون توكن مخرج) وDeepSeek R1 (بتكلفة 0.55 دولار لكل مليون توكن مدخل و2.19 دولار لكل مليون توكن مخرج)، فإن الفرق الأساسي هو أن تلك النماذج عبارة عن نماذج استنتاجية بحتة، في حين أن Claude 3.7 Sonnet هو نموذج هجين قادر على تنفيذ المهام الفورية والمعمقة في آن واحد.
كيف يعمل النموذج الجديد؟
يعتمد Claude 3.7 Sonnet على أسلوب استنتاجي متطور، حيث يُحلل الأسئلة عبر تفكيكها إلى خطوات أصغر، مما يساعد في تحسين دقة الإجابة النهائية. رغم أن النموذج لا "يفكر" تمامًا كما يفعل البشر، إلا أن أسلوبه يشبه الاستنتاج البشري القائم على التحليل المنطقي.
تُعد هذه التقنية مشابهة لما تقدّمه نماذج أخرى مثل o3-mini من OpenAI وGrok 3 (Think) من xAI وGemini 2.0 Flash Thinking من جوجل، حيث تعتمد جميعها على تخصيص وقت إضافي لمعالجة الأسئلة الأكثر تعقيدًا، مما يؤدي إلى إجابات أكثر دقة.
الهدف المستقبلي: نموذج يفكر ذاتيًا دون تدخل المستخدم
وفقًا لما صرحت به ديان بين، رئيسة قسم المنتجات والأبحاث في أنتروبيك، فإن الشركة تعمل على تطوير ذكاء اصطناعي قادر على تحديد الوقت اللازم للتفكير تلقائيًا دون الحاجة إلى تدخل المستخدم. بمعنى آخر، بدلاً من أن يختار المستخدم وضع التفكير يدويًا، سيقوم النموذج نفسه بتحديد الوقت المثالي لتحليل كل سؤال بناءً على تعقيده.
توضح الشركة رؤيتها في هذا المجال عبر مدونتها الرسمية بقولها:
"كما أن الإنسان لا يمتلك دماغين منفصلين للأسئلة التي تحتاج إلى إجابة فورية وأخرى تتطلب تفكيرًا معمقًا، نرى أن القدرة على التفكير يجب أن تكون جزءًا من النموذج ذاته، وليس ميزة منفصلة."
إحدى الميزات البارزة في Claude 3.7 Sonnet هي تقديم "لوحة تخطيط مرئية"، حيث سيتمكن المستخدمون من رؤية طريقة تفكير الذكاء الاصطناعي أثناء معالجة الأسئلة، مع الإشارة إلى أن بعض التفاصيل قد تكون محجوبة لأسباب تتعلق بالخصوصية والأمان.
نتائج الأداء: تفوق على النماذج المنافسة
في اختبارات الأداء، حقق Claude 3.7 Sonnet نتائج ملحوظة مقارنة بالنماذج المنافسة:
- في اختبار SWE-Bench المخصص لتقييم أداء الذكاء الاصطناعي في البرمجة الحقيقية، حصل النموذج على دقة بنسبة 62.3%، متفوقًا على نموذج o3-mini من OpenAI الذي سجل 49.3% فقط.
- في اختبار TAU-Bench، الذي يقيس قدرة الذكاء الاصطناعي على التفاعل مع المستخدمين في بيئة تجارة إلكترونية، سجل النموذج 81.2%، متجاوزًا نموذج o1 من OpenAI الذي حصل على 73.5%.
تقليل الرفض غير الضروري للاستفسارات
ميزة أخرى مثيرة للاهتمام هي أن Claude 3.7 Sonnet سيرفض الإجابة عن الأسئلة الحساسة بنسبة أقل مقارنة بالإصدارات السابقة. حيث قامت الشركة بتقليل نسبة الرفض غير الضروري بنسبة 45% مقارنة بـ Claude 3.5 Sonnet، مما يعني أن النموذج أصبح أكثر قدرة على التفرقة بين الطلبات الضارة والمحتوى الآمن.
إطلاق أداة البرمجة الذكية "Claude Code"
إلى جانب Claude 3.7 Sonnet، أطلقت أنتروبيك أداة برمجية جديدة باسم Claude Code، وهي موجهة للمطورين، وتتيح لهم تنفيذ مهام برمجية مباشرة من خلال سطر الأوامر (Terminal).
يمكن للمطورين استخدام Claude Code لأداء مهام مثل:
- تحليل هيكلية المشاريع البرمجية باستخدام أوامر بسيطة مثل: "اشرح بنية هذا المشروع".
- تعديل شيفرات برمجية باستخدام اللغة الطبيعية.
- اختبار الأكواد بحثًا عن الأخطاء البرمجية.
- رفع التعديلات مباشرة إلى مستودعات GitHub.
ستتوفر أداة Claude Code لعدد محدود من المستخدمين في البداية، وفقًا لما أعلنته الشركة.
هل تستطيع أنتروبيك البقاء في الصدارة؟
يأتي إطلاق Claude 3.7 Sonnet في وقت يشهد تسارعًا هائلًا في تطوير نماذج الذكاء الاصطناعي، حيث تتنافس الشركات التقنية على إصدار نماذج أكثر كفاءة وأمانًا. رغم أن أنتروبيك عُرفت بتوجهها الحذر الذي يركز على الأمان والموثوقية، إلا أن إطلاق هذا النموذج الجديد يظهر رغبتها في تحدي المنافسين والمضي قدمًا في سباق الابتكار.
لكن السؤال الأهم هو: إلى متى ستتمكن أنتروبيك من الاحتفاظ بهذا التفوق؟، خاصة مع التسريبات التي تشير إلى أن OpenAI قد تكون قريبة من إطلاق نموذجها الهجين الخاص خلال الأشهر المقبلة.