إطلاق ChatGPT Image 1.5 يبدأ منافسة مفتوحة مع غوغل Nano Banana Pro

3 د
يتفوق نموذج Nano Banana Pro من غوغل في محاكاة الفيزياء الواقعية والوجوه البشرية الطبيعية، مبتعداً عن "اللمعة البلاستيكية" التي لا تزال تلازم مخرجات OpenAI.
رغم التطور، لا يزال الذكاء الاصطناعي يعاني من "هلوسة بصرية" في المخططات العلمية، وهو ما يذكرنا بـ سقطات التضليل المعلوماتي التي واجهها المحترفون في قطاعات أخرى.
حقق Nano Banana Pro قفزة نوعية في رسم النصوص المعقدة بوضوح 2K، بينما يتميز ChatGPT Image 1.
5 بالمرونة في اتباع الأوامر النصية الطويلة والكثيفة.
.
في زمن تتسابق فيه أدوات الذكاء الاصطناعي لإثبات قدرتها على الإبداع، عادت OpenAI بمحاولة جديدة لتحسين صورتها البصرية عبر تحديث Image 1.5. بدا التحديث كخطوة ناضجة في سباق طويل مع نماذج غوغل المتقدمة (مثل Nano Banana Pro)، لكنه كشف أيضاً عن انقسام فلسفي عميق؛ فبينما تسعى غوغل لصناعة "كاميرا رقمية" مثالية، تكتفي OpenAI بصناعة "ريشة رسام" عبقرية لكنها متمردة على قوانين الفيزياء.

ChatGPT Image 1.5: سرعة خارقة وأخطاء "بديهية"
يُظهر الإصدار الجديد Image 1.5 تحسّناً مذهلاً في سرعة التوليد، حيث أصبح العمل يتدفق بسلاسة أكبر عبر واجهة "Creative Studio" المخصصة. الميزة الأهم هنا هي "الثبات الهيكلي" (State Preservation)؛ إذ يمكنك الآن طلب تغيير لون القميص أو إضافة نظارات لشخصية ما مع ضمان بقاء ملامح الوجه والبرقراوند كما هي بنسبة نجاح عالية. ومع ذلك، لا تزال "الهلوسة البصرية" تمثل ثغرة أمنية في مصداقية النموذج.

في اختبارات المراجعة، فشل النموذج في رسم دورة مياه صحيحة؛ حيث كانت الأسهم تشير لاتجاهات خاطئة رغم وضوح النصوص. هذا النوع من "العمى المنطقي" يذكرنا بالتحذيرات التي أطلقناها سابقاً حول هلوسة الذكاء الاصطناعي في المهن الحساسة؛ فكما يخترع المحامي "أحكاماً وهمية"، يخترع المصمم الرقمي "فيزياءً وهمية" قد تضلل الطلاب أو الباحثين.
Google Nano Banana Pro: ملك التفاصيل والفيزياء
على الجانب الآخر، يبدو أن غوغل قررت حسم معركة "الواقعية". نموذج Nano Banana Pro (المبني على عائلة Gemini 3) ليس مجرد مولد صور، بل هو نظام يفهم "ديناميكيات السوائل" وتفاعل الضوء بشكل أقرب للواقع. مخرجات غوغل تفتقر لتلك "اللمعة البلاستيكية" الشهيرة في وجوه الأشخاص داخل صور ChatGPT، وتقدم بدلاً منها أنسجة جلدية (Textured Skin) تجعل من الصعب على العين غير المدربة تمييزها عن الصور الفوتوغرافية الحقيقية.
المواجهة المباشرة: أين تضع رهانك؟
بينما يتفوق ChatGPT في "اتساق الشخصيات" عبر عدة صور (Character Consistency)، يكتسح Nano Banana Pro في معركة "Typography"؛ فإذا كنت تصمم ملصقاً تعليمياً أو غلاف كتاب يحتاج لنصوص دقيقة بلغات متعددة، فإن غوغل هي وجهتك الآمنة. أما إذا كان مشروعك يحتاج لروح فنية، أسلوب "ستوديو غيبلي"، أو تصميمات خيالية جريئة، فإن لمسة OpenAI الإبداعية لا تزال الأكثر سحراً وجاذبية للمستخدمين العاديين.
حدود الأتمتة واليقظة البشرية
في النهاية، تثبت رحلة الإصدار 1.5 أن OpenAI تتعلم بسرعة، لكنها تذكرنا أيضاً بأن الإبداع البصري للخوارزميات لا يزال يفتقر إلى "الحس السليم". وكما حذرت مايكروسوفت مستخدميها بضرورة الموافقة الصريحة قبل وصول الذكاء الاصطناعي للملفات، يجب على المصممين ممارسة "الموافقة الواعية" قبل قبول مخرجات هذه النماذج كحقائق بصرية مطلقة.
المسألة اليوم ليست سباقاً نحو الكمال، بل هي رحلة نحو فهم جديد لما تعنيه الصورة حين تولد من خوارزمية. الذكاء الحقيقي لا يكمن في سرعة التوليد، بل في قدرة الإنسان على رصد "الهلوسة" وسط بريق الألوان الرقمية.









