مقارنة شاملة بين أداة الصور الجديدة من جيميني وتشات جي بي تي: أيهما يتفوق بجدارة؟

4 د
تسعى تقنية “نانو بانانا” من غوغل للهيمنة في مجال توليد الصور بالذكاء الاصطناعي.
تتميز نانو بانانا بقدرتها على الحفاظ على التفاصيل الواقعية والانسجام بين الصور.
سهولة الوصول لنانو بانانا عبر منصات متعددة تبرز قوتها وانتشارها الواسع.
تُظهر قدرة فائقة على دمج الصور بشكل سلس مع الحفاظ على الخلفيات الأصلية.
توفر الحلول الفورية وتنافس بقوة من حيث سرعة الأداء وجودة التفاصيل.
تعيش تقنيات الذكاء الاصطناعي اليوم سباقاً محموماً للسيطرة على سوق توليد الصور وتحريرها رقمياً، لكن قد لا يخطر ببال الكثيرين أن مسرح المنافسة الحقيقي لم يعد مقتصراً على الأسماء المعتادة مثل ChatGPT، إذ برزت أداة “نانو بانانا” المدمجة ضمن Gemini لدى غوغل، لتخرج برأسها بقوة وتعلن نفسها مرشحاً جدياً للصدارة. فما السبب في ذلك، وهل حقاً تستطيع نانو بانانا أن تتفوق على ما اعتدناه من ChatGPT في إبداع الصور؟
منذ أن أضافت شركة OpenAI خاصية توليد الصور الأصلية بشكلٍ مباشر داخل ChatGPT في مطلع العام، بدأنا نلحظ ثورة جديدة في عالم الصور الرقمية الذكية. بات بإمكان أي مستخدم صياغة وصف دقيق – لنقل، “قطة ترتدي خوذة رومانية أصيلة” – ليحصل خلال لحظات على رسم رقمي يوازي توقعاته أو يفاجئه بإبداعه. وهنا يأتي دور “نانو بانانا” التي كانت مجرد اسم رمزي داخلي لمحرك توليد الصور “Gemini Flash 2.5” أثناء مرحلة اختباره. لكن المفاجأة أن غوغل لم تلجأ لاستبدال الاسم، بل أضفته رسمياً في Gemini، مع أيقونة الموزة الصفراء تميز الأداة وتبث روح المرح في عالم التقنية الجاد.
ميزة الانتشار الواسع
ما يلفت الانتباه فوراً أن الوصول إلى نانو بانانا متاح عبر أكثر من بوابة. يستطيع الشخص استخدامها من خلال تطبيق Gemini نفسه، أو عبر الذهاب إلى استوديو الذكاء الاصطناعي المخصص من غوغل، أو حتى من موقع خاص بها. هذه الحرية تفتح الباب لاختبار الأداة من أي مكان تقريباً – سواء لهواة التصميم السريع أو حتى المحترفين الفضوليين. وهذا يذكّرنا بكيفية توسع خدمات ChatGPT في شتى السياقات الرقمية، ويعكس الرغبة المشتركة في جعل الذكاء الاصطناعي عصرياً وقريباً من جميع المستخدمين.
واقعية الصورة وثبات التفاصيل
ما يفرق حقاً، بحسب التجربة العملية، هو القدرة على الحفاظ على تفاصيل الشخصية التي تنشأ في الصورة الأولى خلال الطلبات المتتابعة لتوليد الصور. إذا ابتكر Gemini صورة قطة رومانية بفضل نانو بانانا ثم طُلب منه إدخال القطة ذاتها في مشهد جديد (مثلاً وسط المدرج الروماني)، تجد أن ملامح القطة والقبعة وكل العناصر الرئيسية بقيت على حالها بدقة مذهلة. على الجهة المقابلة، حين تكرر الأمر مع ChatGPT، لاحظنا أن التفاصيل بدأت تتغير قليلاً، مثل تغير شكل الخوذة أو المظهر العام للقطة – وكأن الأداة فقدت خيط التناسق البصري بين الصورتين. هذه النقطة أساسية، لأن الاتساق في التفاصيل أمر بالغ الأهمية لمحترفي التصميم وكل من يطمح للواقعية في السيناريوهات المعقدة.
استكمالاً لهذه النقطة، لا تقف قدرات نانو بانانا عند الإبداع من العدم فقط، بل تتفوق حين تطلب إدراج صورة حقيقية لشخص في بيئة جديدة – وليكن “على قمة جبل” مثلاً. في اختبار عملي، كانت صورة Gemini أقرب إلى الحقيقة وتعكس ملامح صاحب الصورة الأصلية بوضوح. أما توليد ChatGPT لنفس المشهد فقد بدا كأنه نسخة رقمية مبالغ فيها، بالإضافة إلى أن الشخص بدا أثخن مما هو عليه في الحقيقة! هذه الواقعية والإتقان في دمج الأشخاص والخلفيات ترفع من قيمة أداة غوغل الجديدة وتُقرِّبها أكثر من احتياجات المستخدم الحقيقي لتوليد الصور العصرية.
الدمج الذكي بين الصور مع الحفاظ على الخلفية
ولا تتوقف القوة عند هذا الحد، بل أظهرت نانو بانانا تميزاً إضافياً لدى دمج عدة عناصر في صورة واحدة – مثلاً، جمع صورة شخص ما مع حاجز خشبي قام بتركيبه بنفسه مؤخراً، مع طلب واضح بعدم تغيير الخلفية الأصلية. هنا، أوفت Gemini بالوعد، فحافظت تماماً على الخلفية وأدخلت العنصرين بطريقة تبدو واقعية وسلسة. بينما عندما طُلب الشيء ذاته من ChatGPT، ظهرت الخلفية معاد تصنيعها بشكلٍ مختلف عن الواقع، وصار العنصر البشري أوضح أنه “صنيعة الذكاء الاصطناعي” بألوان وتفاصيل أقل إقناعاً. وهكذا، يدعم الأداء الفعلي اعتقاد الكثيرين بأن الجانب الجمالي والتقني في توليد الصور يتطلب دقة اتصال أقوى بين العناصر.
وهذا التواصل بين التحسينات التقنية وسرعة الأداء يتضح أكثر حين نقارن زمن الانتظار بين الأداتين: فبينما تحتاج Gemini مع نانو بانانا قرابة عشر ثوانٍ فقط لإخراج صورة متكاملة، قد تمتد هذه الفترة إلى دقيقة كاملة مع ChatGPT، وهو فارق ضخم في عصر السرعة وكثافة الإنتاج الرقمي.
هل نتوجه نحو عصر الذكاء الاصطناعي الفائق في الرسم؟
بالنهاية، رغم أن هناك أدوات احترافية مستقلة مثل Midjourney ما تزال لها صولاتها بين المحترفين، فإن المعركة الأساسية اليوم هي بين سهولة الاستخدام، وإتقان التفاصيل، وسرعة التنفيذ. يبدو أن غوغل وضعت قدمها بقوة في هذا السباق مع نانو بانانا التي تؤكد من جديد أهمية حصول المستخدم على نتائج واقعية وجاهزة دون انتظار طويل أو فقدان الاتساق البصري. هكذا، تنسج التقنية مستقبلها الجديد بين أيدي الجميع، وتدفعنا لإعادة التفكير في تعريف “الصورة الرقمية” عندما يدخل الذكاء الاصطناعي بكامل إبداعه على الخط.
باختصار، إن كنت تبحث عن صورة ذكية بتفاصيل دقيقة وسرعة خاطفة دون الحاجة إلى برامج متقدمة مدفوعة، فقد تجد في نانو بانانا داخل Gemini صديقك الجديد في عالم الذكاء الاصطناعي الآسر.