رصد ظهور نموذج صور جديد من أوبن إيه آي يثير الانتباه في الأوساط التقنية

مصطفى يسري

آخر تحديث 10 ديسمبر 2025

3 د

تستعد جوجل لإطلاق نموذج "Nano Banana 2 Flash" في المجال البصري.

تختبر OpenAI داخلياً نموذجَي صور جديدين باسم "Chestnut" و"Hazelnut".

تشير التقارير إلى تقدم في فهم دلالات الصور وجودتها لدى OpenAI.

يتم تحسين توليد الصور لعناصر تقنية ونصوص برمجية بشكل أدق.

يساهم المشروع في الربط بين النماذج اللغوية والبصرية، مما يقرب من المحاكاة الشاملة.

في الوقت الذي تتسارع فيه خطى المنافسة في مجال الذكاء الاصطناعي بين عمالقة التقنية، يبدو أن جبهة جديدة تُفتح على أرض الإبداع البصري. فبينما تستعد جوجل لإطلاق نموذج صور جديد باسم "Nano Banana 2 Flash"، رُصدت مؤشرات قوية على أن شركة OpenAI تختبر داخلياً نموذجاً متطوراً للصور يحمل الاسم الرمزي "Chestnut" و"Hazelnut". الخبر لم يأتِ هذه المرة من إعلان رسمي، بل من آثار رقمية تركها بعض المختبرين في ساحات تجربة النماذج مثل Design Arena وLM Arena.

اشتداد التنافس بين OpenAI وجوجل في الذكاء البصري

بحسب التقارير المنشورة في موقع Times of AI، فإن OpenAI تعمل على تحسين جوهر قدراتها في التصوير الذكي لتنافس جودة النماذج البصرية لجوجل مثل Nano Banana Pro. وتشير التسريبات إلى أن النموذج الجديد لا يقتصر على رفع دقة الصور وواقعيتها فحسب، بل يظهر تقدماً في فهم دلالات العالم من حوله، ما يجعله قادراً على إنتاج صور تقارب في ذكائها وأساليبها ما يبدعه البشر أنفسهم.

Chestnut وHazelnut: بين التجريب والطموح

الحديث عن رمزي «الكستناء» و«البندق» لم يأت من فراغ. فالمتتبع لنهج تسمية النماذج لدى OpenAI يلحظ أن الشركة تميل إلى عناوين تحمل طابعاً طبيعياً يرمز إلى النضج والنمو المرحلي. وتشير التجارب الأولية إلى أن هذه النماذج تولّد صوراً تتميز بملامح واقعية ودقة ضوء محسّنة، إلا أن بعض المستخدمين لاحظوا ملمساً "بلاستيكيّاً" في الوجوه، وهي ملاحظة مألوفة في مراحل الاختبار الأولى لأي محرّك تصويري يعتمد على الشبكات التوليدية العميقة.

تحسّن في فهم الرموز والمحتوى التقني

أحد أبرز الجوانب التي تلفت الأنظار في النموذج التجريبي هي قدرته على توليد صور تحتوي على عناصر تقنية أو نصوص برمجية داخل الصورة بشكل دقيق وواضح. كانت هذه المهمة سابقاً نقطة ضعف مزمنة في كثير من مولدات الصور، إذ يصعب على الخوارزميات تمثيل الحروف أو الرموز ذات المعنى. التطور الجديد يوحي بأن OpenAI تسعى لجعل أداة الرسم الذكي فعالة في المجالات الهندسية وواجهات الاستخدام ومخططات الويب، وليس فقط في الفنون الإبداعية أو الصور الترفيهية.

ترابط مع GPT‑4o وتمهيد لـGPT‑5.2

تؤكد الشائعات أن هذا المشروع يعتمد على البنية التحتية لـGPT‑4o، لكنه يرتقي بها خطوة كبيرة نحو الجيل المقبل المتوقع أن يتزامن مع إطلاق GPT‑5.2. هذا الربط بين النماذج اللغوية والبصرية يعزز التوجّه نحو أنظمة متعددة الوسائط قادرة على فهم المعنى النصي والمشهد البصري في آنٍ واحد، ما يقرب OpenAI أكثر من تحقيق محاكاة معرفية شاملة.

ما وراء المنافسة: مستقبل الصورة الفهمية

ذو صلة

وراء هذه المنافسة المستترة بين OpenAI وجوجل تكمن رؤية أعمق لمستقبل الصورة نفسها: لم تعد الصورة مجرّد إخراج جمالي بل صارت وسيلة للفهم والتواصل المعرفي. ومع اقتراب هذه النماذج من استيعاب الرموز والمعنى والسياق، قد نشهد تحولاً في كيفية تعامل المبدعين والمطورين مع أدوات الذكاء الاصطناعي البصري، من مجرد توليد مشاهد جميلة إلى بناء محتوى يُفكر ويتفاعل.

إذا صدقت المؤشرات، فإن العام القادم سيكون نقطة انعطاف في علاقة الإنسان بالصورة الاصطناعية: لحظة تتجاوز فيها الآلة حدود "المحاكاة" لتبدأ مرحلة "التصوّر الواعي"، حيث تصبح جودة الذكاء أهم من جودة الدقة نفسها.

ذو صلة