ذكاء اصطناعي

ميزة توليد الصور في ChatGPT تشهد أول ترقية كبرى منذ أكثر من عام: ما الجديد؟

فريق العمل
فريق العمل

3 د

أعلنت شركة OpenAI عن ترقية كبرى لقدرة ChatGPT على توليد الصور باستخدام نموذج GPT-4o.

أصبحت الميزة الجديدة متاحة لمشتركي الخطة الاحترافية وستُطرح لاحقًا للمستخدمين الآخرين.

يُنتج النموذج صورًا بدقة أعلى ويمكنه تعديل الصور الموجودة بما فيها صور البشر.

تؤكد OpenAI التزامها بحقوق الفنانين وتوضح أنها استخدمت بيانات عامة وأخرى حصرية في تدريب النموذج.

في خطوة جديدة تؤكد تصاعد سباق الذكاء الاصطناعي، أعلن الرئيس التنفيذي لشركة OpenAI، سام ألتمان، خلال بث مباشر يوم الثلاثاء، عن أول ترقية رئيسية لقدرات توليد الصور في منصة ChatGPT منذ أكثر من عام. ووفقًا لما نقله موقع TechCrunch، أصبحت خاصية توليد الصور وتعديلها متاحة الآن ضمن نموذج GPT-4o المتقدم.


تحول نوعي في قدرات ChatGPT البصرية

في السابق، كان نموذج GPT-4o مستخدمًا في توليد النصوص فقط، إلا أن الترقية الجديدة تتيح له ولأول مرة إنتاج صور فوتوغرافية وتعديلها بشكل مباشر داخل ChatGPT، وكذلك ضمن منصة Sora التابعة لـ OpenAI والمخصصة لتوليد مقاطع الفيديو بالذكاء الاصطناعي.

وأوضح ألتمان أن الميزة أصبحت متاحة بشكل فوري لمشتركي خطة Pro التي تبلغ كلفتها 200 دولار شهريًا، فيما ستبدأ OpenAI في طرحها تدريجيًا لمستخدمي خطة Plus والمستخدمين المجانيين، بالإضافة إلى مطوري البرمجيات الذين يعتمدون على واجهات API الخاصة بالشركة.


GPT-4o: دقة أعلى وخصائص تحرير متقدمة

الميزة الجديدة تتجاوز أداء النموذج السابق DALL-E 3، إذ يستغرق GPT-4o وقتًا أطول نسبيًا في "التفكير" قبل إنتاج الصورة، ما يمنحه دقة أكبر في التفاصيل. وتشمل قدراته الجديدة إمكانية تعديل الصور القائمة، حتى تلك التي تحتوي على أشخاص، من خلال ما يُعرف بـ "الترقيع الذكي" (Inpainting) لتغيير عناصر في المقدمة أو الخلفية، مما يفتح آفاقًا واسعة لاستخدامات أكثر احترافية وإبداعًا.


مصادر التدريب: بين الشفافية والحذر القانوني

أفادت الشركة في تصريح خاص لصحيفة "وول ستريت جورنال" بأنها درّبت النموذج باستخدام بيانات متاحة للعامة، إلى جانب بيانات حصرية من شراكاتها مع شركات مثل Shutterstock. غير أن OpenAI، كغيرها من شركات الذكاء الاصطناعي، تتوخى الحذر في الكشف عن مصادر بيانات التدريب بالكامل، نظراً لاحتمالية التعرض لدعاوى قضائية تتعلق بحقوق الملكية الفكرية.

براد لايتكاب، المدير التنفيذي للعمليات في OpenAI، أكد في تصريحه للصحيفة أن الشركة تتبنى سياسات تحترم حقوق الفنانين، وتمنع إنشاء صور تحاكي بشكل مباشر أعمال فنانين أحياء. وأضاف أن الشركة توفر نموذجًا لطلب استثناء المحتوى الفني من بيانات التدريب، وتلتزم أيضًا باحترام طلبات حظر استخدام روبوتات الزحف التابعة لها لجمع البيانات من المواقع الإلكترونية، بما فيها الصور.


سباق بين الكبار: OpenAI تتحدى جوجل

تأتي هذه الترقية في وقت حساس تشهد فيه الساحة منافسة شديدة. فقد أطلقت جوجل مؤخرًا ميزة تجريبية لتوليد الصور ضمن نموذجها المتقدم Gemini 2.0 Flash. وعلى الرغم من شهرتها الواسعة على منصات التواصل الاجتماعي، فإنها أثارت جدلاً واسعًا بسبب ضعف الضوابط الأخلاقية فيها، مما سمح للمستخدمين بإزالة العلامات المائية وإنشاء صور تتضمن شخصيات محمية بحقوق الملكية الفكرية.

تجدر الإشارة إلى أن التحديث الأخير للمقال نُشر عند الساعة 12 ظهرًا بتوقيت المحيط الهادئ، وشمل التصريح الرسمي من OpenAI حول تفاصيل بيانات التدريب الخاصة بنموذج GPT-4o.


مستقبل توليد الصور بالذكاء الاصطناعي بين الإبداع والمخاطر

ذو صلة

تشير هذه الخطوة من OpenAI إلى توجه جديد في تطوير نماذج الذكاء الاصطناعي متعددة الوسائط، التي لا تكتفي بفهم النصوص، بل تنخرط في إنتاج صور مرئية ومعقدة. وإذا ما نجحت OpenAI في فرض ضوابط واضحة على المحتوى الناتج، فقد تتمكن من التميّز في هذا المجال مقارنة بمنافسيها الذين تعثروا في ضبط أدواتهم.

ومع ذلك، لا تزال الأسئلة القانونية والأخلاقية تلوح في الأفق، خصوصًا مع الغموض الذي يحيط ببيانات التدريب ومدى احترام حقوق الفنانين والناشرين. وبالنظر إلى سرعة تطور هذا المجال، يبدو أن معركة الذكاء الاصطناعي القادمة لن تكون فقط تقنية، بل قانونية وأخلاقية أيضًا.

ذو صلة