صور تولد من العدم: OpenAI تمنح المطورين عصاها السحرية

3 د
أعلنت OpenAI عن توفر النسخة المطورة من أداة إنشاء الصور عبر APIs للمطورين.
النموذج الجديد "gpt-image-1" يمكنه توليد صور متعددة الأساليب باستخدام المعرفة العامة والنصوص.
تتمتع الأداة بميزات أمان عالية تستخدم أيضاً في منصة ChatGPT.
يمكن التحكم في جودة الصور وسرعتها لتلبية المتطلبات الفنية والتجارية.
بدأت شركات كبرى مثل Adobe وFigma وCanva باستخدام التقنية الجديدة لتعزيز خدماتها.
خلال الأيام القليلة الماضية حظيت شركة OpenAI باهتمام عالمي كبير بعدما أعلنت عن توفير نسختها المطورة من أداة إنشاء الصور عبر واجهات برمجة التطبيقات (APIs)، ليتمكن المطورون من دمج هذه الخاصية المبتكرة داخل تطبيقاتهم وخدماتهم بسهولة.
أداة الصور التي أطلقتها OpenAI قبل بضعة أسابيع من الآن أثارت إعجاب ملايين المستخدمين بسبب قدرتها العالية على إنتاج صور واقعية بأساليب فنية متنوعة، منها على سبيل المثال أسلوب الصور المعروفة في أفلام استوديو "جيبلي" الياباني الشهير، ما دفع ملايين الأشخاص إلى تجربة هذه الميزة وإنتاج أكثر من 700 مليون صورة خلال الأسبوع الأول فقط من طرحها داخل منصة ChatGPT.
ما الذي يميز النموذج الجديد "gpt-image-1"؟
النموذج الذي يستخدمه المطورون من خلال API يسمى "gpt-image-1"، ويتميز بكونه متعدد الوسائط بصورة أساسية، أي لديه القدرة على التعامل مع المعلومات والنصوص متعددة الأنواع. هذا النموذج يستطيع توليد صورة في أي أسلوب يختاره المستخدِم، بالإضافة إلى قدرته على الاستفادة من المعرفة العامة، وتقديم النصوص داخل الصور بصورة واضحة ومنسقة.
كما توفر الأداة الجديدة للمطورين خيارات متعددة للتحكم في جودة الصور، وكذلك سرعة إنتاجها، الأمر الذي يتيح لها الاستخدام وفقاً للاحتياجات والمتطلبات الفنية أو التجارية لكل تطبيق أو خدمة.
ميزات إضافية متعلقة بالأمان والمصداقية
شركة OpenAI أكدت أن هذه التقنية الجديدة تستخدم نفس الميزات الأمنية العالية التي اعتمدتها في منصة ChatGPT الأساسية، حيث تم تفعيل آليات الأمان للحؤول دون إنتاج أي محتوى مخالف أو غير مناسب وفق سياسات الشركة. كما أن المطورين يمتلكون سيطرة كاملة على درجة حساسية الفلاتر الأمنية، ليتمكنوا من اختيار مستوى الرقابة الذاتي المناسب ضمن درجات متفاوتة.
بالإضافة لذلك، جميع الصور التي تولدها هذه التقنية يتم وضع علامة مائية عليها مع بيانات تعريفية (Metadata)، ذلك ليتمكن المستخدمون ومنصات النشر الأخرى من تمييز ما إذا كانت الصورة أصلية أم مولدة عبر الذكاء الاصطناعي.
التكلفة الاقتصادية للنموذج الجديد
ذكرت OpenAI في بيانها أن تكاليف استخدام أداة توليد الصور الجديدة "gpt-image-1" ستكون في متناول أغلب المطورين والتطبيقات، حيث يبلغ السعر 5 دولارات لكل مليون وحدة نصية يتم إدخالها؛ و10 دولارات لكل مليون وحدة بيانات تتعلق بالصور، في حين يصل سعر إنشاء الصورة الواحدة حوالي 2 سنت لجودة منخفضة وحوالي 7 سنت للجودة المتوسطة، ويصل إلى حوالي 19 سنتاً إذا كانت الصورة عالية الجودة. هذا التسعير يجعل من التقنية الجديدة خياراً معقولا وفعالا للشركات الناشئة والمطورين المستقلين.
أسماء بارزة بدأت بالفعل استخدام التقنية الجديدة
سارعت عدة شركات معروفة للاستفادة من قدرات النموذج المطور في خدماتها ومنتجاتها. من بين هذه الشركات أسماء مثل Adobe الشهيرة، وFigma لتصميم المنتجات، وشركتي Canva وInstacart وغيرهم الكثير، حيث بدأت شركة قامت مثل Figma مثلاً بالسماح لمستخدميها بإنشاء وتعديل الصور باستخدام التقنية الجديدة بسهولة داخل منصتهم الاحترافية، فيما بدأت Instacart اختبارات لدمج النموذج الجديد في تطبيقاتها لمساعدة المستخدمين في إنشاء صور للمنتجات الغذائية وقوائم التسوق والوصفات.
وفي ظل هذا الإقبال الكبير والمتسارع، تعكس خطوة OpenAI الأخيرة سعياً واضحاً نحو تعزيز مكانتها وريادتها في مجال الذكاء الاصطناعي، مع رغبة أكيدة منها لتقديم خدمات مبتكرة للمستخدمين تشجع على الإبداع والتجريب بأمان وفعالية عالية. ويبقى السؤال الذي يشغل المهتمين بهذه التقنية، كيف ستواصل OpenAI تطوير هذه الأداة مستقبلاً وإلى أي مدى يمكن أن تصل قدرتها الإبداعية في السنوات المقبلة؟