ذكاء اصطناعي

ارفع الصورة واكتب سطر واحد لتحصل على نتيجة مذهلة حقًا.. نموذج Gemini 2.0 Flash الرائع متاح حاليًا للمطورين فقط

فريق العمل
فريق العمل

2 د

أعلنت جوجل عن إتاحة ميزة توليد الصور الأصلية في Gemini 2,0 Flash للمطورين عبر Google AI Studio و Gemini API.

يوفر النموذج إمكانيات متقدمة لدمج النصوص والصور، وتحرير الصور عبر الحوار، وإنشاء صور تعتمد على فهم العالم الحقيقي.

يتميز النموذج بدقة محسّنة في عرض النصوص داخل الصور مقارنة بالمنافسين، مما يجعله مناسبًا للإعلانات والمنشورات الرقمية.

يمكن للمطورين البدء في تجربة هذه الميزة من خلال Gemini API، وتقديم ملاحظاتهم لتحسين الإصدار النهائي.

أعلنت جوجل عن إتاحة ميزة توليد الصور الأصلية في Gemini 2.0 Flash للمطورين عبر جميع المناطق المدعومة حاليًا في Google AI Studio، وذلك بعد اختبارها مع مجموعة مختارة من المستخدمين في ديسمبر الماضي. يمكن للمطورين الآن تجربة هذه الميزة باستخدام الإصدار التجريبي gemini-2.0-flash-exp عبر Google AI Studio أو من خلال Gemini API.


قدرات Gemini 2.0 Flash في إنشاء الصور

يتميز Gemini 2.0 Flash بقدرته على فهم المدخلات متعددة الوسائط، وتعزيز عمليات الاستدلال، وتحليل اللغة الطبيعية لإنشاء صور متكاملة مع النصوص. وقد أثبتت هذه الميزة تفوقها في عدة سيناريوهات، منها:


1. الدمج بين النص والصور

يستطيع النموذج إنشاء قصص متكاملة بصور متسقة من حيث الشخصيات والخلفيات، مع إمكانية التعديل وفقًا لتوجيهات المستخدم. يمكن للمطورين استخدامه لإنشاء قصص تفاعلية مصورة داخل Google AI Studio.


2. تعديل الصور عبر المحادثات

يدعم Gemini 2.0 Flash تحرير الصور بشكل تفاعلي عبر الحوار، مما يسهل على المستخدمين تحسين الصور تدريجيًا أو تجربة أنماط مختلفة وفقاً لمتطلباتهم.


3. فهم العالم الحقيقي بدقة

على عكس العديد من نماذج توليد الصور الأخرى، يستفيد Gemini 2.0 Flash من المعرفة العامة والاستدلال المتقدم لإنتاج صور دقيقة، مما يجعله مثاليًا لتوضيح الوصفات أو إنشاء مشاهد معقدة. ومع ذلك، يبقى النموذج محدودًا في معرفته، إذ تعتمد دقته على المعلومات المتاحة له.


4. تحسين عرض النصوص في الصور

تواجه معظم نماذج الذكاء الاصطناعي صعوبة في إنتاج نصوص طويلة داخل الصور بشكل واضح ودقيق، إلا أن الاختبارات الداخلية أظهرت تفوق Gemini 2.0 Flash مقارنة بالنماذج المنافسة، مما يجعله خيارًا مثاليًا لإنشاء الإعلانات والمنشورات الاجتماعية والدعوات الرقمية.


كيف يمكن للمطورين البدء في استخدام الميزة؟

يمكن للمطورين دمج Gemini 2.0 Flash في تطبيقاتهم باستخدام Gemini API، كما توفّر مستندات جوجل مزيدًا من التفاصيل حول آلية توليد الصور عبر الذكاء الاصطناعي.

ذو صلة

دور Gemini 2.0 Flash في تطوير التطبيقات

سواء كنت تعمل على تطوير وكلاء ذكاء اصطناعي، أو إنشاء تطبيقات تحتوي على قصص تفاعلية مصورة، أو توليد أفكار مرئية عبر الحوار، فإن Gemini 2.0 Flash يتيح إمكانيات متقدمة للجمع بين النصوص والصور بسلاسة. وتأمل جوجل في تلقي ملاحظات المطورين للمساعدة في تحسين الإصدار النهائي قبل إطلاقه رسميًا.

ذو صلة