جوجل تطلق جيميني 2.5 فلاش لايت أسرع نموذج ذكاء اصطناعي خاص حتى الآن

4 د
أعلنت جوجل عن تحديث "Gemini 2.
5 Flash Lite" كأسرع نموذج لها بقدرة توليد 887 رمزًا في الثانية.
تشمل التحديثات تقليص الرموز المستهلكة بنسبة 50% وتحسينات متعددة الوسائط لفهم الصور والصوتيات.
تم تحسين الأداء بنسبة 40% وتقليل التكاليف التشغيلية، مع الحفاظ على الأسعار الحالية.
التوسع يشمل "Gemini Live" لتحسين التعامل مع الصوت والضوضاء في التفاعلات الصوتية.
جعل النماذج "تفكر" قبل الرد، مع خاصية تخصيص "ميزانية للتفكير" للأسئلة المعقدة.
أعلنت جوجل عن تحديثات كبيرة لسلسلة نماذج الذكاء الاصطناعي "Gemini"، حيث أصبح نموذج Gemini 2.5 Flash Lite أسرع نموذج مملوك للشركة حتى الآن، مقدمًا سرعة توليد بلغت 887 رمزًا (Token) في الثانية بحسب تقييمات مستقلة، وهو ما يجعله يتفوق على نماذج منافسة مثل GPT-5 وGrok 4 Fast. هذا التطور يأتي في فترة تتسارع فيها المنافسة العالمية بين الشركات الكبرى والناشئة لإنتاج نماذج خفيفة وسريعة وقليلة التكلفة.
تحسينات جوهرية في الأداء والتكلفة
توضح جوجل أن تحديثات Gemini Flash وFlash Lite جاءت لمعالجة ثلاثة محاور أساسية: السرعة، الكفاءة في استهلاك الرموز، وجودة المخرجات. الإصدار الجديد من Flash Lite، على سبيل المثال، بات يخفض عدد الرموز النصية المنتجة بنسبة تصل إلى 50% مقارنة بالإصدار السابق، ما يعزز من فرص دمجه في التطبيقات عالية التشغيل مثل مراكز الدعم أو روبوتات المحادثة عبر الإنترنت.
— لوغان كيلباتريك - مدير منتجات في Google AI Studio
"Flash كان أكثر نماذجنا شيوعًا، ومن المدهش أن وتيرة التقدم لا تتوقف."
إلى جانب السرعة، أضاف النموذج مزايا في فهم الصور، تحسين جودة الترجمة، ومعالجة الأصوات بدقة أكبر، ما يمنحه طابعًا متعدد الوسائط يتماشى مع احتياجات المؤسسات التي تبني أنظمة تعتمد على البيانات المرئية والسمعية معًا. هذه التطورات تبدو امتدادًا للنقلة التي قدمتها جوجل سابقًا مع إصدار **Gemini 1.5 Pro** الذي أُشير إليه كخطوة لتعزيز التكامل بين النصوص والوسائط المتعددة.
ما الذي تغير فعليًا للمطورين؟
- سرعة ناتج أعلى بنسبة 40% مقارنة بالإصدار السابق من Flash Lite.
- انخفاض تكاليف التشغيل بفضل تقليص الرموز المستخدمة من جانب النموذج.
- تحسن قدرات الاستدلال Reasoning بنسبة ملحوظة، خصوصًا في اختبار SWE-Bench.
- تحسين قدرات النموذج في الترجمة وفهم الصور والتعامل مع الصوتيات.
- توفّر النماذج عبر أسماء مستعارة جديدة (
gemini-flash-latest
/gemini-flash-lite-latest
) لدمج أسرع في التطبيقات.
المثير للاهتمام أن الأسعار بقيت ثابتة رغم التحديثات، إذ توفر جوجل نموذج Flash Lite بتكلفة 0.10 دولار لكل مليون رمز إدخال، و0.40 دولار لكل مليون رمز إخراج، بينما يأتي Flash بسعر أعلى لكنه لا يزال أقل من متوسط السوق للنماذج المنافسة. لمزيد من التفاصيل التقنية، نشرت جوجل بيانها الرسمي على مدونتها للمطورين.
التوسّع نحو التفاعلات الصوتية
لم تقتصر التحديثات على النماذج النصية فحسب، بل شملت أيضًا Gemini Live، النموذج المصمم للتفاعل الصوتي المباشر. الإصدار الجديد قدّم تحسنًا كبيرًا في دقة استدعاء الوظائف البرمجية، بالإضافة إلى تعامل أكثر "طبيعية" مع مقاطعات المستخدم والضوضاء الخلفية. هذا الجانب يُشكل ركيزة مهمة في تطوير المساعدات الرقمية الشخصية والأنظمة المعتمدة على المحادثة الصوتية، حيث يصبح استقرار التجربة وجودتها أكثر أهمية من مجرد سرعة الاستجابة.
مكاسب Gemini Live في التعامل مع "الضوضاء البشرية" تعكس إدراكًا أوسع لتحديات استخدام الذكاء الاصطناعي في البيئات الحية، حيث لا يمكن للمستخدم إعادة إرسال طلبه بسهولة، بعكس النصوص المكتوبة. على المستوى التطبيقي، بدأت شركات ناشئة في دمج هذه القدرات ضمن منصات عائلية أو خدمية، وهو ما ينذر باتساع رقعة استخدام النماذج خارج حدود المؤسسات التقنية.
ما وراء الأرقام والتقييمات
الإعلان الجديد يضع جوجل في موقع متقدم على صعيد الأداء مقابل الكلفة في فئة النماذج المملوكة، لكن المنافسة لن تبقى محصورة هنا، إذ إن نماذج مفتوحة المصدر مثل K2 Think أثبتت قدرة مضاعفة بسرعة 2000 رمز/ثانية، ما يعكس مشهدًا تنافسيًا متغيرًا قد يدفع الشركات الكبرى إلى إعادة التفكير في استراتيجياتها. السرعة وحدها ليست العامل الحاسم، بل قدرة النموذج على التعامل مع سيناريوهات معقدة، وتوفير مخرجات دقيقة مع استهلاك اقتصادي للموارد.
الخطوة القادمة تبدو موجهة نحو جعل النماذج أكثر "تفكيرًا" قبل الرد، حيث وعدت جوجل بميزة جديدة تسمح بتخصيص "ميزانية للتفكير" داخل Gemini Live، بحيث يمنح النموذج وقتًا إضافيًا لمعالجة الأسئلة المعقدة قبل تقديم الإجابة. هذه الخاصية إن طُبقت بفاعلية قد تعيد رسم التوازن بين السرعة والدقة، وهما العنصران الأكثر حساسية في التطبيقات المؤسسية والعملية.
في النهاية، ما يحدث يعكس مسارًا عالميًا يتجاوز مضمار السباق بين الأسماء الكبرى. السؤال الأهم لم يعد: "أي نموذج أسرع؟" بل "أي نموذج يمكن الاعتماد عليه في البيئات الأكثر تعقيدًا؟". الإجابة عن هذا السؤال هي ما سيحدد الخاسر والرابح الحقيقي في السنوات القادمة من سباق الذكاء الاصطناعي.