Google Gemini تفتح آفاقًا جديدة: تعرف على تقنية تحليل الفيديو الثورية الجديدة التي تسبق المنافسة!

3 د
غوغل تطلق ميزة "جيميني" لتحليل محتوى الفيديو بذكاء ودقة عالية.
الميزة تسمح للمستخدم بالسؤال عن تفاصيل الفيديو وتحصل على ردود دقيقة.
"جيميني" يتفوق على المنافسين بتقديم خدمات مبتكرة على الأندرويد والآيفون والويب.
غوغل تطرح موديل "جيميني 2.
5" بتقنيات محسنة لضمان الأداء والأمان.
خصائص الاشتراك المتميزة تتضمن "مارينر" وميزات حصرية تُثير الجدل بين المستخدمين.
هل تخيلت يوماً أن بإمكانك التحدث مع الذكاء الاصطناعي عن محتوى فيديو خاص بك تسأله فيجيبك كأنه يفهم المحتوى تماماً؟ هذا بالضبط الموعد مع الميزة الجديدة لتقنية "جيميني" من غوغل، والتي أعلنت عنها بشكل موسع مؤخراً. التقنية الجديدة ستُمكنك من رفع أي مقطع فيديو وتسأل تطبيق الذكاء الاصطناعي مباشرة: ماذا يحتوي هذا المقطع؟ أين تم تصويره؟ أو حتى أن تطلب منه تحديد مشاهد وأجسام محددة، ليجيبك بوضوح مدهش.
وكما هو واضح، فإن هذه الخطوة تبرز عدم اعتماد غوغل على النصوص والصور الثابتة فقط، بل الانتقال لعالم "الوسائط المتعددة". وبفضل تحديث "جيميني"، أصبح بإمكان مستخدمي أجهزة الأندرويد، والآيفون، والويب الاستفادة من هذه التكنولوجيا المبتكرة والمتطورة. وبهذا تسبق غوغل منافستها الأقوى "شات جي بي تي"، التي لا تدعم حالياً تحليل مقاطع الفيديو المباشر.
تؤكد الاختبارات الأولية النجاح الكبير لهذه الخاصية. ففي تجربة حديثة، تمكن "جيميني" من تحديد موقع تصوير مقطع في غابة، بناءً على العناصر المرئية والمسموعة في الفيديو. مع ملاحظة بسيطة: التطبيق لم يدعم بعد تصوير الفيديو مباشرة من الكاميرا المُدمجة، بل يتطلب تحميل مقاطع تم تصويرها مسبقاً من مكتبة الهاتف أو الحاسب.
هذه الخطوة تعد جزءاً من جهود غوغل لترسيخ نموذجها العملاق "جيميني 2.5" في تطبيقات عملية وواقعية، حيث دخل مؤخراً مرحلة الاستخدام العام بصفة رسمية، معتمداً معايير أكثر استقراراً وأماناً حسب تصريحات الشركة. سابقاً، واجهت غوغل انتقادات بسبب اندفاعها في طرح موديلات تجريبية قد تكون غير مكتملة أو موثقة بشكل جيد، لكنها تؤكد اليوم انتقالها لتطبيق استراتيجية "عقلانية" تعتمد على ضمان الكفاءة، والأداء، والأمان في ذات الوقت، وهو ما تسميه الشركة "التفكير الهجين"، أو إدارة "الموارد الذهنية" بشكل أفضل.
ولتعزيز هذه الاستراتيجية، تقدم غوغل الآن خطتي اشتراك متميزتين: خطة "غوغل إيه آي برو" بسعر يصل إلى 19.99 دولار شهريًا، وخطة "غوغل إيه آي ألترا" الاحترافية بسعر 249.99 دولار شهريًا. تتميز الأخيرة بمزايا حصرية مثل مشروع "مارينر" التقني، ومساحة تخزين ضخمة تصل إلى 30 تيرابايت، واشتراك يوتيوب بريميوم مجاني، للقادرين على الاستثمار بشكل أكبر في حلول الذكاء الاصطناعي المتقدمة.
ومع ذلك، بدأ الجدل حول مدى قيمة هذه الاشتراكات بين المستخدمين على مواقع التواصل مثل "ريديت"، الذين يقارنون بشكل متكرر بين مميزات "جيميني" وخدمات منافسة مثل شات جي بي تي. يميل بعض المستخدمين لتفضيل نماذج غوغل التي ترتبط بتجارب احترافية موجهة، بينما يفضل الآخرون النماذج المنافسة لأغراض إبداعية وكتابة المحتوى.
وتنضم هذه الخاصية الجديدة إلى حزمة مذهلة من الأدوات الإبداعية الأخرى التي تقدمها "غوغل" مثل خاصية توليد الفيديو من النصوص "فيو 3"، والتي وصفها ديميس هاسابيس، المدير التنفيذي لغوغل ديبمايند، بأنها تمثل "نهاية عصر الفيديو الصامت". وهي بالفعل تقنية واعدة تسمح بتكوين الصوت والصورة معًا بشكل متناغم وواقعي للغاية.
وكجزء من مسؤولياتها تجاه الأمان والخصوصية، تستخدم غوغل تقنية "سينث آي دي"، التي توفر علامة رقمية غير مرئية لمكافحة الأخبار الزائفة ومقاطع الفيديو المفبركة، ما يُعتبر خطوة دقيقة ومطلوبة في عصر تثير فيه التقنيات المتقدمة أخطارًا جديدة مثل التزييف العميق للأحداث مثل المظاهرات أو الانتخابات.
تبقى أسئلة المشروعية في استخدام البيانات الرقمية مفتوحة، خاصة في ظل تقنيات مثل "فيو" التي قد تجمع محتواها التدريبي من فيديوهات عامة من موقع يوتيوب. وهذه النقطة تمثل تحدياً كبيراً لغوغل، خصوصاً عند مقارنتها بتقنيات منافسة مثل "أدوبي فايرفلاي"، التي تعتمد بشكل أساسي على المحتوى المصرَّح باستخدامه بشكل محدد.
في النهاية، تأتي هذه الخطوة الجديدة لتؤكد بأن الذكاء الاصطناعي لم يعد مجرد كلمات أو بيانات صمّاء، بل تطوّر اليوم لتقنيات قادرة فعلاً على "فهم" الفيديوهات وتحليل محتواها. ربما يكون من المفيد لغوغل أن تقوم بتعزيز الوضوح في تعريفها لمصادر بيانات التدريب مستقبلاً، فضلاً عن تبسيط الاشتراك وتوضيح قيمته للمستخدمين بشكل أكثر دقة. وبالرغم من وجود مساحة للتحسين، فمن الواضح أننا أمام فصل جديد ومثير في قصة الذكاء الاصطناعي، ستكون غوغل بلا شك واحدة من أبرز لاعبيه.