ذكاء اصطناعي

من مجرد مساعد… إلى وكيل ذكي: غوغل تُطلق Gemini داخل كروم

من مجرد مساعد… إلى وكيل ذكي: غوغل تُطلق Gemini داخل كروم
مجد الشيخ
مجد الشيخ

4 د

بدأت غوغل بدمج مساعدها الذكي Gemini في متصفح كروم، لكن فقط لمستخدمي النسخ التجريبية وخطط الاشتراك المدفوعة.

يستطيع المساعد تحليل محتوى الشاشة الحالية، وتقديم ملخصات أو الردود بناءً على ما يراه.

تضيف ميزة التفاعل الصوتي طبقة عملية جديدة، خصوصًا أثناء مشاهدة الفيديوهات أو تصفح المتاجر.

رغم بعض العيوب، تُعد هذه الخطوة تمهيدًا لعصر جديد من الذكاء الاصطناعي الوكيل، القادر على تنفيذ المهام وليس فقط تقديم المعلومات.

في خطوة جديدة تشير إلى ملامح مستقبل أكثر ذكاءً وتفاعلية، بدأت غوغل بإدماج مساعدها المدعوم بالذكاء الاصطناعي "Gemini" داخل متصفح كروم، ما يشكّل بداية واضحة لعصر جديد تطمح فيه الشركة إلى جعل تقنياتها أكثر "وكالة" أو قدرة على التصرف نيابة عن المستخدم. التجربة، رغم كونها أولية، تكشف عن نوايا طموحة تمتد إلى ما هو أبعد من مجرد تقديم ملخصات سريعة أو إجابات على الأسئلة.


دمج Gemini في كروم: بداية خجولة نحو ذكاء أكثر استقلالية

فبدلاً من فتح تطبيق الويب الخاص بالمساعد كما هو معتاد، أصبح بإمكان المستخدمين ببساطة النقر على زر Gemini في الزاوية العلوية من المتصفح لبدء التفاعل. لكن الميزة اللافتة هي قدرة المساعد الجديد على "رؤية" محتوى الشاشة الحالي وتحليله مباشرة، ما يجعله أداة مرافق ذكي أثناء تصفح الإنترنت.

ورغم أن التجربة لا تزال حصرية للمستخدمين المشتركين في خطط Google AI Pro وAI Ultra، وتتطلب استخدام نسخ Beta أو Dev أو Canary من المتصفح، فإنها تضع أساسًا قويًا لمستقبل يتجاوز تقديم الأجوبة إلى تنفيذ المهام المعقّدة.


قدرات عملية... لكنها محدودة

من خلال تجربة الكاتبة إيما روث من موقع ذا فيرج فقد استخدمت Gemini لتلخيص مقالات على الموقع، والبحث عن أخبار الألعاب، حيث ساعدها على تحديد أخبار مثل ألعاب Game Boy الجديدة على خدمة Nintendo Switch Online، وتفاصيل عن فيلم جديد مقتبس من لعبة Elden Ring، إضافة إلى تحديثات كبرى لمنصة Steam Deck.

لكن Gemini لا يستطيع إلا تحليل ما هو ظاهر على الشاشة. فمثلاً، لا يمكنه تلخيص قسم التعليقات في صفحة ما، ما لم يكن مرئيًا للمستخدم لحظة التفاعل. كذلك، يتتبع المستخدم عند التنقل بين الصفحات، لكنه لا يستخلص المعلومات إلا من علامة تبويب واحدة في كل مرة.


التفاعل الصوتي وتطبيقات الفيديو: قفزات صغيرة نحو الراحة

إحدى الميزات المفيدة التي لاحظتها الكاتبة هي خاصية "Live" التي تتيح التفاعل الصوتي مع Gemini. يمكن للمستخدم ببساطة طرح سؤال بصوته، ليأتي الرد منطوقًا كذلك. واستخدمت إيما هذه الخاصية أثناء مشاهدة مقاطع فيديو على يوتيوب، مثل مقطع لتجديد حمام، وسألت: "ما الأداة التي يستخدمها؟"، فجاء الرد: "يبدو أنه يستخدم مسدس مسامير لتثبيت قطع الخشب." كما تمكن المساعد من تحديد قطع إلكترونية دقيقة مثل المكثف وأدوات مثل الملاقط ومجفف الهواء في فيديوهات تقنية.

واحدة من الاستخدامات العملية التي أشادت بها الكاتبة هي طلب استخراج وصفات الطبخ من مقاطع الفيديو، دون الحاجة لنسخها يدويًا أو البحث عنها في الوصف. كما تمكنت من طلب تحديد مواقع منتجات مثل الحقائب المقاومة للماء أثناء تصفح أمازون.


إخفاقات متفرقة وسعة عرض محدودة

ورغم هذه الإمكانيات، لم يكن Gemini دقيقًا دائمًا. فحين طُلب منه تحديد مكان اليوتيوبر MrBeast أثناء زيارته لمدن حضارة المايا القديمة، أجاب أولاً بأنه لا يستطيع تقديم معلومات آنية، ثم أعاد المحاولة وأشار إلى "المكسيك" كما ورد في وصف الفيديو.

في تجربة أخرى، طلبت الكاتبة رابطًا لشراء كماشة ظهرت في فيديو، لكن Gemini اعتذر مجددًا عن عدم امتلاكه معلومات عن المتاجر أو المخزون. ورغم ذلك، استطاع اقتراح روابط بديلة لمنتجات مشابهة عند طلبها.

كما لاحظت الكاتبة أن الردود النصية كانت أحيانًا طويلة أكثر من اللازم، ولا تتناسب مع حجم نافذة المساعد الصغيرة في المتصفح. ورغم إمكانية توسيع النافذة، فإنها لم تكن مريحة على شاشة بحجم 13 إنش مثل تلك الموجودة في جهاز MacBook Air. كما أن بعض أسئلة المتابعة من Gemini بدت متكررة بشكل غير مبرر.


لمحة نحو المستقبل: من الردود إلى التنفيذ

رغم بعض العثرات، ترى الكاتبة أن غوغل تسير بخطى ثابتة نحو جعل Gemini أكثر "وكالة" — أي أن يكون قادراً على اتخاذ قرارات وتنفيذ مهام نيابة عن المستخدم. وعلى سبيل المثال، فكرت الكاتبة أثناء استخدام الأداة بتجربة الطلب من Gemini تنفيذ مهام مثل طلب وجبة طعام من مطعم بعد قراءة قائمة الطعام، لكنها أدركت أن ذلك ما زال غير ممكن.

ومع التقدم في مشروع "Mariner" الذي تطوره غوغل، وبالتحديد ميزة "Agent Mode" التي يُتوقّع أن تتيح للمساعد تنفيذ ما يصل إلى 10 مهام دفعة واحدة والبحث عبر الإنترنت دون تدخل المستخدم، يبدو أن Gemini في كروم مجرد الخطوة الأولى في طريق طويل.

ذو صلة

فإذا جرى تطبيق هذه القدرات في نسخة المساعد ضمن كروم مستقبلًا، فقد نصل إلى مرحلة يستطيع فيها Gemini حفظ صفحات السفر، تنظيم المهام، أو حتى تجميع فيديوهات لوصفات الطهي تلقائيًا وإضافتها لقائمة "المشاهدة لاحقًا" على يوتيوب.

الدمج الجديد بين Gemini ومتصفح كروم لا يزال في مراحله الأولى، لكنه يكشف بوضوح عن توجّه غوغل لتطوير مساعد ذكي لا يكتفي بالإجابة، بل يتحرك بذكاء على الإنترنت بالنيابة عن المستخدم. صحيح أن الوظائف الحالية محدودة وتعاني من بعض العثرات، لكن مسار التطوير، مدعومًا بمشاريع مثل Mariner، يشير إلى مستقبل يتكامل فيه الذكاء الاصطناعي مع أدوات التصفح اليومية ليتحوّل من ردّ فعل إلى مبادرة.

ذو صلة