ذكاء اصطناعي

جوجل وجيني: ذكاء اصطناعي للنخبة لا للاستخدام اليومي

Abdelrahman Amr
Abdelrahman Amr

3 د

في Project Genie تُطلق جوجل نموذجًا قادرًا على إنشاء عوالم افتراضية تفاعلية.

تقتصر التجربة على مشتركي AI Ultra، مما يعكس تكلفة تقنية عالية وإبهارًا بصريًا مبدئيًا.

تستدعي التقنية الجديدة قضايا الملكية الفكرية بسبب قدرة النموذج على إعادة إنتاج عوالم مألوفة.

تركّز جوجل على فهم الذكاء الاصطناعي للحركة والزمن بشكل يشبه الإدراك البشري.

في مقطع قصير لا يتجاوز الدقيقة، يمكن الآن التجوّل داخل عالمٍ افتراضي تولّده خوارزمية. تتحرك الشخصية، تتغير الإضاءة، وتبدو الأشياء وكأن لها قوانينها الخاصة. هذا المشهد لم يخرج من لعبة مستقلة، بل من مختبرات Google DeepMind، مع إطلاق Project Genie، وهو ما تكشفه جوجل كخطوة جديدة نحو نوع مختلف من الذكاء الاصطناعي.


ما هو Project Genie ولماذا تقدمه جوجل الآن

Project Genie هو واجهة للوصول إلى Genie 3، نموذج تصفه جوجل بأنه نموذج عوالم، أي نظام قادر على إنشاء بيئات تفاعلية تحاكي العالم المادي من حيث الحركة والمساحة وبعض قواعد الفيزياء. الفكرة هنا تختلف جذريًا عن نماذج اللغة الكبيرة التي تعتمد على التنبؤ بالنصوص أو الصور، إذ تحاول جوجل بناء محاكاة قابلة للاستكشاف، لا مجرد محتوى يُشاهَد.

إتاحة التجربة حاليًا محصورة بمشتركي AI Ultra في الولايات المتحدة، مقابل اشتراك مرتفع، مع تحديد صارم لطول العالم المُولّد الذي لا يتجاوز 60 ثانية. هذا التقييد يكشف الكثير عن المرحلة المبكرة للتقنية، وعن كلفتها الحسابية العالية، رغم الإبهار البصري الذي أظهرته المقاطع التجريبية.


نماذج العوالم مقابل نماذج اللغة

الرهان على نماذج العوالم ليس جديدًا. يان لوكون، أحد أبرز الأسماء في أبحاث الذكاء الاصطناعي، يرى منذ سنوات أن نماذج اللغة، مهما تطورت، ستبقى محدودة في فهمها للعالم الحقيقي. بحسب هذا التصور، التعلّم الحقيقي يتطلب القدرة على محاكاة الواقع، تجربة السيناريوهات، واستخلاص نتائج من التفاعل، لا من النصوص وحدها.

جوجل، عبر Project Genie، تتبنى مقاربة عملية لهذا الاتجاه، لكن بنكهة مختلفة. النموذج لا يبني تمثيلًا داخليًا مجردًا للعالم كما في أفكار JEPA، بل يولّد عالمًا بصريًا مستمرًا على شكل فيديو تفاعلي. النتيجة عالم يبدو حيًا، لكنه في العمق ما يزال هشًا وغير مستقر.


محدودية التجربة خلف الانبهار البصري

رغم الحماس الكبير على شبكات التواصل، يشكو المستخدمون من التأخير وضعف الاستجابة، إضافة إلى التزام النموذج المحدود بالتعليمات أو قوانين الفيزياء. جوجل نفسها تعترف بأن العوالم قد لا تكون واقعية، ولا دقيقة دائمًا. الفيديو بدقة 720p وبمعدل إطارات متواضع يذكّر بأننا أمام تجربة بحثية أكثر من منتج جاهز.

هذا يفسر سبب القيد الزمني الصارم. إنشاء عالم تفاعلي، حتى لو بدا صغيرًا، يتطلب معالجة كمية هائلة من البيانات البصرية والزمانية. الكلفة هنا ليست في التدريب فقط، بل في التشغيل الفوري، وهو ما يجعل فكرة العوالم اللامتناهية أقرب إلى الوعد منها إلى الواقع.


حين تتقاطع التقنية مع إشكاليات الحقوق

كما هو متوقع، ظهرت بسرعة عوالم مستوحاة بوضوح من ألعاب Nintendo وغيرها، ما أعاد طرح أسئلة الملكية الفكرية التي واجهت نماذج الصور والفيديو سابقًا. قدرة النموذج على إعادة إنتاج عوالم مألوفة تشير إلى قوة التعلم البصري، لكنها تفتح أيضًا بابًا قانونيًا معقدًا قد يقيّد انتشار هذه التكنولوجيا.

هذه الإشكاليات ليست تفصيلًا جانبيًا، بل جزء من سبب حذر جوجل في الإطلاق. فكلما اقتربت النماذج من محاكاة الواقع، زادت حساسيتها تجاه حقوق الإبداع وحدود الاستخدام المشروع.


ماذا تقول خطوة جوجل عن مستقبل الذكاء الاصطناعي

دخول جوجل بقوة إلى مجال نماذج العوالم يحمل دلالة أوسع. حتى الشركات التي تقود سباق نماذج اللغة باتت تعترف ضمنيًا بوجود سقف رياضي ومعرفي لهذه المقاربة. العالم الحقيقي، بتعقيده وتشابكه، قد لا يُختزل في نصوص أو صور ثابتة.

ذو صلة

Project Genie ليس موجهًا للمستخدم العادي، ولا يبدو أنه سيكون كذلك قريبًا. لكنه إشارة واضحة إلى أن المرحلة القادمة من الذكاء الاصطناعي قد تتطلب نماذج تفهم الحركة، الزمن، والسبب والنتيجة بطريقة أقرب إلى الإدراك البشري. السؤال لم يعد متى سنرى هذه العوالم، بل إلى أي حد ستكون مفيدة، وآمنة، وقابلة للاستمرار عندما تتجاوز الدقيقة الواحدة.

ذو صلة