يفهم ما تحتاجه ثم يقدم لك الحل.. ميتا تطوِّر V-JEPA 2 الذكاء الأقرب للبشر

3 د
أعلنت شركة ميتا عن نموذج ذكاء اصطناعي جديد باسم "V-JEPA 2".
يساعد "V-JEPA 2" الأنظمة الذكية على فهم العالم الفيزيائي وتحسين التفاعل.
التطوير يتيح للروبوتات التنبؤ بالخطوات القادمة في المهام اليومية.
"V-JEPA 2" أسرع بثلاثين مرة من نموذج "Cosmos" الخاص بإنفيديا.
يمثل النموذج خطوة جديدة في تطوير الذكاء الاصطناعي العملي.
هل تخيلت يومًا مستقبلًا تساعدك فيه روبوتات أو أنظمة ذكية في حياتك اليومية تمامًا مثل مساعد طبيعي، يقرأ تصرفاتك ويفهم ما تحتاجه ثم يقدم لك الحل دون أن تطلبه؟ يبدو هذا الواقع الآن أقرب مما توقعنا، وذلك بعد إعلان شركة ميتا إطلاقها نموذجًا ذكائيًا جديدًا يسمى "V-JEPA 2"، والذي يهدف إلى مساعدة الأنظمة الذكية على فهم العالم المحيط بها بطريقة مشابهة لما يقوم به البشر.
ويُعتبر "V-JEPA 2" تطويرًا لنسخته السابقة "V-JEPA"، وهو نموذج ذكاء اصطناعي تم تدريبه باستخدام أكثر من مليون ساعة من الفيديو، وذلك لمساعدة الذكاء الاصطناعي، بما في ذلك الروبوتات، على فهم بيئتها الفيزيائية بطريقة أفضل. ومن خلال التدريب المكثف، سيتمكن النموذج الجديد من التنبؤ بنتائج إجراءات وتفاعلات معينة كالتي يختبرها البشر والحيوانات في حياتهم اليومية، مثل إدراك تأثير الجاذبية على سقوط الأشياء أو ارتداد الكرة عند اللعب بها.
قد يشبه هذا التطور الطريقة التي تتعلم بها الحيوانات والأطفال الصغار إدراك العالم من حولهم، فعندما تلقي كرةً لكلبك الأليف، فإنه يعرف بالفطرة أن الكرة ستقفز إلى الأعلى إذا اصطدمت بالأرض، فيختار الركض إلى نقطة السقوط المتوقعة بدلًا من مكان سقوطها الأولي.
وفي أحد الأمثلة العملية التي قدمتها ميتا، أظهرت كيف يمكن لروبوت مزود بهذه القدرات الاستنتاجية أن يتوقع الخطوة القادمة. على سبيل المثال، إذا كانت يد الروبوت تحمل أطباقًا وملعقة ويتجه نحو موقد يحوي وجبة جاهزة، فالنظام سيفهم تلقائيًا أن الخطوة التالية المنطقية هي وضع الطعام في الطبق بالملعقة.
لا يقف التقدم عند هذا الحد. وفقًا لميتا، فإن نموذج "V-JEPA 2" أسرع بثلاثين مرة تقريبًا من نظيره لدى شركة إنفيديا، نموذج "Cosmos"، الذي يعمل بنفس الأسلوب لمساعدة الروبوتات والأنظمة الذكية على التعرف على العالم المادي. ومع ذلك، من الممكن أن الاختبارات ومعايير التقييم التي تستخدمها الشركتان قد تكون مختلفة بعض الشيء.
ويتماشى هذا المشروع مع هدف ميتا الأكبر، إذ أوضح يان ليكون، كبير علماء الذكاء الاصطناعي في ميتا في فيديو تقديمي، قائلًا: "نعتقد أن النماذج التي تفهم العالم (world models) ستفتح بابًا جديدًا في مجال الروبوتات. وستساعد الذكاء الاصطناعي العملي في أداء مهام الحياة اليومية بشكل أفضل، دون الحاجة لكم هائل من بيانات التدريب."
ويبدو أن هذه الخطوة هي ضمن جهود الشركة للعودة بقوة إلى المنافسة في قطاع الذكاء الاصطناعي، خاصة بعد الانتقادات التي تعرضت لها الشركة سابقًا بشأن أداء نموذجها السابق "Llama 4". إذ نبه عديد من الخبراء إلى أن الشركة تواجه تحديًا حقيقيًا في مجال الابتكار في البيانات، الأمر الذي يجعل خطوة ميتا في تطوير النموذج وتسريع الأداء منطقية ومرحبًا بها.
وهكذا نرى كيف أن هذا المشروع الجديد لميتا يعكس خطة الشركة في تقديم ذكاء اصطناعي عملي وفاعل يساعد الناس مباشرةً في حياتهم اليومية. ولعلنا مستقبلًا سنعيش في واقع يسهل فيه الذكاء الاصطناعي تفاصيل كثيرة من حياتنا اليومية، بعد أن يصبح قادرًا على تفسير محيطه والتنبؤ بما سيأتي بعد ذلك بسهولة تامة، تمامًا مثلما نقوم نحن معشر البشر كل يوم دون عناء.
وربما في المرات القادمة يمكن لميتا تعزيز رسالتها بعبارات أوضح تطرح فيها تفاصيل عملية أكثر، كالحديث بشكل أوضح عن كيفية تقييم أداء النماذج بالمقارنة مع الآخرين في المجال، أو إضافة أمثلة من واقع الحياة اليومية بشكل إضافي لتساعد القارئ على الربط بين التقنية الجديدة وواقعه الخاص. هذا من شأنه أن يجعل القارئ يشعر بمزيد من التواصل والاقتراب من العالم الجديد الذي ترسمه لنا التكنولوجيا يومًا بعد يوم.