شركة 1X تكشف عن نموذج عالمي جديد لتعزيز ذكاء منصة الروبوتات NEO
يتحرك الروبوت بأداء سلس بفضل نموذج 1XWM الجديد وفهمه السياقي للعالم.
يعتمد النموذج على فيديوهات تدريبية وبيانات بشرية، مما يحسن من محاكاة الأفعال.
يتوقع الروبوت التسلسل الحركي باستخدام نموذج ديناميكيات عكسية مما يزيد الدقة.
التوقيت يعتبر حاسمًا، حيث يعدل من نهج التدريب ليعزز استقلالية الروبوتات المنزلية.
يمكن أن يغير هذا التطور كيفية فهم الروبوتات للبيئات المنزلية والتفاعل معها بذكاء.
في مشهد هادئ داخل شقة تجريبية، يتحرك روبوت منزلي بخطوات محسوبة، يلتقط غرضًا من الأرض، ثم يتوقف كأنه يفكر. ما يحدث هنا ليس استعراضًا حركيًا، بل اختبارًا لطريقة جديدة يفهم بها الروبوت العالم من حوله. هذا هو السياق الذي أعلنت فيه شركة 1X Technologies عن إدماج نموذجها الجديد 1XWM داخل منصة الروبوت البشري NEO، في خطوة تعكس تحولًا أعمق في كيفية تدريب الروبوتات على الفهم والتصرف.
ما الذي تعنيه 1XWM لمنصة NEO
النموذج الجديد 1XWM ليس مجرد تحديث برمجي، بل تغيير في الفلسفة. بدل الاعتماد على نماذج الرؤية واللغة والحركة التقليدية، يعتمد على تدريب مسبق قائم على فيديوهات واسعة النطاق من الإنترنت، مدعومة ببيانات بشرية وروبوتية من منظور الشخص الأول. النتيجة هي نموذج يُنتج محاكاة فيديوية مستقبلية بناءً على أوامر نصية، ثم يُحوّل هذه التوقعات إلى أوامر حركة دقيقة.
هذا الأسلوب يخفف اعتماد الشركة على آلاف الساعات من عروض الأداء اليدوية للروبوت، وهو أحد أكبر العوائق أمام توسيع مهارات الروبوتات المنزلية. هنا، يصبح التعلم أقرب إلى الفهم السياقي، لا التلقين الحركي.
تحول في مفهوم نماذج العالم
فكرة أن الروبوت يستطيع تخيل ما سيحدث قبل أن يتحرك ليست جديدة، لكنها كانت نظريًا أو محدودة النطاق. ما تحاوله 1X هو جعل هذا التخيل عمليًا، عبر نموذج توليدي للفيديو يحتوي على 14 مليار مُعامل، مهيأ خصيصًا لجسم NEO البشري. النموذج يتوقع التسلسل الحركي، ثم يستخدم نموذج ديناميكيات عكسية لترجمة المشهد المتخيل إلى فعل.
زمن الاستدلال الحالي، نحو 11 ثانية لكل محاكاة، يشير إلى أن التقنية ما زالت في مرحلة الاختبار، لكن التعاون مع مزودي البنية التحتية السحابية مثل Verda يعكس إدراك الشركة لأهمية تقليل الكمون قبل الإطلاق التجاري.
كيف يتعامل النموذج مع العالم الحقيقي
بحسب الاختبارات الداخلية وردود فعل المستخدمين الأوائل، يُظهر 1XWM قدرة أفضل على التعامل مع أشياء وحركات لم تظهر في بيانات التدريب. هذا النوع من التعميم هو ما يمنح الروبوت مرونة حقيقية داخل البيئات المنزلية المتغيرة، حيث لا توجد سيناريوهات مثالية أو ثابتة.
المهام التي تتطلب تنسيقًا ثنائي اليدين أو تحكمًا دقيقًا في الإمساك أصبحت أكثر استقرارًا، وهو ما يعزوه الباحثون إلى استخدام بيانات بشرية من منظور العين، مع توصيف لغوي غني ساعد النموذج على فهم العلاقات الفيزيائية بشكل أقرب للواقع.
لماذا يهم هذا التطور الآن
توقيت الإعلان مهم بقدر التقنية نفسها. سباق الروبوتات البشرية لم يعد يقتصر على العتاد، بل انتقل إلى نماذج العالم والفهم. قدرة الروبوت على التنبؤ، التخيل، ثم التنفيذ، تضعه في مساحة وسطى بين الذكاء الاصطناعي التوليدي والأنظمة الفيزيائية.
بالنسبة لـ 1X Technologies، هذا النهج قد يكون المفتاح لتسريع الوصول إلى روبوت منزلي أكثر استقلالية، دون تكلفة تدريب ضخمة. وبالنسبة للصناعة ككل، هو اختبار عملي لفكرة أن البيانات البشرية العامة قد تكون كافية لتعليم الآلات كيف تتصرف وسط البشر.
في النهاية، لا يتعلق الأمر بسرعة الروبوت أو عدد مهامه، بل بدرجة فهمه للعالم الذي يتحرك فيه. وإذا نجح هذا النموذج في الانتقال من المختبر إلى المنازل، فقد نكون أمام جيل من الروبوتات يتعلم قبل أن يتحرك، ويفكر قبل أن يلمس.










