إطلاق نموذج مولمو 2 الذكي: قدرات مذهلة بمعالجة بيانات أقل

3 د
كشفت مؤسسة «آلن للذكاء الاصطناعي» عن Molmo 2، نموذج أصغر وأكثر فهمًا للصور والفيديوهات.
يتمتع Molmo 2 بدقة عالية في فهم السياق الزمني والربط بين الصور والأحداث.
النموذج يعتمد على كفاءة البيانات وليس حجمها، متفوقًا على النماذج الرائدة في فهم الفيديو.
طرحت المؤسسة أوزان النموذج وبيانات تدريبه بشكل مفتوح للباحثين عالميًا.
يتجلى التوجه الجديد في الذكاء الاصطناعي بتركيز على جودة تصميم النماذج وكفاءة البيانات.
في الوقت الذي تتجه فيه شركات الذكاء الاصطناعي إلى بناء نماذج أضخم وتدريبها على كميات هائلة من البيانات، اختارت مؤسسة «آلن للذكاء الاصطناعي» طريقًا معاكسًا. فقد كشفت عن Molmo 2، الجيل الجديد من نموذجها المتعدد الوسائط، أصغر حجمًا لكنه أكثر فهماً للصور والفيديوهات ولتعقيدات الزمن والمكان داخلها. خطوة تبدو وكأنها تحدٍ لفكرة أن "الكِبر دائمًا يعني تفوقًا".
Molmo 2: ذكاء أكثر بحجم أقل
يأتي Molmo 2 بسعة 8 مليارات مُعامل فقط، أي عُشر حجم الإصدار السابق تقريبًا الذي تجاوز 72 مليارًا، لكنه يتفوق عليه في الدقة، وفهم التسلسل الزمني، والربط بين الصورة والسياق الزمني. المفاجأة أن هذا التحسن لم يعتمد على المزيد من البيانات، بل العكس تمامًا؛ فالنموذج الجديد تدرّب على نحو 9.19 ملايين فيديو فقط مقابل أكثر من 70 مليونًا استخدمتها بعض النماذج الأخرى مثل PerceptionLM من «ميتا». بهذا الإنجاز، يفتح Ai2 بابًا للنقاش حول كفاءة البيانات بدلًا من كميتها.
تقدّم في الفهم البصري والزمني
يركز Molmo 2 على ما يُعرف بـ"الفهم العميق للفيديو"، أي القدرة على تحديد أين تحدث الأحداث ومتى، وربط الأجسام بحركاتها عبر الإطارات المتتابعة. يشمل ذلك مهارات التتبع، وتأشير الكائنات في المشهد، وتحليل تتابع الأفعال بطريقة تتيح للنظام فهم القصص المصوّرة وليس مجرد معالجتها بصريًا. هذا التطور يمهد لاستخدامات جديدة في مجالات كالسلامة في الأنظمة الذاتية، وتحليل الفيديو في الروبوتات، وحتى تحسين أدوات المونتاج الذكي.
"بجزء بسيط من البيانات، يتفوق Molmo 2 على الكثير من النماذج الرائدة في مهام فهم الفيديو"، كما صرح علي فرهادي، المدير التنفيذي لمؤسسة Ai2، مؤكدًا أن هذا النموذج يمثل خطوة جديدة نحو منظومة مفتوحة بالكامل للذكاء الاصطناعي.
انفتاح نادر في بيئة مغلقة
ما يميز Molmo 2 لا يقف عند الأداء فقط، بل يمتد إلى الطريقة التي طُرح بها. فالمؤسسة نشرت أوزان النموذج وبيانات تدريبه وتقاريره التقنية بشكل مفتوح ليتمكن الباحثون حول العالم من مراجعتها والبناء عليها. هذا النهج الشفاف يعاكس الاتجاه السائد بين الشركات الكبرى التي تُبقي نماذجها وبياناتها ضمن أنظمة مغلقة. بالنسبة للمجتمع العلمي، يُعد Molmo 2 مثالًا عمليًا على أن الانفتاح البحثي لا يعني التضحية بالمنافسة.
ثلاثة إصدارات لتطبيقات متنوعة
طرحت Ai2 ثلاثة إصدارات رئيسية من النموذج: Molmo 2 (4B)، وMolmo 2 (8B)، وMolmo 2-O الذي يعتمد تمامًا على بنية «Olmo» المفتوحة المصدر. كما أُطلقت نسخ مخصصة لمهام التأشير والتتبع، مما يسمح للمطورين باختيار ما يناسب حالات الاستخدام الخاصة بهم بين كفاءة الأداء وسرعة المعالجة. هذا التنوع يعزز من مكانة Molmo 2 كمنصة يمكن البناء عليها في مجالات متعددة من التصوير إلى القيادة الذاتية.
دروس من Molmo 2 لمستقبل الذكاء الاصطناعي
يبعث Molmo 2 رسالة بسيطة لكنها قوية: ليس حجم النموذج وحده ما يحدد ذكاءه، بل جودة تصميمه واستغلال البيانات بفاعلية. في عالم تتسابق فيه الشركات لزيادة المعاملات، تقدم Ai2 مثالًا على مسار أكثر استدامة وشفافية. ربما تكون هذه هي البداية لتحول أوسع نحو نظم ذكاء اصطناعي تُفكر وتتعلم بذكاء حقيقي، لا بقوة الحوسبة فقط.









