ذكاء اصطناعي

ابتكار صيني يسرّع صناعة الفيديوهات بالذكاء الاصطناعي في لمح البصر

مصطفى يسري
مصطفى يسري

3 د

كشف باحثون صينيون بالتعاون مع شينغشو تكنولوجي عن تقنية "TurboDiffusion" لتوليد مقاطع فيديو سريعًا.

التقنية قلّصت الوقت لإنشاء فيديو خمس ثوانٍ من ثمانين دقيقة إلى 24 ثانية.

تعتمد التقنية على "الانتشار التفاضلي" وتحسّن توليد الإطارات لتشجيع الإنتاج الأسرع.

تسارع هذه التقنية الإبداع في الوسائط، ما يفتح آفاقًا واستخدامات جديدة في التسويق والتعليم والترفيه.

يثير التطور تحديات حول المصداقية وحقوق الملكية مع تعزيز الصين لمكانتها في التوليد المرئي.

في حين ما زال العالم يختبر حدود ما يمكن أن تقدمه النماذج التوليدية في إنشاء الصور والنصوص، يأتي باحثون صينيون ليخطّوا خطوة جريئة نحو المستقبل السمعي‑البصري. فقد كشف فريق بحثي من جامعة تسينغهوا بالتعاون مع شركة شينغشو تكنولوجي عن تقنية جديدة تحمل اسم "TurboDiffusion"، قادرة على توليد مقاطع فيديو عالية الدقة خلال ثوانٍ قليلة. هذا التطور لا يمثل مجرد تسريع تقني، بل إعادة تعريف لكيفية صناعة المحتوى باستخدام الذكاء الاصطناعي.


تسريع الإنتاج من الساعات إلى الثواني

أظهرت التجارب المنشورة في الورقة البحثية أن "TurboDiffusion" قلّص وقت إنشاء فيديو مدته خمس ثوانٍ من ثمانين دقيقة إلى أربعٍ وعشرين ثانية فقط، أي ما يقارب مئتي مرة أسرع على الجهاز ذاته. هذا التحسين المذهل لم يأتِ على حساب الجودة، بل حافظ على التفاصيل الدقيقة والحركة السلسة التي تتطلبها أنظمة الفيديو التوليدية الحديثة.

يعتمد النظام على مقاربة حسابية جديدة في تقنيات "الانتشار التفاضلي" داخل نماذج الذكاء الاصطناعي، حيث جرى تحسين مراحل توليد الإطارات لتعمل بشكل متوازٍ وأكثر كفاءة. ويعد ذلك تحولًا يمكّن مطوري المحتوى والأستوديوهات من إنتاج مواد مرئية غنية بالسرعة التي كانت يومًا مجرد حلم.


من سـورا إلى توربو: تسارع السباق العالمي

منذ أن قدّمت شركة OpenAI أداتها "Sora" في مطلع عام 2024 لتحويل النصوص إلى فيديو، لم تتوقف المختبرات حول العالم عن محاولة تخطي سقف الأداء. ويبدو أن "TurboDiffusion" هو الرد الصيني الأقوى حتى الآن في هذا السباق، خصوصًا أنه يقدّم أداءً قابلاً للتطبيق التجاري بتكلفة أقل وزمن أقل.

يشير المحلل التقني كيون شو إلى أن هذا النوع من التطورات قد يبدّل المعادلة كليًا في صناعة الوسائط، فبدل أن تكون النماذج التوليدية عبئًا زمنيًا، ستصبح عنصر تسريع في دورة الإنتاج. ومعنى ذلك أن الأفكار قد تتحول إلى مقاطع جاهزة خلال دقائق، ما يفتح الباب أمام استخدامات جديدة في التسويق والتعليم والترفيه.


تداعيات أوسع على سوق الإبداع

اختصار زمن الإنتاج إلى هذه الدرجة يخلق نقلة في العلاقة بين الإنسان والآلة الإبداعية. فبينما كان المبدعون يحتاجون لساعات اختبار وتجريب، يمكنهم الآن رؤية النتائج شبه الفورية لما يتخيلونه. هذه الفورية قد تعيد تعريف الإلهام نفسه، وتغيّر دور المصمم أو صانع الأفكار ليصبح موجهًا ومقيّمًا أكثر من كونه منفذًا.

كما يتوقع خبراء الذكاء الاصطناعي أن تُحدث هذه الكفاءة تأثيرًا كبيرًا في استهلاك الطاقة، وفي حجم البنية التحتية المطلوبة لتشغيل نماذج الفيديو المتقدمة، خاصة مع الاعتماد على معالجات رسوميات من الجيل الجديد مثل Nvidia RTX 5090 التي تدعم هذه التطبيقات.


آفاق المستقبل بين الابتكار والمسؤولية

مع كل قفزة تقنية كهذه، يبرز سؤال حول الحدود الأخلاقية والعملية لاستخدام الذكاء الاصطناعي في إنتاج الصور المتحركة. فسهولة إنشاء مقاطع واقعية التكوين قد تثير تحديات تتعلق بالمصداقية وحقوق الملكية، تمامًا كما حدث في مجالات الصوت والصورة خلال الأعوام الأخيرة.

ذو صلة

لكن الواضح أن "TurboDiffusion" يرسخ مكانة الصين كمنافس رئيسي في ميدان التوليد المرئي، ويقدم دلالة جديدة على نضج الأبحاث الأكاديمية والصناعية هناك. التقنية لم تعد مجرد ترف معرفي، بل أصبحت بنية تحتية لإبداع أسرع وأرخص وأكثر شمولًا.

قد تبدو الأرقام التقنية مبهرة، لكن ما يهم في النهاية هو ما ستعنيه هذه السرعة بالنسبة لطريقة سرد القصص وتوثيق الواقع. ربما يأتي يوم لا نفرّق فيه بين تجربة فنية أنتجها المخرج بكاميرته، وأخرى نسجها الذكاء الاصطناعي بلمسة رمزية. ومع ذلك، يظل الإنسان—بعقله وخياله—العنصر الذي يمنح تلك المقاطع معنى يتجاوز سرعة المعالجة الرقمية.

ذو صلة