ذكاء اصطناعي

انتهى عصر التنقيب عن كنوز بيانات الذكاء الاصطناعي

مصطفى يسري
مصطفى يسري

3 د

تشهد صناعة الذكاء الاصطناعي تحولات قانونية وتجارية تُغيّر من ممارساتها السابقة.

بدأت شركات مثل Cloudflare في حجب الزواحف الآلية ما لم يتم الدفع مقابل الوصول.

شركات النشر تسعى لإنشاء معايير جديدة لاسترجاع السيطرة على محتواها الرقمي.

تقدمت Reddit بعروض تراخيص بقيمة 203 ملايين دولار لشركات الذكاء الاصطناعي.

تدرجة جودة المحتوى المتولد آليًا يشكل تحديًا لجودة نماذج الذكاء الاصطناعي.

تشهد صناعة الذكاء الاصطناعي تحوّلًا جذريًا مع انقضاء مرحلة “التدريب المجاني” على بيانات الويب، حيث أعلنت جهات كبرى مثل Quartz أن السباق نحو بناء النماذج الأضخم بات يصطدم بجدران قانونية وتجارية جديدة. شركات التقنية التي اعتادت جمع المحتوى المفتوح من الإنترنت تواجه اليوم نظامًا مختلفًا بالكامل: الإنترنت أصبح خاضعًا لرسوم عبور رقمية.


البيانات لم تعد مجانية

مع تزايد الدعاوى القضائية من مؤسسات إعلامية وكُتاب ضد شركات الذكاء الاصطناعي، بدأت هذه الشركات تدرك أن نموذج “الويب المفتوح” لم يعد قابلًا للاستمرار. شركة Cloudflare، التي تدير نحو 20% من حركة الإنترنت، قررت مؤخرًا حجب الزواحف الآلية الخاصة بـ AI افتراضيًا، ما لم تدفع مقابل الوصول. بذلك، تغيّر ميزان القوى بين منتجي المحتوى ومستهلكيه الآليين لأول مرة منذ أكثر من عقد.

وصلت نسب الطلبات التي تنفذها روبوتات الذكاء الاصطناعي إلى مستويات ضخمة دون تقديم زيارات فعلية للمواقع، إذ سجل Claude من Anthropic أكثر من 70 ألف طلب لكل إحالةٍ واحدةٍ فقط، بينما تراوحت نسب OpenAI ضمن مئات الطلبات مقابل زيارات محدودة، في وقت يحافظ فيه محرك بحث مثل Google على توازن تقريبي بمعدل 9 طلبات للإحالة الواحدة. تلك الأرقام كشفت أن العلاقة بين النماذج ومصادر بياناتها ليست شراكة كما تصورها البعض، بل استهلاك أحادي الاتجاه.


اقتصاد الترخيص الجديد

تسعى شركات النشر لإنشاء معايير واضحة تتيح استرجاع السيطرة على محتواها. من أبرز هذه المبادرات معيار “RSL” أو “الترخيص البسيط للذكاء الاصطناعي” الذي يفرض على أنظمة الزحف تقديم رموز ترخيص معتمدة قبل الوصول إلى الصفحات. تقف خلف هذا المعيار كيانات إعلامية كبرى مثل Reddit وMedium وO’Reilly، في محاولة لتأسيس اقتصاد بيانات يدفع فيه من «يستخدم» مقابل من «ينتج».

  • Reddit أبرمت اتفاقًا بقيمة 203 ملايين دولار لتراخيص بياناتها مع شركات الذكاء الاصطناعي.
  • شركة Anthropic وافقت على تسوية تصل إلى 1.5 مليار دولار مع مؤلفين حول استخدام الكتب في تدريب نماذجها.
  • منصات مالية مثل WalletHub بدأت تغلق محتواها المجاني وتتوفر فقط للمسجلين.

“الاتفاق السابق القائم على تبادل المحتوى مقابل الزيارات لم يعد منطقيًا”، كتب الرئيس التنفيذي لـ Cloudflare، ماثيو برينس.


تداعيات واسعة على نظام المعرفة الرقمي

تأثير هذا التحوّل لا يقتصر على قطاع الإعلام؛ إذ يُتوقع أن تواجه شركات الذكاء الاصطناعي تحديات حقيقية في الحفاظ على جودة نماذجها، مع تقلص حجم المحتوى البشري المتجدد وتزايد المواد المولَّدة آليًا. بعض التحليلات تحذر من دائرة مغلقة، حيث تعتمد النماذج على محتوى مُولّد منها، مما قد يؤدي إلى “انكماش الجودة” في الإنترنت المفتوح، وهو ما أقرّت به Google ضمن وثائق قضائية حين وصفت حالة الويب بأنها “انحدار سريع”.

على الجانب الآخر، يُمكن لهذا التحول أن يفتح بابًا لابتكارات جديدة في أساليب الترخيص والتصنيف الرقمي، وربما نشهد ظهور بنى تحتية تعتمد على “البيانات الموثوقة” كعنصر تنافسي رئيسي بين الشركات. هذا الاتجاه يتقاطع مع نقاشات متزايدة حول حقوق المحتوى في عصر الذكاء الاصطناعي ودور التقنين في حماية الإبداع الإنساني ضمن منظومات التدريب الضخمة.

ذو صلة

ما بعد الاندفاع الذهبي

يبدو أن "حمّى الذهب" الخاصة ببيانات الإنترنت قد انتهت، ليبدأ فصل جديد في علاقة البشر والآلات مع الملكية الفكرية. ومع تضاؤل المساحات المجانية، سيتحوّل الوصول إلى البيانات إلى سلعة بحد ذاته، يتنافس عليها عمالقة التقنية مقابل الناشرين الأفراد والمجتمعات. في النهاية، قد تكون هذه لحظة لإعادة التوازن: حين يُعاد تعريف الذكاء الاصطناعي ليس فقط بما يتعلمه من البشر، بل بما يدفعه لهم أيضًا.

ذو صلة