ذكاء اصطناعي

Mistral AI تكشف عن نموذج OCR 3 الجديد لتحويل المستندات الورقية إلى بيانات رقمية بذكاء مذهل

مصطفى يسري
مصطفى يسري

2 د

تُعيد ميسترال تعريف دقة قراءة الوثائق بالنموذج الجديد Mistral OCR 3.

يحقق النموذج الجديد تفوقًا بنسبة 74% مقارنةً بالإصدار السابق.

يسهّل تحويل الملفات إلى نصوص مرتبة أو بيانات JSON عبر Document AI Playground.

يتميز النموذج بقدرته على التعامل مع المستندات المليئة بالجداول والملاحظات.

يتيح النموذج حجمًا أصغر وتكلفة تشغيلية منخفضة بفضل واجهة API بسعر مناسب.

حين تقترب العدسات من الورق الممسوح ضوئياً، يصبح الخط المتعرّج أشبه بلغزٍ يسعى الذكاء الاصطناعي إلى حله. في هذا المشهد التقني المليء بالتفاصيل الدقيقة، تبرز شركة «ميسترال» بإصدار جديد يحمل اسم Mistral OCR 3، نموذج التعرف البصري على الحروف الذي يعيد تعريف دقة قراءة المستندات والوثائق الرقمية.


قفزة نوعية في فهم الوثائق

حقق النموذج الجديد تفوقاً واضحاً بنسبة 74٪ مقارنةً بالإصدار السابق Mistral OCR 2، وهو رقم يثير الاهتمام حين يتعلق الأمر باستخراج النصوص من النماذج المعقّدة أو الأوراق الممسوحة بجودة منخفضة. هذه التحسينات لم تأتِ فقط بنتائج أدق، بل فتحت الباب أمام استخدام التطبيق داخل بيئة Mistral AI Studio عبر مساحة عمل تُعرف باسم Document AI Playground، يستطيع فيها المستخدمون تحويل ملفات PDF وصورهم إلى نصوص مرتبة أو بيانات JSON منظمة بسهولة.


ذكاء بصري يخاطب التفاصيل

تكمن القوة الحقيقية للنموذج في قدرته على التعامل مع المستندات المليئة بالجداول الكثيفة والملاحظات بخط اليد، وهي مناطق طالما شكّلت تحدياً أمام تقنيات OCR الأخرى. فبدلاً من الاقتصار على تحويل النصوص الظاهرة، يتعامل Mistral OCR 3 مع البنية البصرية للمستند، مستفيداً من خوارزميات مدرّبة على التعرف على الأنماط الدقيقة وتوحيد تنسيقات الجداول عبر مخرجات HTML قابلة للتحرير.


اقتصاد الأداء وحجم النماذج

إلى جانب التطور في الدقة، يقدّم النموذج الجديد حجماً أصغر يترجم إلى انخفاض في التكلفة التشغيلية ويجعل دمجه في الأنظمة المؤسسية أكثر سلاسة. الخدمة متاحة عبر واجهة API بسعر 2 دولار لكل 1000 صفحة، مع خصم خاص للمعالجة على دفعات كبيرة، ما يجعلها جذابة للشركات التي تتعامل مع ملايين الصفحات سنوياً مثل مؤسسات المحاسبة والتأمين والبحث العلمي.


وجهة جديدة للمؤسسات الرقمية

تركز «ميسترال إيه آي» على جانب دقيق من الذكاء الاصطناعي: الفهم العميق للوثائق. فبينما تتجه الأنظار عادة إلى النماذج اللغوية الضخمة، تتحرك الشركة نحو الواقع اليومي الذي يضم آلاف المعاملات الورقية. هذا التوجه يمنحها مكانة مميزة في سوق الأدوات المؤسسية، إذ تجمع بين معالجة اللغة الطبيعية والتعرف البصري على الحروف لبناء سلاسل عمل مؤتمتة بالكامل.


أفق أوسع للذكاء الإصطناعي الموجّه للمستندات

ذو صلة

يرى محللون أن Mistral OCR 3 يشير إلى اتجاه أعمق في صناعة الذكاء الاصطناعي، حيث تتلاقى الدقة التقنية مع كفاءة التشغيل لخلق نماذج هجينة تحاكي طريقة قراءة الإنسان للمستند. ومع إطلاقها لأنظمة Playground وأدوات المقارنة داخل Mistral Studio، يبدو أن الشركة تُعِد لبنية تحتية متكاملة قادرة على إدارة المعرفة المؤسسية من لحظة المسح حتى مرحلة التحليل.

ما بين الكاميرا والورقة، تتشكل طبقة جديدة من الفهم الرقمي. ومع أن OCR قد يبدو تقنية قديمة، فإن عودته بهذا الشكل الذكي تعني أن الذكاء الاصطناعي لم يعد يبحث عن النص فحسب، بل يسعى إلى قراءة النية خلف ترتيب الجداول وملاحظات القلم. هذه الخطوة لا تتعلق بتقنية واحدة، بل بفتح بابٍ جديد نحو وثائق تفهم العالم مثلما يفعل أصحابها.

ذو صلة