جوجل تطلق مكتبة الذكاء الاصطناعي المتطورة بميزة الصوت وتجلبها إلى متجر Google Play

2 د
أطلقت جوجل تحديثًا لتطبيق Google AI Edge Gallery عبر جوجل بلاي لدعم الصوت.
يمثل نموذج Gemma 3n الجديد نقلة نوعية في معالجة البيانات الصوتية محليًا.
ميزة Audio Scribe تُمكّن من تحويل الصوت إلى نصوص على الأجهزة دون خوادم خارجية.
التطبيق مفتوح المصدر على GitHub، مما يشجّع مشاركة المطورين في تطوير النماذج.
يتيح إدخال الصوت تقدمًا في التطبيقات الذكية التي تعمل بدون الاعتماد على السحابة.
أطلقت جوجل تحديثاً جديداً لمنصة Google AI Edge، حيث أضافت ميزات معالجة الصوت إلى نموذجها المتقدم Gemma 3n. أصبح تطبيق Google AI Edge Gallery متاحاً الآن بشكل رسمي بنسخته التجريبية (Open Beta) على متجر جوجل بلاي، مما يسمح للمطورين والمستخدمين بتجربة قدرات الذكاء الاصطناعي "على الجهاز" دون الحاجة لاتصال بالإنترنت.
معالجة الصوت داخل هاتفك: كيف تعمل؟
تسمح التقنية الجديدة للهواتف بفهم الكلام وتحويله إلى نصوص بدقة عالية مع الحفاظ على خصوصية المستخدم. يدعم نموذج Gemma 3n حالياً معالجة مقاطع الصوت التي تصل مدتها إلى 30 ثانية من خلال واجهة برمجة تطبيقات MediaPipe LLM Inference. تكمن أهمية هذا التحديث في قدرة الهاتف على أداء مهام معقدة كانت تتطلب سابقاً خوادم سحابية ضخمة.
- تحويل الكلام إلى نص (Speech-to-Text): تفريغ الملفات الصوتية المسجلة لعدة لغات بدقة فائقة.
- الترجمة الفورية للصوت: ترجمة الكلام المنطوق مباشرة إلى نصوص بلغة أخرى على شاشة الهاتف.
- ميزة Audio Scribe: ميزة تفاعلية داخل التطبيق تسمح باستخدام ميكروفون الجهاز لتسجيل الملاحظات وتحويلها لنصوص في نفس اللحظة.
مثال عملي: ميزة Audio Scribe
عند فتح تطبيق Google AI Edge Gallery، سيجد المستخدم خيار "Audio Scribe". بمجرد الضغط على زر التسجيل والتحدث باللغة الإسبانية مثلاً، يقوم نموذج Gemma 3n بتحليل الترددات الصوتية وتوليد نص إنجليزي مترجم فوراً. تتم هذه العملية بالكامل داخل معالج الهاتف، مما يعني سرعة في الاستجابة وعدم تسرب أي بيانات صوتية خارج الجهاز.
ماذا بعد؟ خطة جوجل المستقبلية
أكدت جوجل أن هذا التحديث هو البداية فقط. تخطط الشركة لجلب التطبيق لمستخدمي هواتف آيفون (iOS) قريباً، بالإضافة إلى دعم ميزات "الاسترجاع المعزز" (RAG) واستدعاء الوظائف البرمجية مباشرة من الجهاز. كما سيتم نقل التطبيق بالكامل إلى نظام LiteRT-LM الجديد لتوفير شفافية أكبر للمطورين.
يمكنك الآن تحميل التطبيق وتجربة هذه الميزات من خلال متجر Google Play، أو الاطلاع على الكود المصدري للمشروع عبر موقع GitHub.









