أعلنت Meta عن نماذج ذكاء اصطناعي جديدة مفتوحة المصدر قادرة على التعرف على أكثر من 4000 لغة يتم التحدث بها حول العالم ، بزيادة أربعين ضعفًا عن التقنيات المتاحة سابقًا.
تطلق Meta على هذه النماذج اسم “Massively Multilingual Speech Models” أو MMS ، وتدعي أنها قادرة على تحويل النص إلى كلام والعودة بأكثر من 1100 لغة ، أي عشرة أضعاف ما كان موجودًا سابقًا.
وتقول الشركة الأمريكية إن أحد أهدافها من وراء تطوير هذه النماذج هو الحفاظ على اللغات من خطر الانقراض ، حيث صرحت الشركة من خلال بيان نشر على موقعها الرسمي على الإنترنت قائلة: “العديد من لغات العالم موجودة خطر الاختفاء ، والقيود المفروضة على التعرف على الكلام وتوليد التكنولوجيا لن حاليا فقط لتسريع هذا الاتجاه “.
جعلت Meta نماذجها الجديدة مفتوحة المصدر ، بحيث يمكن للباحثين الوصول إليها والمساهمة في تطويرها ، من أجل المساعدة في الحفاظ على لغات العالم.
هناك العديد من المجالات التي يمكن فيها استخدام تقنيات الكلام القائمة على الذكاء الاصطناعي ، وفقًا لـ Meta ، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز ، حيث ستفهم جميع الأصوات ، وتخدم المستخدم بلغته المفضلة.
تتطلب نماذج التعرف على الكلام وتحويل النص إلى كلام تدريبًا على آلاف الساعات من التسجيلات الصوتية مع النصوص المصاحبة ، وهو أمر ضروري للغاية للخوارزميات لفهم النصوص وتصنيفها بشكل صحيح.
واجهت Meta صعوبات في جمع التسجيلات الصوتية للغات التي لا يتم التحدث بها على نطاق واسع ، حيث أن البيانات المتاحة حاليًا لا تغطي سوى 100 لغة الأكثر انتشارًا حول العالم.
لجأت ميتا إلى استخدام أساليب غير تقليدية للتغلب على هذه الصعوبات ، حيث قامت بجمع تسجيلات صوتية لنصوص دينية مترجمة إلى لغات مختلفة ، وربط تلك التسجيلات بترجمات معتمدة ، مما أتاح لميتا الحصول على 32 ساعة من البيانات – في المتوسط - مقابل أقل. لغات مشتركة. ، وزاد إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.
تسعى Meta في المستقبل لدعم المزيد من اللغات في نماذجها اللغوية القائمة على الذكاء الاصطناعي ، بالإضافة إلى جعلها قادرة على التعامل مع اللهجات المختلفة لكل لغة ، وهو ما لا يزال يمثل تحديًا حتى الآن.