الذكاء الاصطناعي لمنع انقراضه .. اللجوء إلى الذكاء الاصطناعي للحفاظ على 4000 لغة

أعلنت Meta عن نماذج ذكاء اصطناعي جديدة مفتوحة المصدر قادرة على التعرف على أكثر من 4000 لغة يتم الت بها حول العالم ، بزيادة أربعين ضعفًا عن المتاحة سابقًا.

تطلق Meta على هذه النماذج اسم “Massively Multilingual Speech Models” أو MMS ، وتدعي أنها قادرة على تحويل النص إلى كلام والعودة بأكثر من 1100 لغة ، أي عشرة أضعاف ما كان موجودًا سابقًا.

وتقول الشركة الأمريكية إن أحد أهدافها من وراء تطوير هذه النماذج هو الحفاظ على اللغات من خطر الانقراض ، حيث صرحت الشركة من خلال بيان نشر على موقعها الرسمي على ال قائلة: “العديد من لغات العالم موجودة خطر الاختفاء ، والقيود المفروضة على التعرف على الكلام وتوليد ال لن حاليا فقط لتسريع هذا الاتجاه “.

جعلت Meta نماذجها الجديدة مفتوحة المصدر ، بحيث يمكن للباحثين الوصول إليها والمساهمة في تطويرها ، من أجل المساعدة في الحفاظ على لغات العالم.

هناك العديد من المجالات التي يمكن فيها استخدام تقنيات الكلام القائمة على ، وفقًا لـ Meta ، مثل خدمات المراسلة وتقنيات و ، حيث ستفهم جميع الأصوات ، وتخدم المستخدم بلغته المفضلة.

تت نماذج التعرف على الكلام وتحويل النص إلى كلام تدريبًا على آلاف الساعات من التسجيلات الصوتية مع النصوص المصاحبة ، وهو أمر ضروري للغاية للخوارزميات لفهم النصوص وتصنيفها بشكل صحيح.

واجهت Meta صعوبات في جمع التسجيلات الصوتية للغات التي لا يتم التحدث بها على نطاق واسع ، حيث أن البيانات المتاحة حاليًا لا تغطي سوى 100 لغة الأكثر انتشارًا حول العالم.

لجأت إلى استخدام أساليب غير تقليدية للتغلب على هذه الصعوبات ، حيث قامت بجمع تسجيلات صوتية لنصوص دينية مترجمة إلى لغات مختلفة ، وربط تلك التسجيلات بترجمات معتمدة ، مما أتاح لميتا الحصول على 32 ساعة من البيانات – في المتوسط ​​- مقابل أقل. لغات مشتركة. ، وزاد إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.

تسعى Meta في المستقبل لدعم المزيد من اللغات في نماذجها اللغوية القائمة على الذكاء الاصطناعي ، بالإضافة إلى جعلها قادرة على التعامل مع اللهجات المختلفة لكل لغة ، وهو ما لا يزال يمثل ًا حتى الآن.

أضف تعليق