ميتا تطلق نموذج ذكاء اصطناعي لترجمة الأحاديث بين العشرات من اللغات

نموذج "سيمليس إم.4.تي" يمكن أن يدعم الترجمة من نص إلى حديث والعكس بما يقرب من 100 لغة.
الخميس 2023/08/24
النموذج سيكون متاحا للعامة للأغراض غير التجارية

نيويورك - أطلقت شركة ميتا بلاتفورمز المالكة لمنصة فيسبوك نموذج ذكاء اصطناعي لديه القدرة على ترجمة الأحاديث وتفريغها صوتيا بالعشرات من اللغات، واضعة لبنة بناء محتملة لأدوات تمكّن من التواصل في الوقت الفعلي كاسرة الحواجز بين اللغات.

وقالت الشركة في تدوينة إن نموذجها “سيمليس إم.4.تي” يمكن أن يدعم الترجمة من نص إلى حديث والعكس بما يقرب من 100 لغة، بالإضافة إلى ترجمة كاملة من حديث إلى حديث بأكثر من 35 لغة، جامعا بين تقنيات كانت متاحة فيما سبق في نماذج منفصلة فحسب.

وأعرب مارك زوكربيرغ الرئيس التنفيذي لميتا عن اعتقاده بأن تيسر هذه الأدوات التفاعل بين المستخدمين من جميع أنحاء العالم في الميتافيرس، وهو مجموعة من العوالم الافتراضية المتصلة التي يراهن بمستقبل الشركة عليها.

وذكرت التدوينة أن ميتا ستجعل النموذج متاحا للعامة للأغراض غير التجارية.

مارك زوكربيرغ يعرب عن اعتقاده بأن تيسر هذه الأدوات التفاعل بين المستخدمين من جميع أنحاء العالم في الميتافيرس

وأصدرت الشركة الأكبر في مجال وسائل التواصل الاجتماعي مجموعة من نماذج الذكاء الاصطناعي المجانية هذا العام، بما في ذلك نموذج لغوي ضخم اسمه “لاما” ويشكل تحديا خطرا للنماذج المباعة والمسجلة لشركة أوبن إيه.آي المملوكة لمايكروسوفت وشركة جوجل المملوكة لألفابت.

ويقول زوكربيرغ إن منظومة الذكاء الاصطناعي المفتوحة تصب في مصلحة ميتا، إذ ستحقق الشركة مزيدا من المكاسب من خلال حشد المصادر في إنشاء أدوات للاتصال المباشر بالمستهلكين في منصاتها الاجتماعية بدلا من فرض رسوم على حق الاطلاع على النماذج واستخدامها.

لكن ميتا تواجه تساؤلات قانونية مثل بقية جهات القطاع حول البيانات التدريبية المستخدمة في تغذية نماذجها.

ورفعت الفنانة الكوميدية سارة سيلفرمان ومؤلفان آخران في يوليو الماضي قضايا لانتهاك حقوق الملكية على ميتا وأوبن إيه.آي، متهمين الشركتين باستخدام كتبهم كبيانات تدريبية من دون الحصول على الموافقة.

وقال باحثون من ميتا في ورقة بحثية إنه بالنسبة إلى نموذج “سيمليس إم.4.تي”، فقد جمعوا البيانات التدريبية الصوتية من أربعة ملايين ساعة من “الأصوات الخام التي مصدرها مستودع بيانات ويب متاح للعامة”، من دون تحديد أيّ مخزون.

ولم يردّ متحدث باسم ميتا على أسئلة حول مصدر البيانات الصوتية.

وذكرت الورقة البحثية أن البيانات النصية مصدرها قواعد بيانات منشأة العام الماضي استعانت بمحتوى من “ويكيبيديا” ومواقع مرتبطة بها.

5