تطبيقات اكتشاف الأصوات المقلدة بتقنيات الذكاء الاصطناعي تنجح في خداع أشد المستمعين حدة وتركيزا

التطورات التكنولوجية مكنت من توليد نسخة شبه حقيقية من صوت أي شخص باستخدام جيل التسجيل.
الاثنين 2023/08/14
صعوبة في تمييز الأصوات المقلدة بواسطة الذكاء الاصطناعي

لندن - أظهرت دراسة لجامعة كوليدج لندن البريطانية أن أكثر من ربع الأصوات المقلدة باستخدام ما يعرف باسم "التزييف العميق” نجحت في خداع حتى أشد المستمعين حدة وتركيزا. وبحسب الباحثين في الجامعة، فإن أكثر من 500 شخص تم تدريبهم على تمييز الأصوات الحقيقية من المقلدة استطاعوا اكتشاف 73 في المئة فقط من الأصوات المقلدة أثناء الدراسة.

وتم إجراء الدراسة باستخدام اللغتين الإنجليزية والصينية (الماندرين)، حيث تشابهت النسب في نتائج اللغتين، رغم أن فريق البحث وجد أن الناطقين باللغة الإنجليزية استطاعوا تمييز الصوت البشري عن الصوت المقلد المولد باستخدام الذكاء الاصطناعي من خلال إيقاع التنفس، في حين أشار الناطقون باللغة الصينية إلى الإيقاع والسرعة وطلاقة الحديث كمعيار للتمييز.

ويذكر أنه يتم استخدام الأصوات المقلدة بدقة للاحتيال على الأشخاص والحصول منهم على الأموال من خلال ادعاء المحتال بأنه أحد الأصدقاء أو شركاء العمل ويطلب من الضحية تحويل أموال إليه. وأثارت التطورات الأخيرة في تكنولوجيا الذكاء الاصطناعي القلق من إمكانية انتشار عمليات الاحتيال بتقليد الأصوات خاصة مع قدرة تطبيقات الذكاء الاصطناعي على تقليد الأصوات بدرجة دقة عالية.

وحذر فريق الباحثين في الجامعة البريطانية من أنه “نتيجة للتطورات التكنولوجية، أصبح من الممكن توليد نسخة شبه حقيقية من صوت أي شخص باستخدام تسجيل لكلمات قليلة بصوته”. وقال الباحثون إن نتائج الدراسة قد لا تعكس الواقع الفعلي، لأن المشاركين في الدراسة حتى من غير المدربين، كانوا يعرفون أنهم جزء من تجربة وبالتالي كانوا أكثر تركيزا على اكتشاف الأصوات المقلدة.

التطورات الأخيرة في تكنولوجيا الذكاء الاصطناعي أثارت القلق من إمكانية انتشار عمليات الاحتيال بتقليد الأصوات خاصة مع قدرة التطبيقات على تقليد الأصوات بدرجة عالية
◙ التطورات في تكنولوجيا الذكاء الاصطناعي أثارت القلق من إمكانية انتشار عمليات الاحتيال بتقليد الأصوات خاصة مع قدرة التطبيقات على تقليد الأصوات بدرجة عالية

وتتركز أغلب جهود مكافحة تزييف الأصوات حاليا على استخدام أنظمة ذكاء اصطناعي أيضا لاكتشافها، والتي جاء أداؤها على نفس مستوى أداء الأشخاص المشاركين في تجربة الجامعة، لكنها تفوقت مقارنة بالأشخاص الذين لا يعرفون أنهم يشاركون في تجربة لاكتشاف الأصوات المقلدة.

وقال الباحثون إنه في ظل توقع حدوث تطوير وتقدم كبير في تقنيات تقليد الأصوات، المطلوب هو تطوير أدوات أكثر تقدما لاكتشافها. وقد كشفت شركة مايكروسوفت عن نموذج ذكاء اصطناعي جديد يحمل اسم “فال ـ إي”، والذي يمكنه تقليد الأصوات وتحويل النص إلى كتابة بطريقة مذهلة لم يسبق لها مثيل.

وعلى الرغم من وجود العديد من الخدمات على الإنترنت، أو برامج ذكاء اصطناعي يمكنها تقليد الأصوات، إلا أنها عادة ما تتطلب كمية كبيرة من البيانات، ونماذج كثيرة من تسجيلات الأصوات، حتى يتمكن البرنامج من تقليد الأصوات بشكل جيد، أو تحويل النصوص إلى جمل مسموعة.

ومع هذا، فطريقة الكلام في التسجيل النهائي الذي تقدمه أغلب تلك البرامج، غالباً ما تكون صناعية ويمكن تمييز أنها صادرة عن “روبوت”. لكن نموذج “فال ـ إي” الجديد يمكنه تقليد صوت أي شخص بطريقة واقعية جداً، وكل ما يحتاجه تسجيل صوتي مدته 3 ثوانٍ فقط. ويمكن أن يتطابق الكلام الذي ينتجه “فال ـ إي” مع نغمة الصوت وحتى نطق الكلمات بطريقة فيها مشاعر تبدو مطابقة للشخص الذي يتم تقليد صوته.

وليس هذا فحسب، بل حتى تقليد الأصوات في خلفية المقطع الأصلي، مثلاً لو كان في مقطع الصوت الأصلي أصوات عصافير أو أصوات سيارات أو أي نوع من الضوضاء، سيقوم “فال ـ إي” بتقليدها في مقاطع الصوت الجديدة المزيفة التي ينتجها. ومع أن “فال ـ إي” لا يحتاج سوى 3 ثوانٍ لتقليد الأصوات بشكل متقن، لكن للوصول إلى هذه المرحلة كانت شركة مايكروسوفت بحاجة إلى مجموعة بيانات ضخمة تضم أكثر من 60 ألف ساعة من التسجيلات، التي قدمها 7000 شخص يتحدثون اللغة الإنجليزية بلهجات مختلفة.

ويمكن لبرامج الذكاء الاصطناعي إنتاج أصوات واقعية لا حصر لها، من البيع بالتجزئة إلى التكنولوجيا المالية وحتى الألعاب، لكنها لا تخلو من مخاطر عديدة، وربما هذا أحد دوافع شركة مايكروسوفت إلى عدم جعل أكواد برنامج تقليد الأصوات “فال ـ إي” مفتوحة المصدر، حيث يمكن أن يتم استخدام التقنية في تقليد أصوات السياسيين والمشاهير، باستخدام مقاطع من أصواتهم على الإنترنت، ودمجها مع تقنيات التزييف العميق لإنتاج مقاطع مزيفة شديدة الواقعية، أو حتى يمكن لبعض المجرمين الوصول إلى البنوك أو الأنظمة الأمنية التي تستخدم البصمة الصوتية ككلمة مرور.

16