تكنولوجيا استنساخ الأصوات تشعل المواجهة بين البشر والذكاء الاصطناعي

توفير المزيد من الإصدارات المسموعة من الكتب دفع بدور النشر من منتجي النسخ الصوتية للبحث عن بدائل رخيصة، نظرا إلى التكلفة العالية المتعلقة بهذه العملية، ووجد البعض منهم في الاستثمار في استنساخ الأصوات والأصوات الاصطناعية حلا لذلك، لاسيما مع تزايد اعتماد عمالقة التكنولوجيا بشكل كبير على الذكاء الاصطناعي للمساهمة في انتعاش سوق الكتب الصوتية، ما جعل مستقبل الأصوات البشرية ضبابيا في القطاع.
باريس - تحث التكلفة العالية لجعل شخص يقرأ كتابا كاملا بعض منتجي النسخ الصوتية من المؤلفات على الاستثمار في استنساخ الأصوات والأصوات الاصطناعية، وهي ظاهرة تم تسليط الضوء عليها على هامش فعاليات مهرجان باريس للكتاب الذي انتظم خلال الفترة الممتدة من الحادي عشر إلى غاية الثالث عشر من أبريل الجاري.
ويعتبر مستقبل إنتاجات من هذا النوع، سواء كانت مكلفة أم مكلفة جدا، غير واضح بين الكتب الصوتية التي باتت تعتمد بشكل متزايد على الذكاء الاصطناعي. وشكل مهرجان باريس للكتاب مناسبة لإعلانين في هذا الصدد. وتشير “ليبرينوفا”، الشركة الفرنسية الأهم في مجال النشر الذاتي، إلى أنها تستخدم “تكنولوجيا استنساخ الصوت التي توفّر جودة أعلى بكثير من جودة الأصوات الاصطناعية، التي غالبا ما تكون آلية جدا.”
وتقوم هذه التكنولوجيا على أن يسجّل المؤلف بصوته جزءا صغيرا فقط من كتابه ثم يتولى الذكاء الاصطناعي قراءة الجزء الآخر بالصوت نفسه. من جهتها، أعلنت منصة “سبوتيفاي” للبث التدفقي أنها تستثمر مليون يورو في “كتب ترويها أصوات اصطناعية،” أي آلة تحاكي الصوت البشري بدقة متزايدة، موضحة أن “تكاليف الإنتاج المرتفعة والاعتماد الذي لا يزال ناشئا على الكتب الصوتية له عواقب تتمثل في الحدّ من العرض والكتب المتوافرة بالفرنسية.”
وتذكر “سبوتيفاي” بوضوح لمستخدميها لمن يعود الصوت الذي يقرأ لهم، لكي يقرروا بأنفسهم ما إذا كانوا يوافقون أم لا على الصوت الاصطناعي. وكانت منصة البث التدفقي السويدية قد أعلنت أن الكتب المسموعة تشكّل أحد المحاور الرئيسية لخطتها التوسعية. واستحوذت المجموعة في العام 2021 على “فايندواي” المتخصصة في الكتب المسموعة.
ولا تتخلى “سبوتيفاي” عن الكتب التي يقرأها بشر، فقد قال أرتور دو سان فنسان، الرئيس التنفيذي لدار نشر “أوغو”، في حديث إلى وكالة فرانس برس، “إنها تساعد الناشرين عن طريق تمويل جزء من الإنتاج. ولكي تتطوّر سوق وتنضج، يتطلب الأمر مختلف أنواع الدعم.” وستوفر “أوغو” بالتعاون مع دار نشرها الأم “غلينا” مئتيْ كتاب جديد في السنوات الثلاث المقبلة.
ويؤكد أرتور دو سان فنسان “نحن في مرحلة تطوير تسمح لنا بالاستثمار في إنتاج عالي الجودة. لذا، نحرص على اختيار الأصوات، والعمل مع ممثلين، والتمسّك بمبادئنا في كل مرة.” وفي العام 2021، كتبت “أوديبل” الأولى عالميا في الكتب الصوتية والتابعة لشركة أمازون، عبر موقعها الإلكتروني الفرنسي “في البداية، كانت الكتب الصوتية تستخدم الصوت الاصطناعي، أي الصوت المُنشأ بواسطة الكمبيوتر. أما اليوم، فيُفضَّل الصوت البشري لأنه يُتيح قربا أكبر إلى القارئ، ونبرة صوت أفضل.”
وتعتمد خدمة الكتب المسموعة من “أوديبل” على الصوت البشري الحقيقي في قراءة الكتب المسموعة. وبعد أربع سنوات، يؤدي البحث عن “الصوت الافتراضي” في لائحة كتبها باللغة الإنجليزية إلى “أكثر من 50 ألف نتيجة،” والغالبية العظمى من الكتب هي من تأليف كتّاب غير معروفين.
ويثير تحويل الذكاء الاصطناعي لعالم الكتب الصوتية، مع قدرته على إنشاء تسجيلات متسلسلة من دون الاستعانة في كل مرة بإنسان يتولى مهمة السرد بالصوت، قلق العاملين في مجال التسجيل الصوتي الذي يسجل انكماشا منذ سنوات. ويلجأ البعض في مجال النشر التقليدي لاستخدام ما يسمّى بالذكاء الاصطناعي التوليدي، وهي تكنولوجيا قادرة على إنشاء نصوص أو صور أو مقاطع فيديو أو أصوات من دون تدخل بشري، اعتمادا على محتوى موجود.
ويستثمر عمالقة التكنولوجيا بشكل كبير في الذكاء الاصطناعي، ويشاركون في الاقتصاد المزدهر للكتب الصوتية التي تم إنشاؤها بواسطة هذه البرمجيات.
ففي مطلع العام 2023، أطلقت شركة الإلكترونيات والتكنولوجيا الأميركية العملاقة أبل عرضا يشمل “سرد القصص الرقمية” ويهدف، وفق الشركة، إلى “جعل إنشاء الكتب الصوتية في متناول الجميع،” لاسيما “للمؤلفين والمستقلين والناشرين الصغار.” وتقدم غوغل خدمة مماثلة تصفها بأنها “للسرد الذاتي”.
وقدمت أبل خاصية الراوي الآلي المعتمد على تكنولوجيا الذكاء إلى بعض الكتب المسموعة المطروحة على تطبيق ومتجر الكتب الرقمية التابع لها “أبل بوكس”، لتوفير بديل رخيص وسهل لدور النشر الصغيرة والمستقلة التي ترغب في طرح إصدارات مسموعة من الكتب التي تنشرها. وتترك جودة هذه القراءة تقييمات متباينة، فمنها ما يحمل حماسة للتقدم السريع لهذه التكنولوجيا، بينما تظهر أخرى تشكيكا بشأن حدودها.
ويبقى التساؤل حول مدى نجاح الأصوات الرقمية المصنوعة باستخدام تقنيات الذكاء الاصطناعي في قراءة الكتب بطريقة تستطيع جذب الزبائن، مقارنة بالكتب المقروءة بأصوات بشرية، مطروحة. ويرى البعض أن أصوات الكمبيوتر لا تتلعثم مطلقا وترتكب أخطاء أقل في نطق الأسماء بشكل صحيح. لكن مع الوقت يمكن أن تصبح رتيبة، فهي لا تعرف حتى الآن كيفية التسريع أو الإبطاء، أو إظهار تعبيرات ومشاعر كالانزعاج أو الاختناق أو فقدان القدرة على التنفس أو البكاء.
◙ منصة سبوتيفاي تستثمر مليون يورو في كتب ترويها أصوات اصطناعية محاكية للصوت البشري بدقة متزايدة
وتقول أليسانيا، وهي مؤلفة روايات بالإنجليزية نشرت أعمالها عبر أمازون، في منشور عبر منصة إكس “لا أعتقد أن السرد القصصي باستخدام الذكاء الاصطناعي جيّد في ما يتعلق بمشاعر الشخصيات.” وتتراوح مدة التسجيل الصوتي للروايات في المجمل بين أربع وست ساعات وقد تزيد وقد تنقص قليلا حسب طول الرواية. وبعملية حسابية بسيطة يمكن للمستمع أن ينهي على الأقل رواية في الأسبوع الواحد بمعدل استماع ساعة في اليوم، وهو رقم مهم في ظل العزوف عن القراءة الذائع حاليا.
يشار إلى أن رؤساء دول سابقون خاضوا هذا التحدي، فعلى سبيل المثال، سجل الرئيس الفرنسي السابق نيكولا ساركوزي عام 2021 أكثر من 13 ساعة من مذكراته الرئاسية “لو تان دي تامبيت”، بينما سجّل الرئيس الأميركي باراك أوباما “إيه بروميسد لاند” في العام 2020 على مدى 29 ساعة.
وثمة كتب أخرى قرأها ممثلون. ففي فرنسا، وضع الممثل دوني بوداليديس صوته على رواية "مارتن إيدن" للكاتب جاك لندن. أما رواية "الحوريات" التي نال كمال داود بفضلها جائزة غونكور الفرنسية، فقرأتها لولا نايمارك.
ويلفت خبراء متخصصون في المكتبات الرقمية والصوتية تنامي انتشار الكتاب الصوتي في ظل رغبة الأجيال الجديدة بالاستفادة من الكتب بأقصر وأسرع طريقة ممكنة في هذا العصر الذي يفرض إيقاعه المتسارع على مناحي الحياة، موضحين أن عوامل نجاح الكتاب الصوتي تتضمن صوت الراوي وطريقة الأداء وجودة المحتوى المسجل وحجم المبيعات.