الذكاء الاصطناعي لا يفهم "ما بين السطور"

رغم التقدم الذي حققته أنظمة الذكاء الاصطناعي في مجالات مثل الطب والهندسة زالفنون الإبداعية، لا يزال أمامها شوط طويل قبل أن تصل إلى مستوى البشر في فهم التفاعلات الاجتماعية، مما يثير تساؤلات حول جهوزية هذه التكنولوجيا لمشاركة البشر في بيئات حقيقية.
سان فرانسيسكو (الولايات المتحدة)- رغم التقدم الكبير الذي حققته أنظمة الذكاء الاصطناعي في السنوات الأخيرة لدرجة أنها تفوقت على الإنسان في مجالات عديدة مثل الهندسة والطب وعلوم الفضاء بل وألعاب الذكاء مثل الشطرنج وخلافه، كما أنها طرقت أنشطة إبداعية مثل تأليف الشعر ورسم اللوحات الفنية، ورغم القدرات الحوسبية الفائقة والمليارات من الدولارات التي أنفقتها شركات التكنولوجيا العالمية، لا تزال أنظمة الذكاء الاصطناعي متأخرة عن البشر في فهم الإشارات الاجتماعية التي تعبّر عن المغزى أو الدلالة الحقيقية للتفاعلات الإنسانية، وبمعنى آخر، لا تستطيع هذه الأنظمة الذكية حتى الآن أن تفهم “ما بين السطور” عندما يتحدث البشر مع بعضهم البعض.
وبحسب دراسة أجراها فريق بحثي بجامعة جون هوبكنز الأميركية، طلب الباحثون من ثلاث مجموعات من المتطوعين مشاهدة مقاطع فيديو لا يزيد طول كل منها عن ثلاث ثوان، وتقييم التفاعلات الاجتماعية بين الأشخاص الذين يظهرون في هذه المقاطع. وفي الوقت نفسه، تم تحليل نفس المقاطع بواسطة أكثر من 350 منظومة للذكاء الاصطناعي متخصصة في مجالات تحليل اللغة والفيديو والصور بغرض فهم مدلول الإشارات الاجتماعية التي يقوم بها البشر في تلك المقاطع. وأثبتت التجربة أن المتطوعين أنجزوا المهمة المطلوبة بسهولة ويسر، في حين أن أنظمة الذكاء الاصطناعي لم تنجح في تفسير دلالات أو معاني محادثات البشر في مقاطع الفيديو. ويرى الباحثون المشاركون في الدراسة أن أنظمة الذكاء الاصطناعي مازال أمامها شوط طويل قبل أن تصل إلى فهم الإشارات الاجتماعية للبشر في بيئات التفاعل الحقيقية، وهو ما ينطوي على تداعيات خطيرة بالنسبة إلى صناعات صاعدة مثل السيارات ذاتية القيادة أو الروبوتات وغيرها من المجالات التي تتطلب تفاعلات مستمرة بين الإنسان ومنظومات الذكاء الاصطناعي.

◄ فهم العلاقات والسياق وديناميكيات التفاعلات الاجتماعية يعتبر بمثابة نقطة عمياء في تطور منظومات الذكاء الاصطناعي والروبوتات
وتقول الباحثة ليلى إيزيك أستاذ مساعد العلوم المعرفية بجامعة جون هوبكنز ورئيس فريق الدراسة إنه “إذا كنت تريد أن يتفاعل نظام الذكاء الاصطناعي مع الإنسان، فلا بد أن يفهم ما الذي يقصده الإنسان، وكيف تتفاعل مجموعة من البشر سويا،” مضيفة في تصريحات للموقع الإلكتروني “بوبيولار ساينس” المتخصص في الأبحاث العلمية “هذه الدراسة في حقيقة الأمر تسلط الضوء على سبب إخفاق أنظمة الذكاء الاصطناعي في أداء هذه المهمة.” ورغم أن دراسات سابقة أثبتت قدرة أنظمة الذكاء الاصطناعي على وصف مغزى الصور الثابتة بدرجة تكاد تتساوى مع الإنسان، فإن الدراسة الجديدة كانت تهدف إلى قياس ما إذا كان نفس الوضع يسري بالنسبة إلى الصور المتحركة أو مقاطع الفيديو. وتوضح إيزيك أنها اختارت مع فريقها البحثي المئات من مقاطع الفيديو من قاعدة بيانات خاصة، ثم قامت بتقصيرها إلى مدة زمنية لا تزيد عن ثلاث ثوان، مع التركيز على المقاطع التي يظهر فيها شخصان يتفاعلان سويا.
وعرض الباحثون مقاطع الفيديو على المتطوعين المشاركين في التجربة ثم استطلاع رأيهم بشأن مغزى التفاعلات بين الأشخاص الذين يظهرون في تلك المقاطع من خلال أسئلة موضوعية على غرار “هل ترى أن الأشخاص في هذه المقاطع يواجهون بعضهم البعض،” وأسئلة شخصية مثل “هل التفاعل بين الأشخاص في مقطع الفيديو يبدو إيجابيا أم سلبيا؟” وتبين من التجربة أن المتطوعين عادة ما يتوصلون إلى إجابات متشابهة تنم عن فهم أساسي مشترك للتفاعلات الإنسانية. أما أنظمة الذكاء الاصطناعي، فلم تتوصل إلى نفس درجة الإجماع في تفسير مقاطع الفيديو مقارنة بالمتطوعين.
وتقول الباحثة كاثي جارسيا، وهي أحد المشاركين في الدراسة من جامعة جون هوبكنز “لا يكفي أن يشاهد نظام الذكاء الاصطناعي مقطع الفيديو ويتعرف على الأشكال أو الوجوه، بل نحتاج أن يفهم النظام تطور الأحداث في المشهد، وأن يفهم العلاقات والسياق وديناميكيات التفاعلات الاجتماعية، وهذه الدراسة تشير إلى أن هذا العنصر يعتبر بمثابة نقطة عمياء في تطور منظومات الذكاء الاصطناعي.”

ليلى إيزيك: إذا كنت تريد أن يتفاعل نظام الذكاء الاصطناعي مع الإنسان، فلا بد أن يفهم ما الذي يقصده الإنسان
وتأتي هذه النتائج في الوقت الذي تتسابق فيه شركات التكنولوجيا لدمج أنظمة الذكاء الاصطناعي داخل عدد متزايد من الأجسام الروبوتية، وهو مفهوم يطلق عليه اسم “الذكاء الاصطناعي المتجسد”، وقد تم اختبار هذا المفهوم في عدة مدن أميركية مثل لوس أنجلس وفينيكس وأوستن من خلال سيارات ذاتية القيادة تسير في الطرق بجانب السيارات التي يقودها البشر مثل سيارات الأجرة التابعة لشركات مثل “وايمو روبو تاكسي”. وقد أثبتت التجارب أن أنظمة الذكاء الاصطناعي لهذه السيارات تعاني من قصور في فهم بعض مواقف القيادة المركبة مثل القيادة الدائرية أو منحنيات الرجوع إلى الخلف. ورغم أن بعض الدراسات الحديثة أثبتت أن السيارات ذاتية القيادة قد تكون أقل عرضة للحوادث مقارنة بقائدي السيارات، لا تزال السلطات الرقابية المختصة تجري تحقيقات بشأن ما تردد عن مخالفة بعض هذه السيارات لقواعد السلامة.
وقطعت شركات تكنولوجية أخرى مثل بوسطن ديناميكس وفيجر إيه أي وتسلا خطوات أبعد نحو تطوير روبوتات على هيئة بشر تعمل بأنظمة الذكاء الاصطناعي في أماكن صناعية جنبا إلى جنب مع عمال على خطوط الإنتاج. ويرى الباحثون أن تمكين أنظمة الذكاء الاصطناعي من فهم الإشارات الاجتماعية بين البشر داخل البيئات الصناعية ينطوي على أهمية بالغة لتلافي خطر وقوع الحوادث الصناعية. وفي ذات السياق، تقول الباحثة إيزيك إن “هذه الدراسة تسلط الضوء على أهمية دمج علوم الذكاء الاصطناعي وعلم الأعصاب والعلوم المعرفية بشكل أكبر مع عناصر العالم الحقيقي.”
وتضيف إيزيك أن مشكلة الذكاء الاصطناعي لا تقتصر على قراءة الإشارات الاجتماعية فقط، بل تمتد أيضًا إلى فهم المشاعر والعواطف البشرية، وهو أمر أساسي في التواصل بين الأشخاص. ورغم أن أنظمة الذكاء الاصطناعي باتت قادرة على تحليل تعابير الوجه وتحديد الحالة العاطفية بناءً على معايير فيزيولوجية، إلا أنها لا تزال تفتقر إلى القدرة على إدراك السياق العاطفي الكامل للمحادثة.
أنظمة الذكاء الاصطناعي لا تزال متأخرة عن البشر في فهم الإشارات الاجتماعية التي تعبّر عن المغزى أو الدلالة الحقيقية للتفاعلات الإنسانية
في بيئة العمل، يمكن للذكاء الاصطناعي أن يساعد في تحليل معنويات الموظفين من خلال مراقبة أنماط الكلام وتعابير الوجه، ولكن عندما يتعلق الأمر بالتفاعل الاجتماعي العميق، مثل فهم السخرية أو التلميحات غير المباشرة، يكون أداؤه محدودًا للغاية.
هذا النقص في الإدراك الاجتماعي يمكن أن يؤثر سلبًا على تطوير الروبوتات التفاعلية والمساعدات الافتراضية، حيث يعتمد المستخدمون على التواصل العاطفي والتفاعل الطبيعي، وليس فقط على الاستجابة المباشرة.
لذلك، يرى الباحثون أن تحسين قدرة الذكاء الاصطناعي على التعامل مع المشاعر البشرية بشكل أعمق سيكون مفتاحًا لنجاحه في المستقبل، خاصة في المجالات التي تتطلب تفاعلات معقدة مثل الرعاية الصحية والتعليم والعلاقات العامة.