حلم غوغل بتحويل البحث إلى محادثة بعيد المنال

تواجه خطط شركة غوغل في تحويل البحث إلى محادثة بالاعتماد على تقنيات الذكاء الاصطناعي إشكاليات تقنية، حيث أقر مهندسو غوغل أنفسهم بأن علوم الكمبيوتر تظل عاجزة أمام عظمة اللغة وثرائها كأكبر وأقوى وسيلة للتعبير.
لندن - تطرح خطط غوغل لتمكين المستخدمين من التحدث إلى غوغل صعوبات تقنية معقدة، حيث يظل من المستحيل التحقق من صحة الإجابات التي ينتجها نوع اللغة بواسطة الذكاء الاصطناعي.
يقول الصحافي جيمس فنسن مراسل موقع ذا فيرج المختص في الصحافة التكنولوجية “يمكن أن نعتبر هذا أكثر من مجرد تسويق لغوغل. فمن الواضح أن الشركة كانت تفكر في ما يمكن أن يكون تحولا رئيسيا لمنتجها الأساسي لسنوات”.
وتطرح ورقة بحثية حديثة من مجموعة من مهندسي غوغل بعنوان “إعادة التفكير في البحث” السؤال التالي: هل حان الوقت لاستبدال محركات البحث “الكلاسيكية”، التي توفر المعلومات عن طريق تصنيف صفحات الويب، بنماذج لغة الذكاء الاصطناعي التي تقدم هذه الإجابات مباشرة بدلا من ذلك؟
وهناك سؤالان هنا. أولا هل يمكن أن يتم ذلك؟ فبعد سنوات من التقدم البطيء، هل تعتبر أجهزة الكمبيوتر جاهزة حقا لفهم جميع الفروق الدقيقة في الكلام البشري؟ وثانيا، هل يجب أن نخطو في هذا الاتجاه؟ ماذا يحدث لغوغل إذا تركت الشركة البحث الكلاسيكي وراءها؟ وليست لأي من السؤالين إجابة بسيطة.
وخلال عرض توضيحي لبرنامج تم تدريبه تحديدا على الحوار التخاطبي، تظاهر نموذج الذكاء الاصطناعي أولا بأنه بلوتو، ثم طائرة ورقية، وكان يجيب على الأسئلة بخيال وطلاقة ودقة واقعية في الغالب. وقد سأل أحد المستخدمين “هل شهدت أي زائر من قبل؟” وأجاب البرنامج متظاهرا بأنه بلوتو “نعم، لقد استقبلت بعضا منهم. كان أبرزهم مركبة نيو هورايزونز، المركبة الفضائية التي زارتني”.
التحول إلى جهاز ناطق

ليس هناك شك في أن غوغل يعمل على دفع رؤية البحث القائم على المحادثات لفترة طويلة الآن. وظهرت التقنية لأول مرة في البحث بالصوت في 2011، ثم غوغل ناو في 2012 ثم مساعد غوغل (أسيستنت) في 2016.
ويضيف الصحافي جيمس فنسن أنه على الرغم من التطورات الواضحة، إلا أن الشكوك تحاصر الفائدة الفعلية لهذه التكنولوجيا التي يرى البعض أنها لا ترقى إلى مستوى العروض التوضيحية التي نراها.
وبالتحقق من عروض غوغل هوم في 2016، على سبيل المثال، حيث وعدت الشركة بأن الجهاز سيسمح قريبا للمستخدمين بالتحكم في الأشياء خارج المنزل، مثل حجز سيارة أو طلب العشاء أو إرسال الزهور إلى شخص ما، وأكثر من ذلك بكثير. وأصبحت بعض هذه الأشياء ممكنة الآن من الناحية الفنية، لكنني لا أعتقد أنها شائعة.
وستكون لكل شخص تجارب مختلفة بالطبع، لكن لم يتم استخدام الصوت فقط في مهام محدودة للغاية عند التعامل مع التكنولوجيا الحديثة. حيث تم إملاء رسائل البريد الإلكتروني على جهاز الكمبيوتر، وضبط مؤقتات على الهاتف، وتشغيل الموسيقى على مكبّر الصوت الذكي. ولا تتطلب برمجة أي من هذه الأوامر محادثة مع الجهاز المعني. بل هي أوامر بسيطة، وقد علمتني التجربة أنه إذا حاولت اعتماد أي جمل أكثر تعقيدا، فإن العملية ستفشل.
وأفاد تقرير مهندسي غوغل أنه في بعض الأحيان يكون هذا بسبب عدم سماع صوتي بشكل صحيح (كانت سيري هي الأسوأ في هذه التجربة). ولكن، غالبا ما كان من الأفضل أن أختار طلبي من قائمة محددة من قبل أو كتابته على الشاشة مباشرة حتى يفهمه المساعد.
ويقول فنسن “أثناء مشاهدة عروض هذا العام، تذكرت الضجة المحيطة بالسيارات ذاتية القيادة، وهي تقنية فشلت حتى الآن في تحقيق أكبر وعودها المزعومة (تذكر أن إيلون ماسك وعد بأن سيارة ذاتية القيادة ستتنقل عبر البلاد في 2018، لكن لم يحدث ذلك بعد). واليوم، نجد هناك أوجه تشابه مذهلة بين مجالات القيادة الذاتية وتكنولوجيا المحادثات. فقد شهد كلاهما تحسينات كبيرة في السنوات الأخيرة بفضل تقنيات التعلم الآلي الجديدة واتحادها مع البيانات الوفيرة المتوفرة اليوم. لكن كلاهما يعاني من تعقيد العالم الحقيقي أيضا”.
وتابع “أنشأنا في حالة السيارات ذاتية القيادة مركبات لا تعمل بشكل موثوق خارج الإعدادات الخاضعة للرقابة. ففي الطقس الجيد، مع وجود علامات طريق واضحة، وفي الشوارع الواسعة، تعمل السيارات ذاتية القيادة بشكل جيد. لكن العالم الحقيقي، بعلامات الطريق الناقصة أحيانا والصقيع والثلج والسائقين غير المتوقعين، يقوض هذه التكنولوجيا”.
وأضاف أنه لم يكن من الصعب رؤية التشابه مع المحادثات. حيث يمكن للتقنية التعامل مع الأوامر البسيطة والمباشرة التي تتطلب التعرف على عدد صغير فقط من الأفعال والأسماء (فكر في “تشغيل الموسيقى” و”التحقق من الطقس” وما إلى ذلك) بالإضافة إلى بعض عمليات المتابعة الأساسية، ولكن المحادثة العميقة لم تُبرمج جيدا. كما علق سوندار بيتشاي الذي يشغل منصب الرئيس التنفيذي في شركة غوغل، في مؤتمر الأسبوع الماضي “اللغة معقدة إلى ما لا نهاية. نستخدمها لسرد القصص والنكات ومشاركة الأفكار، لكن ثراء اللغة ومرونتها يجعلانها واحدة من أعظم أدوات البشرية وواحدة من أكبر تحديات علوم الكمبيوتر”.
ومع ذلك، نستطيع أن نحدد بعض الأسباب التي تدفعنا للاعتقاد بأن الأمور مختلفة الآن (في ما يخص البحث بخاصية المحادثات على أي حال). وكما لاحظت شركة غوغل، فقد حققت نجاحا هائلا مع بنية التعلم الآلي الجديدة المعروفة باسم ترانسفورمرز، وهو نموذج يدعم الآن أقوى أنظمة معالجة اللغة الطبيعية في العالم، بما في ذلك البرنامج اللغوي جي.بي.تي 3.
وقد أدى وصول ترانسفورمرز إلى خلق ازدهار مذهل حقا لقدرات لغة الذكاء الاصطناعي. وكما اتضح في استخدام جي.بي.تي 3، يمكن للذكاء الاصطناعي الآن إنشاء مجموعة متنوعة لا نهاية لها من النصوص، من الشعر إلى المسرحيات، ومن الخيال الإبداعي إلى لغة البرمجة، وغير ذلك الكثير ببراعة وحيوية مدهشة. كما يقدم نتائج متطورة في العديد من اختبارات الكلام واللغة، والأفضل من ذلك، أن الأنظمة تتوسع بشكل لا يصدق. هذا يعني أنه إذا حرصت على ضخ المزيد من الطاقة والجهد، فستحصل على تحسينات موثوقة في المقابل. وتعدّ هذه أخبارا جيدة جدا لشركات مثل غوغل. لكن هذا يعني أنه لا يزال أمامها طريق طويل لتحسين هذه الأنظمة.
وأوضح كيفن لاكر، وهو مبرمج ومهندس جودة بحث سابق في غوغل، أن هذه الأنواع من الأخطاء في جي.بي.تي 3 في منشورة على مدونة، مشيرا إلى عدد من الطرق التي تمكن المستخدم العادي من إغراق البرنامج بأسئلة نراها بسيطة مثل “أيهما أثقل، المحمصة أم قلم الرصاص؟” فقد كانت الإجابة “قلم الرصاص”. وسأل “كم عدد العيون في قدمي؟” وقد كانت الإجابة “قدمك لها عينان”.
إشكاليات تقنية
مع ذلك، يقودنا ذلك إلى السؤال الكبير التالي: حتى لو تمكنت غوغل من تحويل الكلام إلى محادثة، فهل ينبغي ذلك؟ لن أتظاهر بمعرفة إجابة محددة لهذا السؤال، ولكن، ليس من الصعب علينا أن نرى مشاكل كبيرة في المستقبل إذا سلكت شركة غوغل هذا الطريق.
أولا، لننظر في المشاكل التقنية. وأكبرها هو أنه من المستحيل على غوغل (أو أي شركة تنشط في نفس المجال) التحقق بشكل موثوق من صحة الإجابات التي ينتجها نوع اللغة التي تعرضها الشركة حاليا بواسطة الذكاء الاصطناعي. ولا توجد طريقة لمعرفة ما تعلمته هذه الأنواع من النماذج أو ما هو المصدر لأي إجابة تقدمها بالضبط. وتتجمع بيانات التدريب الخاصة التي تغذي الذكاء الاصطناعي عادة من أجزاء كبيرة من الإنترنت، وكما تتوقع، يتضمن ذلك كلا من البيانات الموثوقة والمعلومات الخاطئة. ويمكن سحب أي رد يُقدم من أي مكان عبر الإنترنت. ويمكن أن يقود هذا أيضا إلى إنتاج مخرجات تعكس المفاهيم الجنسية والعنصرية والمتحيزة المضمنة في أجزاء من بيانات التدريب. وهذه انتقادات يبدو أن غوغل نفسها لم تكن موجودة في حساباتها.
وبالمثل، على الرغم من أن هذه الأنظمة تتمتع بقدرات واسعة وقادرة على التحدث في مجموعة واسعة من المواضيع، إلا أن معرفتها ضحلة في النهاية. وكما صاغ باحثو غوغل في ورقتهم حول “إعادة التفكير في البحث”، فإن هذه الأنظمة تتعلم تأكيدات مثل “السماء زرقاء”، ولكن لا تتعلم الارتباطات أو العلاقات السببية. هذا يعني أنه يمكنها صياغة معلومات مغلوطة بناء على سوء فهمها لكيفية عمل العالم.
ونقلا عن مهندسي غوغل مرة أخرى من ورقة “إعادة التفكير في البحث” هذه الأنظمة “ليس لديها فهم حقيقي للعالم… وهي غير قادرة على تبرير إجاباتها من خلال الإشارة إلى المستندات الداعمة في المجموعة التي تدربت عليها”.
وتتضاعف هذه المشاكل من خلال نوع الواجهة التي تتخيلها غوغل. وعلى الرغم من أنه من الممكن التغلب على الصعوبات المتعلقة بمشاكل مثل تحديد المصادر (يمكنك تدريب نموذج لتقديم الاستشهادات، على سبيل المثال، مع الإشارة إلى مصدر كل حقيقة يقدمها)، من المحتمل أن يؤدي هذا إلى خلق عبء ثقة غير موجود في محركات البحث الحالية، حيث يعود الأمر للمستخدم لتقييم مصداقية كل مصدر وسياق المعلومات التي يتم عرضها.
وتتضح مخاطر إزالة هذا السياق عندما ننظر إلى الاقتراحات التي يعرضها غوغل في أعلى صفحات نتائج البحث ردا على استفسارات محددة. وتسلط الضوء على الإجابات كما لو كانت موثوقة ولكن المشكلة هي أنها ليست كذلك غالبا، وهي مشكلة أطلق عليها مدون محرك البحث السابق (وموظف غوغل الآن) داني سوليفان مشكلة “الإجابة الواحدة الحقيقية”.
ويصبح السؤال هو: هل ستكون شركة غوغل قادرة على مقاومة إغراء تقديم إجابة واحدة صحيحة؟ لاحظ مراقبو التكنولوجيا لفترة من الوقت أن منتجات بحث الشركة أصبحت أكثر تركيزا على غوغل بمرور الوقت. وتعمل الشركة بشكل متزايد على دفن النتائج تحت إعلانات خارجية (تشير إلى شركات خارجية) وداخلية (توجه المستخدمين إلى خدمات غوغل). وأعتقد أن نموذج “التحدث إلى غوغل” يناسب هذا الاتجاه. حيث أن الدافع الأساسي هو نفسه: يتعلق الأمر بإزالة الوسطاء وخدمة المستخدمين مباشرة، وربما لأن شركة غوغل تعتقد أنها الأفضل للقيام بذلك.
بطريقة ما، يعد هذا إنجازا لمهمة شركة غوغل “لتنظيم معلومات العالم وجعلها مفيدة وفي متناول الجميع على مستوى العالم”، لكن هذا النهج قد يقوض ما يجعل منتج الشركة ناجحا في المقام الأول. إن غوغل هو الفهرس وليس الموسوعة ويجب ألا ينسى ذلك.
وتأتي هذه المتغيرات في ظل منافسة حادة حول تكنولوجيا الواقع المعزز، الذي بدأ يسرق الأنظار من الواقع الافتراضي.
وكشفت شركة غوغل خلال السنوات القليلة الماضية عن أدوات جديدة لإنتاج تطبيقات الواقع المعزز المخصصة لأجهزة الهواتف المحمولة العاملة بنظام أندرويد الذي تنتجه غوغل لأجهزتها (بيكسل) وعدد كبير من مصنّعي الهواتف الذكية.
وأطلقت غوغل بذلك شرارة أحدث مواجهة مع شركة أبل المصنعة لهواتف آيفون في ما يتعلق بخواص الجيل المقبل من الهواتف الذكية. واكتسبت تكنولوجيا الواقع المعزز على الهواتف المحمولة التي يتم من خلالها إسقاط أجسام افتراضية في البيئة الحقيقية، شعبية واسعة منذ إطلاق لعبة “بوكيمون غو” الشهيرة في الولايات المتحدة في شهر يوليو من العام 2017.