منصات خوارزمية جديدة للتنقيب في البيانات الطبية

الباحثون يأملون أن يساعد الذكاء الاصطناعي ومعالجة اللغات في اكتشاف المعرفة العلمية الكامنة في نصوص المقالات.
الجمعة 2021/10/22
البحث عن علاقة سببية بين مجموعات البيانات المختلفة

لندن - نتائج الدراسات الطبية تشكل ثروة هائلةً من البيانات، إلا أنها موزعة عبر مجموعات مختلفة، مما يترك العديد من الأسئلة الطبيّة دون إجابة. مثال على ذلك، في حال أظهرت مجموعة بيانات علاقة بين السمنة وأمراض القلب، وأظهرت دراسةٌ أخرى وجود علاقة بين انخفاض فيتامين (د) والسمنة، فما هي العلاقة بين انخفاض فيتامين (د) وأمراض القلب؟ سيتطلب إيجاد هذه العلاقة تجربة سريرية أخرى.

كيف يمكننا استغلال هذه المعلومات الجزئية بشكل أفضل؟

تستطيع أجهزة الكمبيوتر اكتشاف الأنماط المُختلفة بسهولة، ولكن يُعتبر الارتباط بين هذه الأنماط في الطب ارتباطاً عادياً، وليس سببياً.

وفي السنوات الماضية، بدأ العلماء ببرمجة بعض الخوارزميات القادرة على تحديد العلاقات السببية داخل مجموعة بيانات واحدة. وهنا تكمن المُشكلة، حيث يُعتبر البحث في كلّ مجموعةِ بياناتِ بشكل فرديّ أمراً صعباً للغاية، فهو يشبه البحث في عدد كبير من الأقفال واحداً تلوَ الآخر. أي أننا نحتاج إلى إيجاد طريقة تمكننا من البحث في جميع المجموعات معاً.

وهنا توصّل الباحثان أنيش دهير وسياران لي من شركة بابيلون هيلث – وهي شركة متخصصة في توفير الرعاية الصحية الرقمية في المملكة المتحدة – إلى تقنيةٍ لإيجاد العلاقات السببية عبر مجموعات البيانات المختلفة. مما يفتح المجال لاستخدام نوعٍ جديدٍ من قواعد البيانات الطبية الكبيرة في البحث عن الأسباب والنتائج، التي لم نستطع استخدامها من قبل، مما يؤدي إلى زيادة احتمال اكتشافنا لروابط سببية جديدة.

ويأمل الباحثون أن يساعد الذكاء الاصطناعي ومعالجة اللغات الطبيعية في اكتشاف المعرفة العلمية الكامنة في نصوص المقالات من خلال التقاط الارتباطات التي تغيب عن العقل البشري والتي يتطلب إيجادها جمع المعلومات من مئات آلاف الأبحاث العلمية.

على سبيل المثال، يمكن للذكاء الاصطناعي أن يساهم في اكتشاف الأدوية الموجودة التي يمكن استخدامها في علاج كوفيد – 19، أو العلاقات الجينية التي يمكن أن تسرع من الوصول إلى لقاح أو نظام علاجي فعال. وهو ما يساهم به محرك بحث أطلقه مختبر لورنس بيركلي الوطني منذ أيام باعتماد أحدث تقنيات الذكاء الاصطناعي، متيحا للعلماء أدوات تنقيب عن الأدوية وتأثيراتها لتسريع أبحاثهم حول كوفيد.

ويشير الباحثون إلى أن أهم عناصر منصتهم الجديدة كوفيد سكولار (COVIDScholar) هو البيانات؛ حيث قاموا ببناء برمجيات تجمع الأوراق البحثية من مجموعة كبيرة من المصادر لإتاحتها على المنصة في غضون 15 دقيقة من وقت نشرها على الإنترنت. كما تتولى المنصة مهمة إصلاح أخطاء التنسيق، ثم يبدأ عمل خوارزميات التعلم الآلي التي تضيف الوسوم المناسبة لكل ورقة بحثية لتساعد في تصنيفها إلى فئات بحسب موضوع البحث وأهميته.

وحتى الآن، تتضمن المنصة أكثر من 60 ألف ورقة بحثية حول كوفيد – 19، وتستمر في التوسع بشكل يومي. ويطوّر الباحثون خوارزميات الذكاء الاصطناعي حتى تسمح للعلماء بتنظيم نتائج البحث في نماذج كمية لدراسة مواضيع محددة مثل التفاعلات بين البروتينات. كما عمل الباحثون على إضافة الدراسات العلمية السابقة إلى قاعدة البيانات من أجل اكتشاف أي معلومات هامة قد تساعد في مواجهة الوباء.

ويؤكد القائمون على المنصة أن الذكاء الاصطناعي لن يحلَّ محلّ العلماء، لكنه يساعدهم في تسريع جهودهم لإيجاد الترياق المناسب لكوفيد – 19.

ويأتي بناء هذه المنصة بعد أسابيع على إطلاق منصة كورد – 19 بالتشارك بين معهد آلين للذكاء الاصطناعي وشركة مايكروسوفت والمكتبة الوطنية الأميركية للطب. وتعتمد المنصة على أدوات الذكاء الاصطناعي أيضاً لتجميع وتنظيم أكثر من 50 ألف مقال علمي متعلق بكوفيد – 19 وفيروس سارس-كوف-2 المسبب له. وتهدف إلى منح العلماء وصولاً أسرع وأكثر موثوقية إلى المصادر ذات الصلة بفايروس كورونا وكيفية مواجهته.

12