الرئيسية / كشف ونمذجة السلوك المعادي للمجتمع في شبكات التواصل الاجتماعي

كشف ونمذجة السلوك المعادي للمجتمع في شبكات التواصل الاجتماعي

اسم الباحث:

المهندس: ربيع محي الدين الكردي

عنوان البحث:

كشف ونمذجة السلوك المعادي للمجتمع في شبكات التواصل الاجتماعي

عنوان البحث باللغة الانكليزية :

Detecting and Modeling Anti-Social Behavior in Social Networks

اسم المشرف :الدكتور: كمال السلوم-الدكتور: وسيم رمضان

العام:2019

القسم:هندسة البرمجيات ونظم المعلومات

الملخص:

لاتزال الدّراسات المتعلّقة بالاكتشاف الآليّ للسّلوك المعادي للمجتمع من خطاب كراهيةٍ وتنمّرٍ وتحرّشٍ واستفزازٍ ونشر شائعاتٍ ضمن شبكات التّواصل الاجتماعيّ باللّغة العربيّة ضعيفةً مقارنةً بمثيلاتها باللّغة الإنكليزيّة، وذلك على الرّغم من خطورة هذا السّلوك وتأثيره السّلبيّ الكبير في المجتمعات والأفراد.

تقوم هذه الدّراسة بمعالجة هذه المشكلة ببناء نموذجين تنبؤيّين لاكتشاف هذا السّلوك. أوّلهما وفق خوارزميّة آلة شعاع الدّعم (Support Vector Machine) الشّهيرة. كما تمّ بناء النّموذج الثّاني وفق خوارزميّة الشّبكات العصبونيّة الالتفافيّة (Convolutional Neural Network).

تختبر هذه الدّراسة كفاءة كلا النّموذجين في تصنيف السّلوك المعادي للمجتمع ضمن البيانات العربيّة من جهة وضمن البيانات باللّغة الإنكليزيّة من جهةٍ أخرى. كما تقوم بمقارنة أدائهما بين اللّغتين لتحديد تأثير اللّغة في أداء المُصنِّف. وعليه يتمّ اقتراح معماريّةٍ للشبكة تهدف إلى الحصول على مُصنِّفٍ جيّدٍ من أجل البيانات العربيّة ومقارنته مع آخر للبيانات الإنكليزيّة. كما تقوم بدراسة تأثير عمليّات المعالجة المسبقة للبيانات في أداء المُصنِّف. تختبر هذه الدّراسة أيضاً تأثير عدّة ميّزاتٍ في عملية التّصنيف منها ميّزاتٌ إحصائيّةٌ ك tf-idf وأخرى نحويّةٌ كأجزاء الكلام وعلاقات التّبعيّة وأخيراً ميّزاتٍ تعتمد على السّياق الّذي ترد ضمنه الكلمات وهي تضامين الكلمات (Word Embeddings). يتمّ في النّهاية اختيار النّموذج ذي الأداء الأفضل في تصنيف خطاب الكراهية ضمن البيانات العربيّة والإنكليزيّة بعد تقييمه وفقاً لبعض مقاييس التّقييم مثل الدّقة والاستذكار والصّحة.

تبيّن النّتائج الّتي تتوصل إليها الدّراسة هذه تفوّق نموذج التّصنيف المبنيّ باستخدام CNN على قرينه المبنيّ باستخدام SVM في كلتا مجموعتيّ البيانات. حيث تصل نسبة اكتشاف التّعليقات الحاوية على خطاب كراهيةٍ في البيانات العربيّة إلى حوالي 79% والإنكليزيّة إلى حوالي 98% ما يدلّ أيضاً على مدى تفوّق النّموذج الخاصّ بالبيانات الإنكليزيّة على ذاك الخاصّ بالبيانات العربيّة وإمكانيّة التّحسين الكبيرة عليه. تثبت الدّراسة أيضاً مدى التّأثير الإيجابيّ للمعالجة المسبقة للبيانات في أداء المُصنِّف لما تقوم به من إزالةٍ للضجيج من البيانات.

 

الكلمات المفتاحيّة: سلوك معادي للمجتمعخطاب كراهية – تعلم آلي – تعلم عميق -معالجة لغات طبيعية – تحليل مشاعر – محتوى عربي – محتوى إنكليزي – SVM – CNN.

التحميل