الرئيسية / كشف السرقات الأدبية باستخدام تقنيات الويب الدلالي

كشف السرقات الأدبية باستخدام تقنيات الويب الدلالي

اسم الباحث:

م. لمى السبع

عنوان البحث:

كشف السرقات الأدبية باستخدام تقنيات الويب الدلالي

عنوان البحث باللغة الانكليزية :Plagiarism detection using semantic web techniques

اسم المشرف :

د. ناصر أبو صالح

العام:2019-2020

القسم:هندسة البرمجيات ونظم المعلومات

الملخص:

العلم هو أحد أعمدة بناء الأمم وتقدمها ولا يستطيع أحد أن ينكر أنّ النمو الاجتماعي والاقتصادي في أي أمة مرتبط بالعلم والبحث العلمي الذي يعد الركيزة الأساسية في تطور أي مجتمع، ولكن مع الأسف فقد طالت ظاهرة السرقات الأدبية مجال البحث العلمي إذ أصبح بعض الباحثين يلجؤون إلى نسب أفكار وكتابات شخص آخر لأنفسهم مستفيدين من التّقدم التّقني والتكنولوجي الذي سهل الوصول إلى معلومات هائلة باستخدام الأنترنت.

ولم تقتصر السرقات الأدبية على البحث العلمي بل طالت جميع جوانب الحياة ، ونظراً للانعكاسات السلبية المترتبة عن هذه الظاهرة على الجامعات ومراكز البحث العلمي واعتماد أعداد كبيرة من الطلبة على الأنترنت في تقديم بحوثهم الجامعية ظهرت الحاجة لتأمين أنظمة قادرة على اكتشاف هذه السرقات، وصنفت الدراسات السابقة أنواع الخوارزميات المستخدمة في هذه الأنظمة إلى نوعين أساسيين هما الخارجي و  الداخلي. في هذا العمل قمنا بإجراء دراسة لأهم هذه الخوارزميات وتحديد نقاط القوة والضعف لكل منها، ولقد تبيّن من خلال الدراسة أنّ أداء معظم هذه الخوارزميات جيد في كشف السرقة التي يلجأ الباحث فيها للنسخ الحرفي لنصوص وثائق أخرى. أما في السرقات التي يعمد الباحث فيها إلى استبدال بعض الكلمات بمرادفاتها فتصبح الخوارزميات التي تعتمد على الاستشهادات المرجعية هي الأفضل من حيث الأداء ولكنها عاجزة عن كشف السرقات الفنية للصور والرسوم التوضيحية، بالإضافة لعدم قدرتها على كشف السرقات الأدبية من وثائق لا تنتمي لقائمة مراجع الوثيقة المشتبه بها. في هذا العمل قمنا بتطوير خوارزمية جديدة تعتمد على تطبيق خوارزميات الاستشهادات المرجعية على عدة مستويات مع مراعاة المعنى الدلالي للنصوص المدروسة ((SMCBPDوتقوم بإيجاد الوثائق ذات الارتباط الأعلى بموضوع الوثيقة المشتبه بها اعتماداً على عدد من المعايير التي تمتّ دراستها في هذه الرسالة وبالتالي ينتج لدينا مجموعة الوثائق المرشحة لاحتمال وجود سرقة أدبية منها. ولتحديد هذه السرقة يتم إجراء تطابق نصي (نحوي، دلالي) بين الوثيقة المشتبه بها وكل وثيقة تنتمي لمجموعة الوثائق المرشحة.

وللتحقق من أداء هذه الخوارزمية على مختلف أنواع السرقة الأدبية تمّ تطوير نظام يعتمد على قاعدة بيانات (Benchmark) تحوي سرقة أدبية من نوع نسخ/لصق، نسخ مع استبدال بعض الكلمات، سرقة فنية ومن وثائق تنتمي لمستويات مختلفة، ثمّ إجراء دراسة مقارنة بين الخوارزمية SMCBPD مع الخوارزميات السابقة من إذ زمن التنفيذ، دقة النتائج، آلية المطابقة ونوع السرقة المكتشفة في كل منها.

الكلمات المفتاحية: كشف السرقات الأدبية، الويب الدلالي، الاستشهادات المرجعية، مطابقة النصوص، معالجة اللغات الطبيعية.

التحميل