الرئيسية / كشف الانتحال في المقالات العلمية العربية المقتبسة من المقالات العربية والإنجليزية

كشف الانتحال في المقالات العلمية العربية المقتبسة من المقالات العربية والإنجليزية

اسم الباحث:المهندسة : سهر قصي محمد

عنوان البحث:

كشف الانتحال في المقالات العلمية العربية المقتبسة من المقالات العربية والإنجليزية 

عنوان البحث باللغة الانكليزية :

Plagiarism Detection In Arabic Scientific Articles Quoted From Arabic And English Articles

اسم المشرف :الدكتور المهندس : فادي تركاوي

العام:2020

القسم:قسم هندسة التحكم الآلـي و الحـواسيـــب

الملخص:

كشف الانتحال بين الوثائق المكتوبة باللغات الطبيعية هو مسألة معقدة جداً وهذه المسألة تتعلق بخصائص اللغة الطبيعية .

هذا البحث يقدم دراسة لكشف الانتحال بين النصوص العربية و كشف الانتحال في النصوص المترجمة من اللغة الإنجليزية إلى اللغة العربية بالمقارنة مع نصوص عربية ،و حساب التشابه بينها ، و هذه المنهجية تقوم على الجمع بين أحد مقاييس التشابه القائمة على السلسة و هو مقياس Cosine ، و أحد المقاييس المعتمدة على المعرفة هو Semantic similarity ، تم تنفيذ هذه الطريقة على مجموعة بيانات PAN2015 و PAN2013 ، و استخدم Khuja Stemmer من أجل المعالجة المسبقة للنصوص ، و Arabic WordNet من أجل الحصول على المرادفات ، و لقد تم تنفيذ هذه الطريقة باستخدام لغة البرمجة Java . أثبت اختبار هذه الطريقة بأنها قيّمة في إيجاد التشابه بين النصوص العربية حيث حققت دقة Precision بمقدار 94%  و استدعاء Recall بمقدار 90% ، بينما حققت دقة Precision بمقدار 80% و استدعاء Recall بمقدار 75% بالنسبة للنصوص المترجمة إلى العربية .

الكلمات المفتاحية:

كشف الانتحال ، النصوص العربية ، التشابه الدلالي ، مقياس تشابه Cosine ، مقياس التشابه الدلالي
التحميل