الرئيسية / تطوير خوارزمية حذف الصور المتكررة والمتشابهة في الأنظمة العنقودية باستخدام Hadoop

تطوير خوارزمية حذف الصور المتكررة والمتشابهة في الأنظمة العنقودية باستخدام Hadoop

اسم الباحث:

حسن حسن

عنوان البحث:

تطوير خوارزمية حذف الصور المتكررة والمتشابهة في الأنظمة العنقودية باستخدام Hadoop

عنوان البحث باللغة الانكليزية :

Developing the Algorithm of Duplicate and Similar Images Deletion in Cluster Systems Using Hadoop

اسم المشرف :

د.م. عمار زقزوق

العام:2021

القسم:هندسة التحكم الآلي والحواسيب

الملخص:

نمت كميّة بيانات الصور بشكل كبير في السنوات الأخيرة بسبب نموّ شبكات التواصل الاجتماعي والأقمار الصناعيّة والأجهزة الذكيّة، وغيرها من التقنيّات والأجهزة الحديثة التي تنتج كم هائل من الصور. أبدى Hadoop كفاءة عالية في التعامل مع هذا الكم الهائل من البيانات. من جهة أخرى، قد تحتوي مجموعات الصور على كميّة كبيرة من الصور المتكرّرة والمتشابهة، والتي تسبّب هدراً في المساحة التخزينيّة. إنّ نظام التخزين المثالي يهدف للاستثمار الأمثل لمساحة التخزين بحيث يحتوي فقط على المعلومات القيّمة والمفيدة. سنقدّم في هذا البحث تقنيّة لحذف الصور المكرّرة والمتشابهة المخزّنة في نظام تخزين Hadoop الموزّع.

تعتمد هذه التقنيّة على مطابقة الصور على مستوى البيانات، وذلك بعد استخدام نموذج التقطيع الأمثل للملفّات الواردة إلى نظام التخزين. يتم التنفيذ على التوازي بين العقد باستخدام نموذج المعالجة الموزّع (MapReduce). عمليّة مطابقة الصور تعتمد على تردّدات الصورة المنخفضة، ويتم ذلك باستخدام تحويل جيب التمام المتقطّع، والذي يقوم بفصل التردّدات المنخفضة في الصورة عن التردّدات المرتفعة. فعاليّة الخوارزمية المستخدمة في توفير مساحة تخزينيّة تعتمد على نسبة التطابق بين الصور المكرّرة والمتشابهة، والتي بدورها تتأثّر بالتعديل الحاصل على 64 عنصر الأقل تردّداً في الصورة.

التحميل