تحسين خوارزمية التجميع Mean-Shift بتقدير كثافة الكائنات والنطاق الترددي
الملخص
يعتبر تجميع البيانات واحد من أهم الأدوات المستخدمة في تنقيب البيانات. تقسم خوارزميات التجميع مجموعة من الكائنات إلى عدة تجمعات (عناقيد). تعتبر خوارزمية الـ من خوارزميات التجميع الأكثر استخداماً، ولكنها تعاني من بعض المشاكل، حيث ان الخوارزمية لا تقوم بتعيين قيمة نصف القطر (النطاق الترددي) للنافذة وانما المستخدم يقوم بإدخاله عشوائياً، كما أن الخوارزمية لا تعيّن المراكز الابتدائية للنافذة وانما تعيّن بشكل عشوائي في البداية، لذلك يصبح عدد التكرارات لتنفيذ الخوارزمية كبير، وكذلك التحديد العشوائي لمراكز العناقيد الابتدائية قد يؤدي لإعطاء نتائج مختلفة. نقدم في هذا البحث خوارزمية معدلة لحل بعض المشاكل التي تعاني منها خوارزمية الـ Mean-Shift. قمنا باقتراح آلية لتعيين المراكز الابتدائية للعنقود بحساب قيم دالة الكثافة للكائنات، بعد ان كانت الخوارزمية الاصلية تقوم بالاختيار العشوائي للمراكز الابتدائية، إضافة إلى تحديد قيمة نصف القطر آلياً بدلاً من إدخالها من قبل المستخدم.