خلاصه جلسه خوشه بندی دکتر زارع
max یا Complete linkage
Group Average
تقسیم بر تعداد کل اعضا
محدودیت : اگر یک سری ساختار ها ی global
داشته باشیم ، نسبت به آنها اریب خواهد داشت
هزینه محاسباتی : O^3
دیگه نمیشه تصمیم را بر گرداند
در روش Hierarchical اول هر نقطه را یک خوشه
می گرفتیم و بعد merge می کردیم
ولی در روش divisive برعکس
ابتدا یک کلاستر داریم و در مرحله بعدی میشکنیم
در عمل از الگوریتم Divisive خیلی استفاده نمی
شود.
یک مثال در hirearchical هست :
یک ماتریس آمده در قدم اول
در امتحان شبیه این ماتریس میدهیم که شما در
ابتدا تشخیص دهید که ماتریس Distance هست یا
….
در امتحان میان ترم این نمونه سوال میاد
قدم اول Merge A,B
قدم دوم Update Min یا sinlge Linkage
قدم بعدی تکرار update Min
که نتیجه {{A,B},{C}
{{A,B},{C}},D}
دندروگرام هم میشه کشید.
برنامش هم میتونید بنویسید.
صفحه ۳ / ۱۷
صفحه ۵ / ۱۷
Single Linkage
Average Linkage
Warde Linkage
هر distance شما در یک خوشه باید قرار گیرد
الگوریتم خوشه بندی افرازی تفاوتش این است
Algorithm K-means
۱- decide on a value for k
۲- initialize the k cluster centers ( randomly , if
necessary )
۳- decide the class member ships of the N
objects by assigning them to the nearest
cluster center.
۴- Re-estimate the k Cluster centers, by
۵-
نقاط قوت :
k-means
قدرت محاسباتی خوبی دارد
نقاط ضعف :
داده های گسسته خیلی کارایی ندارد
بایدتعداد خوشه ها را باید ار قبل تعیین کنیم
نویز دیتا
برای کلاستر های مقعر مناسب نیست
ایمیل استاد
h . zare @ ut . ac . ir
hadizare @ gmail . com