۹۲/۰۶/۲۵
خوشه بندی Clustering
n تا رکورد داریم ، می خواهیم آنها را به k قسمت تقسیم کنیم
هدف اصلی کلاسترینگ ، گروه بندی اطلاعات
روشهای semi supervised
Complex Network
شبکه های اجتماعی
اجتماعات پنهان
شبکه های تکنولوژیک – مثل شبکه برق یک منطقه -یا شبکه فرودگاه های یک کشور
recommender system
text mining
term Document Matrix
High dimential Data با روش های خوشه بندی کوچک می کنیم
مثال ساده برای مفاهیم :
یک سری حیوان داریم می خواهیم به یک سری خوشه بندی همگن تقسیم کنیم
پستانداران ، پرندگان ، خزندگان ، ماهیان ، دوزیست
معیار ها مهم هستند
محیطی که حیوانات زندگی می کنند ( دریا ، خشکی )
یا نحوه تولید مثل
اگر معیار ها را عوض کنیم دسته بندی ها متفاوت می شود
خوشه بندی … نیست ؟
Supervised classification نیست
Simple Segmentation نیست
Results of query نیست
Graph Partitioning نیست
————————————-
fraud detection کشف تقلب در بانک ها
Domain expert ها بایستی نتایج اطلاعات را تایید کنند
دسته بندی را دو بخش می کنیم
۱- روشهای افرازی Partitional Clustering
۲- روشهای سلسله مراتبی Hirerachical Clustering
——————————————–
fuzzyClustering
دسته بندی در بانک ممکن است یک سری از اطلاعات بدرد نخور باشد
که ممکن است آنها را حذف کنیم
روشهای خوشه بندی :
Newarest Neigbor
Density-Based
Conceptual Clusters
یک سری نکات :
انواع Features
مراحل خوشه بندی
۱- feature selection
۲- proximity measure
۳- معیار
۴- الگوریتم
۵- اعتبار سنجی نتایج ( روشهای ارزیابی یا domain expert )
۶- تفسیر