Sep 162013
 

۹۲/۰۶/۲۵
خوشه بندی Clustering

n تا رکورد داریم ، می خواهیم آنها را به k قسمت تقسیم کنیم

هدف اصلی کلاسترینگ ، گروه بندی اطلاعات

روشهای semi supervised

Complex Network
شبکه های اجتماعی
اجتماعات پنهان
شبکه های تکنولوژیک – مثل شبکه برق یک منطقه -یا شبکه فرودگاه های یک کشور

recommender system

text mining

term Document Matrix
High dimential Data با روش های خوشه بندی کوچک می کنیم

مثال ساده برای مفاهیم :
یک سری حیوان داریم می خواهیم به یک سری خوشه بندی همگن تقسیم کنیم

پستانداران ، پرندگان ، خزندگان ، ماهیان ، دوزیست

معیار ها مهم هستند
محیطی که حیوانات زندگی می کنند ( دریا ، خشکی )
یا نحوه تولید مثل

اگر معیار ها را عوض کنیم دسته بندی ها متفاوت می شود
خوشه بندی … نیست ؟

Supervised classification نیست
Simple Segmentation نیست
Results of query نیست
Graph Partitioning نیست
————————————-

fraud detection کشف تقلب در بانک ها

Domain expert ها بایستی نتایج اطلاعات را تایید کنند

دسته بندی را دو بخش می کنیم
۱- روشهای افرازی Partitional Clustering
۲- روشهای سلسله مراتبی Hirerachical Clustering
——————————————–

fuzzyClustering

دسته بندی در بانک ممکن است یک سری از اطلاعات بدرد نخور باشد
که ممکن است آنها را حذف کنیم
روشهای خوشه بندی :

Newarest Neigbor
Density-Based
Conceptual Clusters

یک سری نکات :
انواع Features
مراحل خوشه بندی
۱- feature selection
۲- proximity measure
۳- معیار
۴- الگوریتم
۵- اعتبار سنجی نتایج ( روشهای ارزیابی یا domain expert )
۶- تفسیر

 

Sep 162013
 

http://www.mediafire.com/?m0kglj6vz0bl6ym

pass: datamining_dr_mohammadpor

 


کتاب داده کاوی

Introduction to Data Mining

Introduction to Data Mining

Pang-Ning Tan, Michigan State University

Michael Steinbach, University of Minnesota

Vipin Kumar, University of Minnesota

ISBN-10: 0321321367

• ISBN-13: ۹۷۸۰۳۲۱۳۲۱۳۶۷  ©۲۰۰۶

• Addison-Wesley • Cloth, 769 pp

pencilji.com/download/37729661.pdf

 

با کلیک روی آگهی زیر مبلغ 400 ریال به حساب من واریز می گردد

با کلیک روی آگهی زیر مبلغ 1000 ریال به حساب من واریز می گردد