خلاصه درس داده کاوی – دکتر محمد پور – ۹۲/۰۸/۲۰

Nov 112013

فرض کنید که ۷ تا Transaction داریم
یکی گوشت و مرغ و شیر میگیرد

برای محاسبه confidence

[image1]

Frequent itemset
Association Rules
برای محاسبه Confidence به دو صورت می توانید محاسبه کنید
۱- احتمال صورت به احتمال مخرج
۲-تعداد x بخش بر مجموع کل

[image2]
اگر شیر نتیجه میداد جوجه و لباس

الگوریتمهای زیادی برای پیدا کردن قواعد پیوند داریم

برای ۷ تا پیوند تعداد زیادی Rule رسیدیم
بنابراین برای hypermarket های بزرگ با این روش منطقی نیست
استراتژی محاسبه قواعد متفاوت است

خیلی از نتایج هم تکراری هست

الگوریتم های مختلفی که ارائه شده اند با اینکه متفاوت هستند ولی باید به نتایج یکسانی برسند ولی با هزینه های پیاده سازی متفاوت هستند
که در اینجا Apiriori Algorithm استفاده شده است

Apiriori Algorithm دو مرحله دارد
۱- تمام itmeset هایی که به کار رفته استفاده می کند
۲- از frequent temset استفاده می کند برای تولید قواعد

Frequent Itemset باید از minimum support بیشتر باشد
مثل خوشه بندی که یکجا دندوگرام را می بریم

ایده اصلی این الگوریتم از خاصیت Apiori استفاده می کند که هر زیر مجموعه Frequent itemset خودش یک frequent itemset هست

اگر یک مجموعه ABD – Frequent باشد بنابراین زیر مجموعه هاش هم حتما Frequent هستند

مثلا در ABD مجموعه AC چون زیر مجموعه اش نیست می تواند Frequent نباشند
بنابراین غیر Frequent ها را جدا می کند و کار ما را سریع می کند

Frequent Item set باید از مینیمم support ی که ما تعیین کردیم بیشتر باشد

اگر بتوانید یک مثال کتاب را حل کنید ( Rule ها را بنویسید )

باشگاه دانشجویی کارشناسی ارشد دانشگاه امیرکبیر

خلاصه درس داده کاوی – دکتر محمد پور – ۹۲/۰۸/۲۰

Leave a Reply Cancel reply