۹۲/۰۷/۲۱ تدریس یار داده کاوی
ما می خواهیم که ۴ سری دیتا به عنوان تمرین وارد کنید و ارسال کنید
فایل cars
در sample های spss معمولی اگر باز کرده باشید می توانید باز کنید و استفاده کنید در folder sample هست
بعد از اینکه node statistic را لود کردیم
در ستون value متغیر ها لود می شود
ممکن است در متغیر ها بی پاسخی داشته باشیم
مثلا در متغیر MPG اطلاعاتش نباشد
وقتی روی missing کلیک می کنیم می توانیم آنرا خاموش یا روشن کنیم
یعنی بی پاسخی را برای آن تعریف کنیم
در سیستم این امکان وجود دارد که با بی پاسخی هر جا اطلاعات داشته باشد استفاده کند و رهر جایی که missing باشد آنرا رها میکند
برای کنترل داده های معتبر می توانیم در missing specify را انتخاب کرده و در ستون check محدوده اعداد و یا شرطی را انتخاب کنیم و جایگذاری کنیم
نحوه برخورد با بی پاسخی را تنظیم می کنیم
گزینه Coerce : وقتی به محدوده بی پاسخی میرسد , متغیر کمی است میانگین داده ها در نظر می گیرید
اگر داده ها به صورت عددی باشد و مثلا ۰ را به عنوان بی پاسخ داده باشیم نزدیکترین عدد را جایگذاری می کند
اگر در Type Set بگذاریم در داده ها عدد هم باشد ، اعداد با کوچکترین عددی که سیستم می شناسد جایگذاری می کند.
در مورد جنسیت True / False بی پاسخ باشد به صورت کد کوچکترین را قرار می دهد ( false خواهد بود )
داده ها می تواند بدون نقش باشد ( مثل شماره دانشجویی ) محاسباتی نیست
برای اینکه بدانیم که داده ها به طور صحیح وارد شده Table آنرا ایجاد میکنیم
روی مبدا کلیک , F2 و سپس روی مقصد کلیک می کنیم
سیستم که می خواهد مدلی را Run کند
در قسمت expert هم نوع خروجی که سیستم میدهد مشخص می شود
اگر expert را انتخاب کنیم شرط توقف را هم در داده ها خواهیم داشت
نمودار siloet
هر چه مقدارش به ۱ نزدیک تر باشد نشان دهنده مناسب بودن خوشه هاست