Nov 092013
 

۹۲/۰۸/۱۸
ادامه GMM

روش EM برای مخلوط های گوسی

ضرایب مولفه های گوسی
بردار میانگین
و ماتریس های کواریانس گوسی

قلب هر الگوریتم خوشه بندی cost function آن است
که به پارامتر های الگوریتم خوشه بندی می رسیم
به ما N تا بردار ویژگی میدهند یک GMM را باید به آن Fit کنیم

تشخیص تعداد خوشه ها
۱-خروجی روش k-means را به عنوان ورودی GMM ( که بردار هستند )

ضرایب مخلوط pk را چجوری می تونیم از k-means بدست بیاریم ؟
k-means یک الگوریتم هارد هست و هر نقطه را فقط به یک خوشه اختصاص می دهد
ماتریس کواریانس = بردار ویژگی منهای متوسط ضرب در ماتریس ترانهاده
وزن ها : تعداد اعضای هر خوشه تقسیم بر تعداد کل
——————–
ورودی و خروجی GMM چه چیز هایی هستند ؟
ورودی : N تا بردار ویژگی
خروجی : پارامتر های مخلوط گوسی

برای این داده ها مدلی را فیت می کنیم که داده ها را توصیف می کند

نکته : پارامتر های GMM را نمی توانیم در اول کار محاسبه کنیم ( فرم بسته ندارد )
پس یک سری فرمول غیر بسته ای که بدست آوردیم تابع درست نمایی را محاسبه می کنیم و مداوما تکرار می کنیم تا دیگر تغییر نکند

clustering-gmm-EM-kmeans

clustering-gmm-EM-kmeans2clustering-gmm-EM-kmeans3

clustering-gmm-EM-kmeans4
ماتریس قطری ایزوتوپریک
a) خوشه بندی بر اساس رندوم گرفته
b ) در مرحله دوم : مقدار احتمال پسین را پیدا کرده
c) قسمت maximation را انجام دادیم ( متوسط ها، وزن ها ، … )
d) دوباره احتمال پسین انتخاب کردیم
e) دوباره پارامتر های توزیع پسین را انتخاب کردیم ( در مرحله پنجم )
f) مرحله بیست که تابع درستنمایی تغییر نمی کند

 

clustering-gmm-EM-kmeans-example

Nov 052013
 

خلاصه درس حمل و نقل هوشمند – دکتر قطعی – ۹۲/۰۸/۱۴
its-920814Mutual Consistency

با استفاده از تقریب های ریاضی مشتق را ساده کرده
یک روشی را ارائه کرده مثل الگوریتم های مقدار بهینه ( گردایان نزولی Steepest Decent )این هم روند همگرایی به سمت نقطه بهینه دارند.

nonlinear programming
gradient approximation

Bilevel Programming – برنامه ریزی دوسطحی

its-920814-bilevelProgramming

در کنار این قید یک قیددیگر وجود دارد که یک مساله بهینه سازی جدید هست ( مینمم سازی f بین x و y)

مثلا x ها تعداد چراغ های راهنمایی هستند
و y ها متغیر های تخمین جریان هستند که توسط مساله دوم قابل پیگیری هست

شرایط KKT
یک مساله بهینه سازی می توانیم به صورت سیستم غیر خطی عنوان کنیم
یعنی برای پیدا کردن یک مساله بیهنه سازی یک دستگاه معادلات غیر خطی چند مجهوله حل کرد ، جوابهایی که صدق می کند یکی از آنها جواب بهینه باشد.
مقاله : یک روش تقریبی با استفاده از روشهای simplex
مقاله دیگر : برای حل مساله bilevel با استفاده از الگوریتم ژنتیک
مقاله دیگر : یک الگوریتم هوشمند ترکیبی

مساله bilevel programming روی سیستم غیر خطی کار می کنند

Simulation Optimization : برای بهینه سازی تابع خیلی وقت ها تابعی از مشتق استفاده نمی کنیم و بر اساس مقادیر خود تابع کار می کنیم.

گروه اول : تابع داشتیم ، نقطه پیدا می کردیم
گروه دوم : نقاط را داشتیم از روی آنها تابع پیدا می کردیم
گروه سومی گفتند اطلاعاتی را که از فرایند آماری پیدا کردیم این رابیاییم قالب تابع بدهیم

رگرسیون می تواند از روی مقادیر مختلف …

به این تابعی که بر اساس این روش بدست می آید متا مدل می گوییم

متا مدل : درباره یک فراند یکسری اطلاعات آماری جمع آوری کردیم فرایندی که تابع ساز باشد – ممکن است یک رگرسیون باشد یا شبکه عصبی باشد یا درون یاب باشد
الگوریتم های متا هیورستیک را روی متا مدل بکار بگیریم

چرا simulation Optimization ؟

فعالیت اول : ساخت سناریو های کنترلی
فعالیت دوم : قراردادن این فرابند کنترلی در نرم افزار های شبیه ساز
ستون دوم
فعالیت سوم :
مدلسازی مساله ATMS & ATIS

پارامتر های کنترلی را در مساله خودتان تغییر بدهید
ستون اول و دوم

جمع بندی نایی :
در ارتباط ATMS & ATIS سه تا تکنیک مطرح کردیم
نقاط قوت بر اساس چه دیدگاهی
نقاط ضعف برای چه شرایطی
فرصت برای چه سازمانی
محدودیت برای چه بخشی
تمرین : چه جنبه هایی از ATMS و ATIS برای شما مفید هست ؟

پیاده سازی نمی خواهیم ، فقط مدلسازی مفهومی می خواهیم
یک تحلیل SWOT تشکیل بدهید ( مثلا برای کنترل چراغ راهنما نقاط قوت برای هر یک از Entity ها چگونه است مثلا برای پلیس برای هم محله شما )

دو تا فایل درباره تحلیل SWOT قرار داده شده
از این دو تا مرجع استفاده کنید

تحویل : جلسه حضوری ۲۰ آذر

 

Nov 042013
 

خلاصه درس خوشه بندی ۹۲/۰۸/۱۳ دکتر زارع

ادامه بحث social Network

یک سری Object داریم که به هم متصل هستند

بزرگترین گراف همبند = Giant Component

Network crowd and marketing

kleinburg , jon

Community Structure یا Community detection
مفهومی هست به نام Clustering Coefficent ضریب خوشه بندی

Zacharay Karate Club
شبکه ای به عنوان Bench mark شناسایی جوامع پنهان هست
این شبکه دو بخش است
یک باشگاه – یک مربی و تعدادی هنر آموز
مربی به یک باشگاه دیگر می رود

Scientometric :به دنبال این است که شاخه مختلف علم چه ارتباطی می توان داشته باشد
و پیش بینی اینکه یک دانش جدید کجا بوجود می آید.
: information retreival

Determining Weights

Edge independent path

 

Nov 042013
 

برای تجزیه تحلیل سری های زمانی

مثلا فوریه ترانسفورم یک ایزومتری هست

موجک (wavelet) هم همینطور است
اگر بتوانیم …
Spectural Density را رسم کنیم پیک را که نگاه کنیم سیکل را به ما نشان می دهد
در نرم افزار itsm به راحتی تست می کنیم

Seasonal Index
سری زمانی

seasonal-Index

بر اساس این اطلاعات Cycle و Trend و Simlarity می توانیم در مورد Predection داده ها صحبت کنیم

در Time-Series Analysis با یک سری زمانی سر و کار داریم
ولی در داده کاوی با چندین سری زمانی سرو کار داریم یا با یک سری زمانی طولانی

داده ها را هم توزیع می کند و هم نرمال
برای تشخیص نا ایستایی ها
اگر می خواهید فشرده سازی هم انجام دهید wavelet Transform بهتراست

تبدیل فوریه : اگر بخواهیم برای متغیر تصادفی پیوسته انجام دهیم
تقریبی برای حالت پیوسته است

Enhanced Similarity Search Methods

در ITMS2000
در سری های زمانی اول داده ها را می خوانیم و سپس Time plot را رسم می کنیم

باید موارد نا ایستایی را حذف کنیم

واریانس به زمان وابسته هست

پس لاندا را صفر در نظر می گیریم
با این کار امدیم ناایستایی در واریانس را حذف کردیم
حالا سری که این سه مولفه را ازش حذف می کنیم
و سپس
سری باید بدون trend , seasonality , … , ….. باشد

 

datamining-DescreteFoureierTransform
datamining-DescreteFoureierTransform2

مدل زمانی ایستا
ARMA
ARAR
Auto regresive
میانگین متحرک

مدل برازش بدهیم Autofit را انتخاب می کنیم
با استفاده از روش AIC می توان بهترین مدل را انتخاب کرد
بهترین مدل ان است که AIC آن کمتر باشد

ARMA forecast
برای امتحان
کتاب Tan مرجع هست

Nov 032013
 

خلاصه درس تدریس یار خوشه بندی – مهندس حائری ۹۲/۰۸/۱۲
درخت تصمصم گیری
یک روشی هست که بر اساس قوانین .. ایجاد میشه

درخت تصمصم گیری تارگت شان متغیر های کمی هست
متغیر خروجی اگر کیفی باشد ، درخت رده بندی گفته می شود

می توانیم درخت های متعددی بکشیم
در C5 ممکن است چندین روش وجود داشته باشد ولی بهترینش را نشان می دهد ولی در درخت تصمیم همه درخت ها را نمایش می دهد

از معایبش اینکه اگر تعداد متغیر ها زیاد باشد در صفحه مونیتور نمی توان دید

درخت تصمیم کاربرد های زیادی دارد

برای اینکه الگوریتم C5 را فرا بخوانیم لازم بود type را بدانیم و آن چیز هایی که لازم نیست را حذف کنیم

ReadValue را می زدیم تا اطلاعات را بخواند

الگوریتم C5 ویژه متغیر های کیفی بود

این الگوریتم خیلی تحت تاثیر مشاهدات بی پاسخ قرار نمی گیرید

Target کیفی است ولی input هم می تواند کیفی باشد هم کمی

هر چقدر تعداد use Boosting ها مون کمتر باشد پیچیدگی کمتری خواهیم داشت

اگر از گزینه Expert استفاده می کردیم
گزینه Window Attributes قبل از اینکه C5 شروع بع کار کند متغیر هایی که در رشد درخت نقض سازنده ای نداشته باشد در مدل بندی استفاده نخواهد کرد

Costs :
use misclassification costs
اگر دیتایی بخواهد بد رده بندی شود جریمه ای در نظر گرفته شود یا خیر

در گزینه Analyze
Calculate predictor impotance : اهمیت هر کدام از متغیر های مسقل ورودی را برای ورود به ساخت درخت

 

 

Nov 022013
 

خلاصه درس تدریس یار حمل و نقل هوشمند – خانم مهندس نیک سیرت ۹۲/۰۸/۱۱
برنامه ریزی برای ارائه پرزنت ها گروه ها اماده باشند
متغیر های ترافیکی
دسته بندی کلی :
تقسیم بندی مدل ها بر اساس کلیات
از دیدگاه اجرایی : تحلیی و شبیه سازی

بر اساس معادلات ریاضی می توانیم مشخص کنیم
یک سری معادلات داریم که سیستم ترافیکی را مدل سازی می کنند.

در مدل تحلیلی به داده های زیادی احتیاج داریم
که بدست آوردن اطلاعات و ساخت مدل هزینه بر هست

مدل های شبیه ساز برای سیستم های وابسته به زمان خیلی خوب است
سطح مدل های را به ۳ سطح تقسیم بندی می کنیم :

مدلهای ماکرو
مدلهای مزو
مدلهای میکرو

فاکتور های اصلی در شبیه سازی ترافیک :
۱- تحقیقات پیشرفته در تئوری ترافیک
۲- استفاده از سخت افزار پیشرفته
۳- استفاده از نرم افزار پیشرفته
۴- توسعه در اطلاعات
۵-افزایش ترافیک و حمل و نقل اجتماعی
سیستم شبیه سازی را نباید کاملا شبیه سیستم واقعی تصور کنیم
در شبیه سازی برخی از پارامتر ها را نمی توانیم لحاظ کنیم ، مثل رفتار راننده ها

شبیه سازی بسیار ارزان تر از مدل تحلیلی است

در شبیه سازی می توانیم محل VMS را تغییر دهیم و نتایج را ببینیم

به مدل شبکه اضافه می کنید
رو روی vms اطلاعات جایگزین را می دهید

OD : مقدار جریان از هر مبدا به هر مقصد وجود دارد

یکی ار شبیه ساز های ماکرو Tansyt هست

مسیر های شریانی شهری و کنترل چراغهای ترافیک

تمرین این هفته : تحقیق در نرم افزار Tansyt

بقیه نرم افزار های شبیه ساز را هم در جلسه آینده بررسی می کنیم

 

 

Nov 022013
 

خلاصه درس تدریس یار خوشه بندی – مهندس برادران
پارامتر گاما z k
متغیر تصادفی است که نسبت داده می شود به خوشه k ام
احتمال پیشین : پیش از اینکه x وجود داشته باشد ، فقط احتمال پیشین می دهیم

تابع توزیع نرمال

مرکز یک توزیع نرمال محلی است که بیشترین چگالی داده وجود دارد

خوشه بندی با GMM
فرض کنیم یک GMM 3 مولفه ای را برای خوشه ها کافی است

استفاده از فقط liklihood – بردار x را اگر در هر گوسی بگذاریم و عدد بزرگتری را بدهد می گوییم مربوط به همان خوشه است

اگر پارامتر پسین هم داشته باشیم ، ممکن است در Prior هر خوشه هم ضرب کند.

اگر صورت کسر بیشتر بود تاثیری بر مخرج کسر ندارد

مخرج در خوشه بندی تاثیر ندارد

جمع prior ها در تابع GMM مساوی ۱ است

برای اینکه نرمال سازی انجام دهیم تقسیم می کنیم
چون احتمال پسین جمعش باید ۱ باشد

آیا جمع likelihood هم باید ۱ باشد ؟ خیر ، چون ممکن است داده های پرتی داشته باشیم که احتمال آن برای مرتبط شدن به هر خوشه ای بسیار کم باشد.
مهمترین رابطه GMM

[image1]

با فرض iid بودن داده ها (مستقل و یکسان )
کل داده ها را با X نمایش می دهیم
لگاریتم
log a + log b
ضرب لگاریتم که پشت خط هستند میشه جمع لگاریتم ها شون
اگر در GMM مشتق بگیریم به رابطه بسته نمی رسیم بنابراین EM ارائه شد

تابع likelihood
مشتق نسبت به میو کا ( متوسط یک خوشه مشتق می گیریم )
برای خوشه بندی یک تابع Cost تعریف می کنیم که در اینجا تابع likelihood است

Nk یک عدد اعشاری است

– ماکزیمم سازی بدون قید
– ماکزیمم سازی مقید

 

 

Nov 022013
 

مدل کلی فرآیند مهندسی و ایجاد سیستم های تجارت الکترونیکی

مراحل فرآیند مهندسی و ایجاد ECS

پیش فرض های متدولوژی مهندسی ECS

ecs-flowchart

[image 1]
نمودار فرآیند کلی مهندسی و ایجاد سیستم های تجارت الکترونیکی

فهرست مراحل فرآیند کلی مهندسی سیستم تجارت الکترونیکی

تعیین محدوده اعمال در کسب و کار تجاری

اعمال خریدار ( قبل از خرید – حین خرید – پس از خرید )

اعمال فروشنده ( قبیل از فروش – حین فروش – پس از فروش )

اعمال واسطه ( قبل از خرید و فروش – حین خرید و فروش – پس از خرید و فروش)
مولفه ها و ابعاد موثر در نحوه انجام فروش

نوع پیکره بندی قلم تجاری برای فروش ( طرح .


نوع تبادل ( نقد – اقساط / اعتباری )
محدوده جغرافیایی ( داخلی / خارجی )
نوع شخصیت خریدار ( حقیقی / حقوقی / دولتی )
نحوه تحویل ( تدریجی / فوری )
تعهدات فروشنده ( بیمه / حمل )
حجم خرید ( خرد / عمده / کلان )
نوع تبادل مالی
تعیین دامنه فعالیت ها در کسب و کار تجاری

ماتریس اقلام / عملیات کسب و کار تجاری
– عبارتست از ماتریسی که نمایش دهنده اعمال تجاری لازم بر روی اقلام تجاری می باشد
سطر ها : اقلام و عوامل تجاری
ستون ها : عمال تجاری
درایه ها : نقش تجاری انجام دهنده فعالیت

تعیین فهرست فعالیت ها و خدمات کسب و کار تجاری
– عنوان هر فعالیت : عمل تجاری + قلم یا عامل تجاری
نکته :
تفاوت وضعیت خریداران در هنگام اقدام خرید

انواع وضعیت در خریدار
( شناخت نوع نیاز / فروشنده / قیمت ها / شرایط )
انواع وضعیت در فروشنده
( شناخت نیاز مشتری / انطباق کالا و خدمات با نیاز های مشتری )

شناخت معماری کسب و کار موجود

هدف :
۱- شناخت کلیه نقش ها و عوامل اجرا کننده مراحل کسب و کار تجاری
۲- اجرای کسب و کار تجاری در بستر یک سازمان ( وابستگی عناوین نقش ها و عوامل اجرایی به معماری سازمان – وابستگی نیازمندی های هر نقش یا عامل اجرایی )
مروری در معماری ۷ لایه
[image 7 layer]


ecs-Architect

 

 

ecs-Architect2

 

 

جریان های کاری در سازمان های تجاری

 

ecs-workflow ecs-workflow2

با کلیک روی آگهی زیر مبلغ 400 ریال به حساب من واریز می گردد

با کلیک روی آگهی زیر مبلغ 1000 ریال به حساب من واریز می گردد