Oct 292013
 

Damberg 1996

مرحله ۱ : زمان سفر در هر یال ثابت (زمان سفر تک تک خیابان های ممکن در مسیر بدون ترافیک ) در نظر می گیریم (بهترین حالت زمان سفر آزاد – کاملا بدون ترافیک – را در هر خیابان در نظر می گیریم ) تمام مجموعه مسیر های بین مبدا و مقصد را پیدا می کنیم
مرحله ۲ : تابع لاجیت را برای بدست آوردن بار ترافیکی روی هر مسیر استفاده می کنیم
و از روی فرمول … میزان جریان ترافیکی که از روی یک یال (خیابان) عبور می کند را نسبت به جریان های ترافیکی مسیر ها می توانیم بدست بیاوریم

ترکیبی از الگوریتم دایکتسرا و جریمه کردن

مثلا سه بار الگوریتم دایکسترا با در نظر گرفتن پارامتر های جریمه ای
حذف کردن یال مناسب نیست

its-920807

در فاز پیاده سازی ۳ تا کوتاهترین مسیر را در نظر بگیرید

مسیر منتخب رو از مدار انتخاب خارج میکنیم

ابتدا با یک الگوریتم مسیرهای کوتاه را پیدا می کنیم-وقتی پیدا کردیم حالا مجموع مثلا ۳ مسیر کوتاه را پیدا می کنیم(برای مخرج لاجیت)

حذف یال خیلی مناسب نیست
ولی جریمه کردن ممکن است نتیجه خوبی بدهد

its-920807-2

الگوریتم k shoertest path

میران تفاضل جریان ثانویه را حساب می کنیم اگر بزرگتر از اپسیلون بود ادامه میدهیم
و اگر کمتر از اپسیلون بود متوقف می کنیم

cost ترکیبی از زمان و هزینه است

۲ تا flow داریم (جریان اولیه –  جریان ثانویه )

۱- TrueFlow (جریان ترافیکی بدون ترافیک )

۲- Estimated Flow by Logit  (یک بار داخل تابع logit می گذاریم)

 

یک بار بر اساس جریان یالی آزاد میزان جریان را حساب می کنیم
جریان اولیه و با توجه به جریان های قبلی هزینه ها را Update کردیم
با توجه انتخاب الگوریتم logit جریان بعدی باید نزدیک به هم بشوند

۲ هفته دیگه مهلت تمرین تمدید می شود
در جلسه حضوری ۴ شنبه کد ها را از نزدیک بررسی میکنیم

مطابقت دوطرفه برای مساله تنظیم

تخمین سفر path estimator

استفاده از الگوریتم ژنتیک :
– نحوه نمایش ژنتیکی جوابهای مساله
راهی برای ساختن جمعیت اولیه جواب ها
تابع ارزشیابی که میزان شایستگی جواب ها را نشان می دهد.
عملگر های ژنتیکی که ترکیب ژنی فرزندان را صورت داده و جمعیت جدید تولید نماید.
مقادیر پارامتر های ژنتیکی
گام ۱ : پارامتر های مورد ننیاز الگوریتم ژنتیک تعیین و متغیر های تصمصم را به صورت دودویی و بر اساس کران پاین و بالا و کد نمایید.
گام ۲ : جمعیت تصادفی اولیه از متغیر های چراغ راهنما تولید کند
گام ۳ : سطح پایین را به وسیله روشی از PFE حل و جریانهای تعادل کاربر تصادفی برای هر یال شبکه محاسبه کنید.
گام ۴ : زمانهای چراغ راهنمای مطرح شده در گام دو و جریان های تعادلی یال های شبکه محاسبه شده در گام سه را به نرم افزار Transyt داده ، معیار کارایی سیستم را به وسیله آن محاسبه نمایید
گام ۵ : عملگر آمیزش و عملگر ژنتیکی را به کار ببرید
گام ۶ : جمعیت جدید را از روی جمعیت قبلی و فرزندان بسازید.
گام ۷ : اگر تفاوت میان میانگین شایستگی جمعیت و شایستگی بهترین عضو جمعیت کمتر از ۵% باشد جمعیت اولیه ساخته و به قدم سه باز گردید . در غیر انصورت به سراغ قدم بعد بروید.
گام ۸ : اگر بیشترین تعداد مجاز جمعیت گیری حاصل شده باشد، جواب با بالاترین شایستگی را جواب بهینه مساله گرفته و در غیر این صورت به سراغ قدم سه بر گردید

بعد از پیاده سازی تخصیص ترافیک را که انجام دادید

به عنوان تمرین ۲ : جواب مقادیر سبز چراغ راهنما بر این اسا س قابل پیاد هسازی هست یا نه

کد الگوریتم ژنتیک برای بهینه سازی زمانبندی چراغ راهنما بنویسید

Oct 282013
 

خلاصه درس خوشه بندی – دکتر زارع – ۹۲/۰۸/۰۶
امتحان هفته بعد میانترم   نیست
در حد روشهای سلسله مراتبی و مباحث اولیه خوشه بندی – مثل نمونه سوالی که دادیم

هفته بعد امتحان میان ترم نیست
یا اینکه یک تمرین بدهیم
بحث Model Selection

Social Network

Intruduction to Social Networks
Jure Leskoves
Stanford University
مهندسی سامانه های شبکه ای
علم جدید در قرن ۲۱ هست
Big Data
Data Science

سال ۱۹۶۴ آزمایش ارسال ۱۰۰ بسته پستی به آمریکا انجام شده که حداکثر با ۶ لینک این کار انجام شده
پدیده Small World
بخشی از این را فیزیکدانان و بعد ریاضی دانان و بعد کامپیوتری ها به دنبال نتیجه گیری از شبکه های اجتماعی هستند
۶ Degree of seperated

کتاب Networks an introduction m e j newman
یک گراف کشیده از ارتباطات اینترنت

Connection Between political blogs
http://connectedthebook.com/
Networks : Organizations
ارتباط ها را با یالها نمایش می دهیم
شبکه اقتصادی

مغز انسان
Human Brain 10 -100 billions neurons
https://www.humanbrainproject.eu/

شبکه زیستی پروتئین ppi

شبکه متابولیک

برای فهم ارتباطات شبکه :
Empirical : پرسشنامه ای
Mathematical ریاضی
Algorithms الگوریتمی

اولین مدل های شبکه ای را به روش ریاضی erdus , و reny ارائه دادند

جچوری به این مدلهای برسیم
یک سری pattern و خواص آماری و یک سری معیار باید بتوانیم استخراج کنیم
مدل ها را استخراج کنیم
و بفهمیم که شبکه ها چرا اینگونه ساخته شده اند

اقای ves vigiani – complex network بحث بخش ویروس های کامپیوتری را تشخیص داد ، رفتار دینامیک

شبکه ها برای دسترسی پذیری به اطلاعات ، جهانی شدن
Networks : Impact

Dotnet Bilioners

معرفی شبکه
ارتباطهای بیماری ها به هم

Networks Really Matter
Network یک کلکسیونی از اشیا مختلف هست که به هم وصل شده اند

Objects : Node , Vertices
Intractions : Links , edges
System : Network , Graph

نظریه گراف : نمایش ریاضی

برای تحلیل شبکه از گراف استفاده می کنیم

نمایش صحیح برای شبکه
در برخی جاها می توان نمایش یکتا ارائه داد

شبکه های جهت دار یا بدون جهت

شبکه می تواند connected باشد می تواند Disconnected هم باشد .

دوستانی که مقاله فرستاده بودند ،امشب خوانده می شود
ISI جدید باشد

 

 

Oct 272013
 

خلاصه درس تدریس یار داده کاوی ۹۲/۰۸/۰۵
K-means

Unomary Detection
تحلیل خوشه ای نیاز به هیچ پیش شرط آماری نیست

یک متغیر Target یا هدف باید داشته باشیم
که یا از قبل مشخص می کنیم به عنوان Target
یا به جای اینکه از use type node setting استفاده کنیم از use
custom setting استفاده می کنیم

یکی از این الگوریتم ها الگوریتم C5 هست

الگوریتم C5 اولا برای متغیر های کیفی ( چه به فرم اسمی باشد یا
به فرم ترتیبی )

ملاک برای خوشه بندی چه متغیر هایی می تواند باشد ؟
باید مجموعه ای از متغیر های ( کمی و یا کیفی ) در دسته بندی
متغیر ها مورد استفاده قرار بگیرد

متغیر های ورودی Input را باید وارد کنیم

در نسخه IBM modeler 14 یک گزینه اضافه شده : Use Weight Field
(مثلا به تفکیک سال )

Build model each split
اگر مدلی را به عنوان تقسیم کننده انتخاب کرده باشیم ، برای هر
بخش تقسیم شده کدش را نمایش می دهد

مدل می تواند Simple ساده باشد یا Expert حرفه ای

درخت تصمیم بایستی با کمترین شاخه بتواند ما را با نتیجه برساند
در تمرین قبل الگوریتم C5 را اجرا کنید و بفرستید

 

Oct 262013
 

خلاصه درس تدریس یار خوشه بندی ۹۲/۰۸/۰۴
تمرین : حتما از مقالات جدید استفاده کنید
مثلا از Fuzzy FCMeans استفاده کنید
هر الگوریتم خوشه بندی یک تابع هدف دارد که آنرا مشخص می کنیم
چند تا معیار پیدا کردن خوشه های بهینه را گفته است
تعداد خوشه بندی بهینه در روش های مختلف ممکن است متفاوت باشد

گزارش حتما باید فارسی باشد.
تا جمعه ۹۲/۰۸/۱۰ تمدید شد.

به فرمت : HomeWork1_nadi
مرجع GMM ما از کتاب Bishop می گوییم
روابط بویژه از طریق فرمولاسیون

روش مخلوط گوسی مثل Fuzzy هست

تعلق به خوشه های مختلف ممنکن است متفاوت باشد

میانگین و واریانس پارامتر ها هستند
اگر داده ها چند بعدی بودند
یک ماتریس برای میانگین داشتیم – یک بردار برای واریانس

مثلا می گوییم : در مدل سازی یک مجموعه داده ای از یک مخلوط با ۳ تابع گوسی استفاده شده

توزیعی وزنش بیشتر است که تابع های بیشتری به آن Fit شده اند
Pi,k بیشتری دارد

پارامتر وزن : pi k
بردار میانگین : mio k
مولفه : Sigma k

یک متغیر تصادفی Z تعریف می کنیم ، یک بردار است
تعداد مولفه هایش به تعداد مولفه های گوسی هست
۳ مولفه دارد
هر کدام از مولفه ها می توانند ۰ یا ۱ باشند
و مجموع موله ها باید۱ شود
k تا حالت می شود

به جای اینکه بگوییم مولفه گوسی سوم ، متناظر Z آنرا می گوییم

پس توزیع Z پر رنگ میشه :
z=[z1 z2 z3]

توزیع توام

Ta-Clustering-GMM-pxk

p(a/b)= p(a)*p(b/a) / S(p(a,b))

در صورت وزن هر گوسی را در تابع توزیع ضرب می کنیم
تقسیم بر مجموع pi ها در تابع نرمال ها
اسلاید ۹ : Prior Probablility
zk =1 احتمال پیشین
احتمال پسین ، احتمال گوسی k پس از مشاهده x

—————————–

تمرین به صورت PDF و داخل یک فایل زیپ باشد

 

Oct 222013
 

شرح استفاده از نرم افزار Turbo Architect
توسط خانم مهندس روشنی

۱- تعیین اهداف و راهبرد ها – تعیین ذینفعان و نیاز کاربران
۲- تعیین موجودیت ها – تعیین مفاهیم عملیاتی – تعیین نیاز های عملکردی – تعیین خدمات
۳- تعیین جریان اطلاعات – تعیین رابط ها
۴- استاندار سازی ITS – تهیه لیت توافق نامه ها
۵- استفاده از معماری
۶- نگهداری از معماری
از Stack Holder Group می توانیم ذینفعان را مشخص کنیم

فهرست موجودیت ها
باید مشخص کنیم که این سیستم شامل کدام زیر سیستم استاندارد شده در آمریکا هست.

سر برگ خدمات : AutoSelect Services

http://bounced.azdot.gov/Highways/TTG/ITS-Architecture/index.html

 

دانلود نرم افزار Turbo Architecture ۷٫۰

Oct 212013
 

خلاصه درس خوشه بندی جلسه ۹۲/۰۷/۲۹

GMM assumption
فرض می کنیم هر کلاستر تابع توزیع نرمال هست

اگر بخواهیم یک مدل آمیخته را نمایش دهیم
اگر Latent Variable ها را بدانیم
Latent Varible ها Parent های کلاستار ها هستند

aic : Akaike information Criteria
BIC :Bayesian Information Criteriaumber of cluster

می توانیم از فرمول قانون بیز استفاده کنیم
clustering-GMM-bayesian

اگر تعداد داده ها زیاد باشد و شکل نمایشی آن gaussian مانند باشد استفاده از روش GMM بسیار خوب است
ولی اگر داده ها کم است از GMM استفاده نکنید

clustering-GMM-bayesian2bayesClassifier

الگوریتم EM – یک فرض می گذارد
اساس کار این است که به صورت پیش فرض اطلاعات کافی نیست
و مشاهدات ناقص هست
یک متغیر zk به مساله اضافه می کند
و بر اساس متغیر پنهان (Latent variable )

هدف : با استفاده از الگوریتم EM، پارامتر های توزیع آمیخه(Mixture Model ) را بدست بیاوریم

قدم اول : مقدار دهی اولیه : Log Lokely hood را حساب می کنیم
قدم دوم : expectarion امید را حساب می کنیم
قدم سوم : مجددا پارامتر های استفاده شده را در وضعیت حاضر بدست میاریم
قدم آخر : فرض میکنیم Stop کردیم
موی کا ، سیگما کا و پای کا را بدست آوردیم
احتمال پسین هر کلاس به شرط مشاهده xi را حساب می کنیم
از قاعده بیز هر کدام که احتمالش بیشتر بود
داده کلاستر ۲ می شود
عمل انتصاب را انجام می دهیم

جلسه بعد AIC , BIC و همچنین Evaluation را می گوییم

پروژه :
برای پروژه درس از داده های شغلی تان استفاده کنید
مقاله از jornal international استفاده نکنید
از ۲۰۱۱ یا ۲۰۱۲ به بعد باشد

 

Oct 212013
 

خلاصه جلسه داده کاوی – دکتر محمد پور ۹۲/۰۷/۲۹
GMM – Gaussian Mixture Model
چهار روش بر آوردی پارامتر های یک مدل آمیخته گاوسی

در آمار مفهوم مستقل و هم توزیع داریم

۲- مدل آمیخته گاوسی :
برای نشاهدات مستقل و هم توزیع x1,…,xn ، مجموع وزن دار K مولفه ، با تابع چگالی گاوسی است که با معادله زیر نشان میدهیم :

GMM-formula


۳- برآورد پارامتر های مدل آمیخته گاوسی به روش تحلیلی
* مهم : باید داده ها را شبیه سازی کنیم

کلاسترینگ سالانه کنفرانس دارد ، ۸۰ مجله به چاپ مقالات کلاسترینگ می پردازند
۳-۱ روش گشتاوری
می خواهیم از دو جامعه نرمال آمیخته …
مثال قد و وزن دختر ها و پسر ها خوشه بندی کنیم
به چهار روش این مساله را بررسی می کنیم ( برای دو متغیره )
۱- روش دقیق
۲- روش ریاضی
۳- EM روش آماری
۴- Gip Sampling – شبیه سازی

آیا این مساله به روش تحلیل قابل حل است ؟
با روش تحلیل فوق العاده پیچیده می شود ( گشتاور مرکزی )

در آخر صفحه کد های تولید GMM آورده شده است با نرم افزار R
GMM-program1
۳-۲ ماکسیمم درستنمایی
با این روش می توانیم پارامتر ها را دقیق تر بر آورد کنیم
تابع چگالی را به عنوان یک پارامتر ببینیم
پیدا کردن maximum Likelyhood

maximum-likelyhood

در حالت چند متغیره :
در حالت ۵ متغیره با روش تحلیلی بسیار پیچیده می شود.

maximum-likelyhood-multivariable

کد بر آورد پارامتر های GMM با روش عددی
اگر بخواهیم ماکزیمم تابع را پیدا کنیم با استفاده از دستور optim می توانیم انجام
دهیم
۳-۲-۲ برآورد پارامتر های GMM با الگوریتم EM

 

الگوریتم EM
روش Gipsampling
قبلا به روش های آمار کلاسیک حل می کردیم
ولی با این روش در چارچوب آمار بیز حل کنیم
یعنی یک اطلاعات پیشین هم باید داشته باشیم
توزیع پیشین مزدوج : (یک مساله استاندارد است )
تمرین برای جلسه بعد : تولید عدد تصادفی از GMM چند متغیره در متلب انجام
بدهید – مثل مقاله –

چگونه با استفاده از متلب با GMM اعداد تصادفی تولید می کنید ؟
جواب را به Email statdatamining بفرستید


maximum-likelyhood-multivariable-code

 

Oct 202013
 

خلاصه درس تدریس یار داده کاوی – ۹۲/۰۷/۲۸

spss 14 modeler
File – Open – Demo

Source – Node Statistic files – Demos –
از لیست فایل ها فایل telco را انتخاب می کنیم
این فایل شامل ۴۲ ستون و ۱۰ ردیف هست

این فایل را برای مثال K میانگین و ۲ Step Cluster باز می کنیم

از بین لیست متغیر هایی که داریم ، چند فیلد را وارد کرده ایم
در این کار هدف این است که از ۴۲ متغیر با استفاده از این ۵ متغیر کار خوشه بندی داده ها را انجام بدهیم
۱۰ تا مشاهده داریم
به چند روش می توانیم این داده ها را خوشه بندی کنیم
قسمت Field – User Custom Setting را می زنیم
در کرکره Model اتوماتیک هست و یا نام دلخواهی را انتخاب کنیم
اگر از داده های بخش بندی شده استفاده کنیم
ما در سیستم K میانگین محدودیتی داریم که باید بدانیم به چند خوشه می خواهیم تقسیم بندی کنیم
به صورت پیش فرض ۵ خوشه داریم

آیا می خواهیم ستون مربوط به فاصله ها را
در کرکره بعدی Expert : آیا اطلاعاتی که داریم می خواهیم یک خوشه بندی ساده باشد یا اطلاعات کاملتری را هم بدهد.
اگر اجرا کنیم این شکل دیده می شود

ta-datamining-Spss-Clementine

 

ta-datamining-Spss-Clementine2

۵ تا خوشه ای که انتخاب کرده ایم
اگر تعداد خوشه های کمتری را انتخاب می کردیم ممکن بود مقدار سایه نما Siloet بهتری را داشتیم
در View گزینه cluster داریم
که می گوید چه ویژگی هایی وارد شده
در ردیف size درصد خوشه ها را نمایش می دهد
در پایین منو نمونه ها و جدول های دیگری را نمایش می دهد
Show Basic : درجه اهمیت و تعداد متغیر های موثر در خوشه بندی اعلام می کند.

متغیر های پیشگو : Predictor importance
Summary : خلاصه اطلاعات را می دهد
می توانیم چند بار از K-means استفاده کنیم

یک روشی دیگر داریم به نام ۲ Step Cluster

باید نرمال چند متغیره باشد
در k-means برای متغیر های کمی هست
و نمی توانیم از متغیر های کیفی استفاده کنیم

در سیستم ۲Step Clustering
امکان محاسبه فاصله برای متغیر های کیفی هم بوجود امده است .

قبلا خوانیم که باید داده ها نرمال چند متغیره باشد

Node 2 Step Cluster را اضافه کردم
با کلید f2 اتصال را برقرار کردم
DblClick که می کنیم روی ۲ step cluster
مشابه متغیر هایی که برای k-means انتخاب کرده بودیم اینجا هم انتخاب می کنیم
در تب Model گزینه ای برای عددی کردن داده ها وجود دارد
exclude outlier : مشاهدات پرت را از تحلیل حذف می کند
به صورت پیش فرض اگر بیش از ۳ داده پرت باشد از دور خارج می کند

برای نفر دوم ، سن نفر دوم را منهای انحراف میانگین نفرات می کند

بهینه تعداد خوشه ها می تواند تشخیص دهد
یا اینکه امکان این هست که تعداد کلاستر را اجبار کنیم
Distance Major : حداکثر درست نمایی : فاصله اقلیدسی هم داریم
معیار خوشه بندی بر اساس معیار بیضی شوارتز BIC یا AIC باشد

 

 

Oct 192013
 

Traffic Control Systems

صحبت درباره پروژه دکتر قطعی
بایستی الگوریتم ها را با استفاده از داده ها استفاده کنید

Control and Management Functions
توابع مدیریت و کنترل :
TSM یک فلسفه درباره Planing ,Programming , Implementation , Operation هست
یک سری سرویس ها را میخواهیم ارائه بدیم

برای مدیریت سیستم های حمل و نقلی
جمع آوری دیتا برای گسترش برنامه ریزی زمانبندی چراغ و توابع دیگر هستیم

بخش ها را Section بندی می کنیم
Section ها منطقه ای هست که تغییرات زیادی نداشته باشد ( قسمتی از آن ترافیک سنگین و یک قسمتی ترافیک سبک نداشته باشد)

مرز ها را مشخص میکنیم ، پارامتر های کنترلی را مشخص می کنیم ( در جلسه بعد )

اجرای زمانبندی چراغ ( implement )
بحث Traffic Responce واکنش ترافیکی هست

بعد از اینکه اطلاعات رو پردازش کردیم باید به کاربران هم اطلاع بدهیم

اطلاعات را میتوانیم با استفاده از CMS Changable Messege Systems به مردم اطلاع بدهیم
DMS یک سری تابلو ثابت هست
سرویس رادیو ، وب سایت هم مدیا های دیگری برای انتقال اطلاعات هست

مدیریت تصادفات : توابع دیگری مطرح هست ( اطلاع رسانی انتخاب مسیر ، تخلیه ترافیک تصادف [مدیریت بحران] )
Integration : ارتباط بین زیر سیستم های مختلف را داریم

هماهنگی بین Agency ها
می تواند توسط ارتباطات Data Communication

یک تابع مهم طراحی DataFlow است

TMDD : traffic management data dictionary
صفحه ۶/۵۳ اسلاید
توابع سیستم معمولی :

سه ستون داریم

۱- نوع سیستم
۲- سیستم های بالقوه
۳- امکانات مختلف

 

Typical System Functions

Typical System Functions

چرا ما به سیستم های کنترل ترافیک نیاز داریم ؟

………….
سازگاری با شرایط
پیاده سازی ( implementation )
راحتی اجرا
—————————-
Traffic Control Systems Objective

سیستم های شناسایی ترافیک
به دنبال ۴ موضوع هستیم :
۱- شناسایی کننده های ترافیکی چه هستند
۲- اهمیت شناسایی کننده ترافیکی
۳- انواع شناسایی کننده ترافیکی
۴- مثال شناسایی کننده ترافیکی
انواع شناسایی کننده های ترافیک
– inductive loops – Video – Microwave – Infrared – Acostic – Radar – Magnetic – Radio Frequency – Global Poritioning System ( GPS )

Share of Detector Types at new ATMS Sites
میزان استفاده از شناسایی کنندگان
loop های القایی بیشتر از همه استفاده می شود

تمرین : تحقیق درباره AVI – VIP Detector (video Image Processor )

 

 

Oct 152013
 

خلاصه جلسه ششم درس حمل و نقل هوشمند ۹۲/۰۷/۲۳
در هر مساله کنترلی یک پارامتری داریم مثل ساو
هر تغییری که در ساو اتفاق بفتد در سفر های مردم تغییر حاصل می شود.

ستاره هم به معنی تعادل است
مثلا چراغ راهنمایی را زمانش را تغییر میدهیم ، مثلا ترافیک بیشتری ایجاد می شود تا جایی که در خیابان های اطراف هم تاثیر می گذارد

Ca هزینه است که یک نفرپرداخت می کند
Qa تعداد افراد هستند

نقطه تعادل محل تقاطع دو منحنی است
تقاضا و عملکرد
برای بیان تعادل اصل اول و دوم wardrop را مطرح می کنیم
در اصل دوم wardrop هوش راننده ها هم دخیل هست
برای پیاده سازی الگوی تعادل کاربر تصادفی
….
تعریف مجدد زمان پیمایش

برای پیاده سازی مساله
یک احتمال انتخاب مسیر p در زمان t داریم

مدل های انتخاب
Probit (شرط نرمال بودن خطا)
Logit (تحلیلی )

——————————-
Logit model
فرم تحلیلی دارد
وابسته بودن مسیر ها به هم انکار می شود و به همگرایی می رسد
توزیع خطا از نوع گامبل در نظر گرفته می شود
تابع احتمال انتخاب مسیر در این مدل از رابطه زیر به دست می آید

its-logit-formula

یک مساله Convex هست مثل مساله سهمی که حتما یک جواب بهینه دارد

میزان جریان مسیر =میزان تقاضای سفر * تابع انتخاب logit

its-logit

آقای دمبرگ Damberg از این فرمول استفاده کرد

برای هر مبدا مقصد یک مجموعه مسیر در نظر گرفته و یک جریان شدنی اولیه روی مسیرها بیابید.

در هر تکرار جریان به دست آمده از فرمول انتخاب لاجیت به دست آورده جریان فعلی را با آن مقایسه و به کمک آن جریان فعلی را به هنگام نمایید.

بر اساس جریانهای به دست آمده، هزینه پیمایش مسیرها را به هنگام و دوباره مسیریابی نمایید و به مجموعه مسیرها افزوده واین عملیات را تا حصول همگرایی تکرار کنید.

 

مساله شمارش مسیر ها و ایده های حل
۱- برچسب های مختلف بر اساس سلیقه ها (زیبایی ، خلوت بودن ، کوتاه ترین ، ارزان ترین )
۲- تولید ستون
۳- k مین مسیر کوتاه
۴- ابتکار بر اساس حذف یالها
۵- ابتکار برای وضع قوانین جریمه یالها
۶- مسیر های حداکثر k مشابه
۷- مسیر های نا متشابه
۸- مسیر های تصادفی
۹- مسیر های نامغلوب فازی

 

ایده جریمه : 

۱٫ واحدهای جریمه، (یال یا گره یا هر دو)
۲٫ ساختار جریمه،(جمعی یا ضربی)
۳٫ بزرگی جریمه
۴٫ مسیر جریمه (مسیر فعلی یا کل مسیرها تا حال)
ویژگی‌های ایده جریمه
سادگی ایده
فاقد عمومیت برای همه مثالها
فاقد راهی برای ارزشیابی میزان شایستگی مسیرهای انتخاب شده
انتخاب مسیرها وابسته به نحوه انتخاب پارامترهای فوق
در به کارگیری روش جریمه ضربی ریسک ناپایداری عددی
نیاز به وجود یک ترتیب برای ورود جریانهای مختلف شبکه، که در بحث جریمه شدن جریانی خاص دخیل است.
ایده مسیرهای نامتشابه
یک اندازه تنافر بین مسیرهای موجود در یک مجموعه داده‌شده، بیشینه می‌شود. از این جهت این ایده یکی از کاراترین روشهای انتقال مواد استراتژیک و خطرناک می‌باشد.
ایده‌های ساخت مسیرهای نامتشابه (متنافر)
۱ – ایده جریمه‌های متوالی
۲ – ایده کوتاه‌ترین مسیر دروازه‌ای
۳ – ایده کمینه گرفتن روی بیشینه‌ شباهتها
۴ – ایده p-پخش ( بیشینه گرفتن روی حداقل تنافر)
مطابقت دوطرفه برای مساله تنظیم
نرم افزار TRANSYT برای محاسبه مقدار کارایی سیستم به ازای متغیرهای کنترلی چراغ راهنما و نرم‌افزار PFE برای تعیین مقدار جریان تعادلی.
تنظیم چراغ راهنما با آلگوریتم ژنتیک دودویی کد
نکاتی که در پیاده‌سازی آلگوریتم ژنتیک بایستی به آنها توجه شود:
•نحوه نمایش ژنتیکی جوابهای مساله
•راهی برای ساختن جمعیت اولیه جوابها
•تابع ارزشیابی که میزان شایستگی جوابها را نشان دهد.
•عملگرهای ژنتیکی که ترکیب ژنی فرزندان را صورت داده و جمعیت جدید تولید نماید.
• مقادیر پارامترهای ژنتیکی
its-genetic
گام ۱٫ پارامترهای مورد نیاز آلگوریتم ژنتیک تعیین و متغیرهای تصمیم  را به صورت دودویی بر اساس کران پایین و بالا و کد نمایید.
گام ۲٫ جمعیت تصادفی اولیه از متغیرهای چراغ راهنما تولید کنید.
گام ۳٫ مساله سطح پایین را به وسیله روشی از PFE  حل و جریانهای تعادل کاربر تصادفی برای هر یال شبکه محاسبه کنید.
گام ۴٫ زمانهای چراغ راهنمای مطرح شده در گام دو و جریانهای تعادلی یالهای شبکه محاسبه شده در گام سه را به نرم افزار TRANSYT داده، معیار کارایی سیستم را به وسیله آن محاسبه نمایید.
گام ۵٫  عملگر آمیزش و  عملگر جهش ژنتیکی را به کار برید.
گام ۶٫ جمعیت جدید را از روی جمعیت قبلی و فرزندان بسازید.
گام ۷٫ اگر تفاوت میان میانگین شایستگی جمعیت و شایستگی بهترین عضو جمعیت کمتر از ۵% باشد، جمعیت اولیه جدیدی ساخته و به قدم سه بازگردید. در غیر این صورت به سراغ قدم بعد بروید.
گام ۸٫ اگر  بیشترین تعداد مجاز جمعیت گیری حاصل شده باشد،  جواب با بالاترین شایستگی را جواب بهینه مساله گرفته و الا به سراغ قدم ۳ برگردید.

تمرین : با یکی از روش های ۱ و۴و ۷ فوق پیاده سازی کنید و تا هفته بعد ارسال کنید.

شبکه ای که آپلود شده در LMS استفاده کنید
شکل شبکه را در مقاله صفحه ۴۶۶ آمده روی هر کدام از یالها شماره گذاری شده در جدول صفحه ۴۶۷ تقاضای سفر ها آمده یک فرمول هم آمده جریان تقسیم بر سفر
در صفحه ۴۶۸ – پارامتر های لازم آمده

برای حل این مساله ۲ هفته فرصت هست
کدی پیاده سازی کنید با روش دمبرگ با همین ۳ تا ایده دمبرگ اسلاید شما ره ۹ ، یاد آوری با استفاده از ساو Q را پیدا میکنیم
۲ سطحی هست
در یک سطح با استفاده از Saw مقدار Q را پیدا کنیم
با استفاده از مقدار های Q مقدار Saw را آپدیت کنم
در این مسایل از نرم افزار های تخصصی برای هر بخش استفاده کنیم
نرم افزار Transyt برای چراغ راهنما
از نرم افزار PFE برای تعیین مقدار جریان تعادلی

استفاده از الگوریتم ژنتیک برای محاسبه پارامتر کنترلی

نحوه ساخت تابع ارزشیابی هم با این روش مشخص می شود

 

شنبه ۲۷/۷/۹۲ جلسه دفاع پایان نامه با نرم افزار TURBO توسط خانم روشنی برگزار می شود
و همچنین سه شنبه هفته آینده در جلسه تکمیل تر تکرار خواهد شد

Oct 142013
 

خلاصه جلسه پنجم درس خوشه بندی – دکتر زارع ۹۲/۰۷/۲۲

بحث کلاسترینگ و Mixture Model

N تا آبجکت داریم که می خواهیم به K تا گروه خوشه بندی کنیم

مدل آمیخته(Mixture Model ) ترکیبی از توزیع های احتمالاتی است

چون هر خوشه با خوشه دیگر تفاوت دارد می توانیم این فرض را بگیریم که هر خوشه خودش دارای یک توزیع احتمال است و مجموع کل داده ها یک توزیع احتمالاتی دارد که ترکیبی از تک تک چگالی های داخل هر خوشه است

 

 

کاربرد مدل آمیخته در خوشه بندی :
در روشهای سلسله مراتبی و k-means نداشتیم نمی دانستیم که الگوریتم تا کجا باید پیش برود و تعداد K چند تا باشد جواب بهینه بدست می آید و بیشتر به خروجی نگاه می کردیم
ولی در Mixture Model می توانیم برای انتخاب بهترین مدل، معیار داشته باشیم

مثل BIC و AIC
Akaeki Information Cretaria
Baysian Information Cretaria

معمولا از تابع گوسی استفاده می کنیم

GMM – Gaussian Mixture Model

آقای Andrew Moore
مولفه را با امگا i نشان داده ایم

برداری از ویژگیها داریم

clustering-gmm-formula

فرض می کنیم نوع تراکنش هر گونه باهم برابر است

توزیع یونیفرم
ابتدا یک عدد تصادفی بین صفر و یک ایجاد می کنیم

اگر عدد تصادفی ایجاد شده کمتر از ۰٫۳ بود امگا ۱ می گذاریم
اگر عدد تصادفی ایجاد شده کمتر از ۰٫۵ و بیشتر ۰٫۳ بود امگا ۲ می گذاریم

و بزرگتر از ۰٫۵ بود امگا ۳ می گوییم

ممکن است شکل خوشه ها شکل هم نباشد
همبستگی خطی
تا هفته بعد تمرین که حداکثر ۱ نمره دارد بفرستید
Mixture of Gaussian
متغیر پنهان

هر نقطه در آن واحد فقط می تواند به یک خوشه متعلق باشد

Oct 142013
 

خلاصه درس داده کاوی ۹۲/۰۷/۲۲ – دکتر محمد پور

صفحه ۱۸/۲۱
OLAP Operations : Data Cube
جدول ها را نرم افزار می کشد ، لازم نیست
اگر بعضی وقت ها داده ها دو بعدی باشد ، هیستوگرام را سه بعدی می کشیم

hist2D فراوانی داده ها را به صورت دو بعدی محاسبه میکند

OLAP را رسم کنید

 

خلاصه شده داده ها را نشان میدهد

با استفاده از خلاصه سازی رابطه بین متغیر ها را می توانیم مشخص کنیم
مثلا برای جدول ۷ بعدی ۲۴۰۰۰ مدل داریم
clustering یک روش unsupervised هست که هدفش قرار دادن داده های همگون در خوشه هست

اگر داده های یک بعدی باشد همان متر معمولی را در نظر می گیریم
ولی اگر داده ها بیش از یک بعد داشت ( p بعدی )

مولفه ها را با هم مقایسه می کنیم
نرم اقلیدسی
با یک تبدیل می توانیم بردار را به ماتریس تبدیل کنیم

در روش سلسله مراتبی ما اطلاع نداریم که چند تا خوشه داریم

با روش جمع شونده
هر یک از داده ها را یک خوشه می گیریم
و در هر مرحله یک خوشه کم می شود
برای همین محاسبات خیلی سنگین می شود

datamining-oghlidosi-meter

 

فاصله یک نقطه از مجموعه : چند روش مختلف داریم

۱-   فاصله نقطه تا مینیمم مجموعه Single Linkage ( Nearest Neighbor )
مثال جرم و جنایت در شهر های آمریکا

رسم دندوگرام
۲-  روش Complete Linkage
در مرحله بعدی جدولی که بدست می آوریم مشابه جدول روش اول است
۳-  Average Linkage

میانگین فاصله
۴- روش Centroid

چون روش agerage محاسبات سنگینی دارد در Centroid  به جای فاصه میانگین ها ، از میانگین فاصله ها استفاده می کنیم

۵- روش median میانگین وزنی است

۶- روش ward

datamining-Ward-Method

تمرین : برای هفته آینده

datamining-tamrin-usa-crime

جدول جرم و جنایت در آمریکا
با سه روش
single linkage
Complete Linkage
Average Linkage
به ایمیل بفرستید

statdatamining@gmail.com

 

Oct 132013
 

۹۲/۰۷/۲۱ تدریس یار داده کاوی

ما می خواهیم که ۴ سری دیتا به عنوان تمرین وارد کنید و ارسال کنید

فایل cars
در sample های spss معمولی اگر باز کرده باشید می توانید باز کنید و استفاده کنید در folder sample هست
بعد از اینکه node statistic را لود کردیم

spss-cars

در ستون value متغیر ها لود می شود
ممکن است در متغیر ها بی پاسخی داشته باشیم

مثلا در متغیر MPG اطلاعاتش نباشد

وقتی روی missing کلیک می کنیم می توانیم آنرا خاموش یا روشن کنیم
یعنی بی پاسخی را برای آن تعریف کنیم

در سیستم این امکان وجود دارد که با بی پاسخی هر جا اطلاعات داشته باشد استفاده کند و رهر جایی که missing باشد آنرا رها میکند

برای کنترل داده های معتبر می توانیم در missing specify را انتخاب کرده و در ستون check محدوده اعداد و یا شرطی را انتخاب کنیم و جایگذاری کنیم
نحوه برخورد با بی پاسخی را تنظیم می کنیم
گزینه Coerce : وقتی به محدوده بی پاسخی میرسد , متغیر کمی است میانگین داده ها در نظر می گیرید

اگر داده ها به صورت عددی باشد و مثلا ۰ را به عنوان بی پاسخ داده باشیم نزدیکترین عدد را جایگذاری می کند
اگر در Type Set بگذاریم در داده ها عدد هم باشد ، اعداد با کوچکترین عددی که سیستم می شناسد جایگذاری می کند.

در مورد جنسیت True / False بی پاسخ باشد به صورت کد کوچکترین را قرار می دهد ( false خواهد بود )
داده ها می تواند بدون نقش باشد ( مثل شماره دانشجویی ) محاسباتی نیست

برای اینکه بدانیم که داده ها به طور صحیح وارد شده Table آنرا ایجاد میکنیم

روی مبدا کلیک , F2 و سپس روی مقصد کلیک می کنیم



سیستم که می خواهد مدلی را Run کند

در قسمت expert هم نوع خروجی که سیستم میدهد مشخص می شود

اگر expert را انتخاب کنیم شرط توقف را هم در داده ها خواهیم داشت

نمودار siloet
هر چه مقدارش به ۱ نزدیک تر باشد نشان دهنده مناسب بودن خوشه هاست

 

 

Oct 132013
 

مدیرت تقاضای سفر TDM

دانلود جزوه TDM مدیریت تقاضای سفر

 

http://rpc.tehran.ir/default.aspx?tabid=306&ArticleId=8023

http://kaarmand.blogfa.com/post-388.aspx

http://files.spac.ir/%D9%87%D9%81%D8%AA%D9%87%20%D9%86%D8%A7%D9%85%D9%87%20%D8%A8%D8%B1%D9%86%D8%A7%D9%85%D9%87/Barnameh%20Electronical/464/%D8%B5%D9%81%D8%AD%D9%87%20%203.htm

 

Oct 122013
 

۹۲/۰۷/۲۰
این جلسه باقی K-means را می گوییم و در جلسه بعدی درس بعدی GMM هست

در تمرین ها
توضیح معیار را از مقاله کپی نکنید ( به صورت انگلیسی )
برداشت خودتان را به فارسی بنویسید

در LMS بفرستید
و اگر نتونسید به ایمیل clustering_1391@yahoo.com
تا روز جمعه بفرستید
محدودیت اصلی روش k-means مبنایی
چنانچه مقادیر اولیه بردار های میانگین خوشه درست و مناسب انتخاب نشود.
ممکن است J در مینیمم محلی متوقف شود.

۳ روش برای مقدار دهی اولیه الگوریتم خوشه بندی K میانگین
۱- تصادفی
۲- تقسیم باینری
۳- آماده سازی حساس به هیستوگرام

روش آماده سازی رندوم : Random Selection
در این روش الگوریتم خوشه بندی k میانگین چندین بار با مراکز اولیه رندوم اجرا شده ، مراکزی که اولین مقدار تابع هدف اعوجاج به عنوان مراکز اولیه الگوریتم خوشه بندی در نظر گرفته می شوند.

روش تقسیم باینری :Binary Splitting
۱- از کل بردار ها یک مقدار متوسط و یک مقدار انحراف استاندارد می گیرد
۲- از مقدار متوسط یک ضریبی از انحراف استاندارد مقدار با کم و به اندازه همان زیاد می کند
۳- هر خوشه را بر اساس متوسط و انحراف استاندارد به دو گروه دیگر تقسیم می کند
درنهایت به k مرکز میرسیم
مثلا به ۷ تا خوشه که رسیدیم خوشه ها را ۸ تا در نظر میگیریم

این روش نسبت به روش رندوم سریعتر و موفق تر هست

روش حساس به هیستوگرام Histogram Sensitive
این روش یک هیستوگرام را بدست می آورد( نمودار فراوانی داده ها ) Hist در متلب را تست کنید.

Ta-clustering-K-means-HSI

مجموعه اول خالی هست
روش کار در اسلاید
اولی بردار از مجموعه یادگیری را در مجموعه رفرنس قرار می دهیم
یک شاخص فراوانی داریم که به هر خوشه یک بردار نسبت میدهد
اگر فاصله از یک آستانه کمتر بود بردار دوم را بیرون می اندازیم و تعداد فراوانی که در آستانه بود را ۲ می کنیم

نمونه سوم را فاصله اش را با این یک نمونه پیدا می کنیم
نمونه سوم را حذف نمی کنیم بلکه به عنوان نمونه جدید در X_ref می گذاریم

مقایسه می کنیم ، با هر کدام که کمترین بود

پس سه روش K-means
RSI
BSI
HSI
هست

قلب الگوریتم خوشه بندی تابع هدف آن است.

سوال : در توزیع نرمال اینکه بردار داریم در این صورت توزیع نرمال چطور محاسبه می شود؟ منظورم در قسمت ایکس منهای میو است

 

Oct 122013
 

۹۲/۰۷/۲۰
مهندسی سیستمهای تجارت الکترونیک

هزینه ابزار و تجهیزات

قبل از طراحی و مهندسی هر گونه سیستم تجارت الکترونیکی ، باید طرح کسب و کار مبنا برای ایجاد آن مشخص باشد.
۱- شناخت کسب و کار موجود
۲- طراحی کسب و کار جدید
در طرح های کسب و کار الکترونیکی ، کالا و خدمات الکترونیکی مبنای کسب و کار قرار می گیرد.
– خرید و فروش شارژ موبایل
– خدمات میزبانی وب
– خدمات دسترسی به اینترنت
– خدمات آوای انتظار موبایل
– فروش فال الکترونیکی
مدل های کسب و کار :

نحوه کسب درآمد
تفاوت Business Plan با Business Case
توسط مدیران استفاده می شود که در آن شما نحوه تامین بودجه و اعتبار برای سرمایه گذاری خاصی را عنوان می کند

همه مدلهای کسب کار باید در آنها نحوه کسب درآمد مشخص باشد

توصیف اینکه سازمان کسب در آمد
Transaction fees
Subscription fees
Advertisement fees
Affiliate fees
Sales
و ترکیبی از این ۵ روش را ممکن است بکار ببریم

کسب در آمد بر اساس برگزاری مناقصات و مزایدات
بدست آوردن قیمت بهتر

بازار یابی ویروسی( سینه یه سینه )
تشکیل خرید گروهی
برگزاری حراجی آنلاین
اختصاصی سازی کالا و خدمات
خدمات بازار ها
صفحه ۲۲ / ۳۳ اسلاید : مدل های کسب در آمد را به صورت گرافیکی می بینیم

920720-ECSE-exhibit1-3

در مدل Affiliate نه تنها تبلیغ را انجام میدهم و همچنین راهنمایی و اشتراک و لینک به سایت هدف هم انجام می دهیم

محدودیت های EC

در برخی از مسایل فنی محدودیت هایی وجود دارد
استاندارد ها
محدودیت های نرم افزاری
یکپارچه سازی ( بخصوص نرم افزار های که از قبل وجود دارد )

Market Place ها

۳ تابع اصلی در بازار ها
۱- تطبیق بین خریدار و فروشنده
۲- تسهیل تبادل اطلاعات
۳- زیر ساخت حقوقی

اجزای فضای بازار
– مشتری ها :
– افراد وب گرد به دنبال موارد زیر می گردند
– چانه زنی
– کالای دلخواه
– جمع آوری کنندگان کالاها

– فروشندگان
تعداد زیادی از فروشندگان که روی وب عرضه می شوند

– صفحات ظاهری سایت
– فعالیت های پشت صحنه
– جمع آوری سفارشات
– مدیریت انبار
– پردازش پرداخت ها
– بسته بندی و ارسال

– واسطه ها
– سایر شرکای تجاری
– خدمات پشتیبانی
( گواهینامه صلاحیت و اعتماد – مکانیزم دانش)

 

چند سطح مختلف می توانیم تعریف کنیم
۱- سطح افراد
۲- سطح فروشگاه (بین فروشگاه و مشتریان حقیقی و حقوقی)
۳- سطح بازار (بین فروشگاه ها و مشتریان)
۴- سطح تبادلات (بین بازار ها)

 

معماری سیستم های تجارت الکترونیکی

Oct 082013
 

دستور العمل های خبرگی
در دهه ۹۰ الگوریتم های خوبی داریم که برای بهینه سازی چراغ های راهنمایی کار شده

یکسری افراد توسعه نرم افزار بسیار بزرگ را کار کرده اند

با استفاده از الگوریتم ژنتیک برای نصب در تقاطع ها کار شده
کاری که سیلان و بل هم در سال ۲۰۰۲ , ۲۰۰۴ , ۲۰۰۵ روی آن کار کرده اند

برخی هم حل مسایل دو سطحی را کار کرده اند
در یک دسته درباره یکسری مفاهیم و در دسته دیگه مفاهیم دیگری را بررسی می کنند

۳ تا نرم افزار معرفی می گردد :

MaxBand ( کنترل Pretime )نسبت پهنای باند به مدت زمان چراغ سبز ماکزیمم
۳- Transyt3- تعداد ایست و مقدار تاخیر مینیمم
۴- Scoot بهترین نرم افزار برای تنظیم چراغ راهنما ها ( طول سیکل ، زمانبندی ، بهینه سازی آفست )

الان در توسعه نرم افزار ها یک سطح جدیدی از نرم افزار ها هست مثل Scats
که عملیات بهینه سازی انجام نمی شود و بر اساس پلن های از پیش تعیین شده کار انجام می دهد

 

 

یکی از Simulator های خوب Aimsun و نسخه آنلاین آن Online Aimsum
و زمانهای ششبه بهینه را می تواند پیدا کند.
استفاده از ابزار شبیه سازی که باعث بهینه سازی نرم افزار ها شده

چه زمانبندی چراغ راهنمایی را زمانبندی مناسبی می دانید ؟
تابع کارایی
در مصاحبه با ذینفعان باید دید که چه چیزی را می خواهند کاهش با افزایش دهند

می خواهیم زمان انتظار کم باشد

تناسب کاربران هم مهم است ( منطقه فرهنگیان یا منطقه کارگران )
هر ایست و هر ترمز موجب افزایش مصرف سوخت می شود

در یکی از مقالات …
علاوه بر اینکه سیستم تلاش می کند کمترین ایست را داشته باشد

ایده های ساخت تابع کارایی
۱- محاسبه میزان انتظار در شبکه
۲- به دست آوردن ترکیبی خطی از میزان انتظار در یالهای شبکه
۳- حداقل زمان کل مسافرتها روی شبکه
۴- حداقل کردن تعداد کاربر در صف در مدت زمان انتظار

its-formula-optimization
فرمول :صفحه ۹
یک مساله کنترلی به این صورت قابل پیاده سازی هست که میخواهیم تابع کنترلی مثل ساو پیدا کنیم
جریانی که با توجه به پارامتر ساو به تعادل برسد.
معنای تعادل در سیستم ترفیک شهری
اصل اول وارداپ:
User EQuilibrium
تعادل کاربر :برای هر جفت مبدا – مقصد و برای هر نمونه زمانی مدت زمان پیمایش بین دو نقطه حرکت میکنند و مساوی و کمترین است.

تا زمانی که مسیر همیشگی خودشان را تغییر ندهند
تا زمانی که یک پل یا تونل جدی زده می شود
کاربران مسیر های همیشگی خود را تغییر می دهند تا بعد از یک مدت دوباره به تعادل برسند.
فرض فوق مقبول نیست ، چون :
۱- اجزای تصادفی در درک مسافران

اصل دوم واردراپ
Stochastic User Equilibrium
تعادل کاربر تصادفی:

 


برای پیاده سازی الگوی تعادل کاربر تصادفی

its-formula-wardrop

تعریف مجدد زمان پیمایش
مدل های انتخاب :
۱- Probit ( همه به صورت نرمال خطا می کنند )
۲- Logit( فرم تحلیلی دارد – وابسته بودن مسیرها به هم انکار می شود – توزیع خطا از نوع گامبل است – تابع احتمال انتخاب مسیر :

its-formula-gamble-logit
احتمال انتخاب مسیر S مساوی e  بتوان منفی تتا ( که عدد ثابتی است برای میزان حساسیت انتخاب مسیر) در جمع زمان سفر یک مسیر     تقسیم بر  e بتوان منفی تتا بقیه مسیر ها
برای بقیه مسیر هایی که از r به s انتخاب می شود

تتا یک عدد ثابت است که میزان حساسیت ما را نسبت به پارامتر های زمان سفر را نشان میدهد.

هر چه تتا کوچکتر باشد ، با احتمال بزرگتری مسیر انتخاب می شود

Oct 072013
 

خلاصه جلسه خوشه بندی دکتر زارع
max یا Complete linkage
Group Average
تقسیم بر تعداد کل اعضا

محدودیت : اگر یک سری ساختار ها ی global
داشته باشیم ، نسبت به آنها اریب خواهد داشت

هزینه محاسباتی : O^3
دیگه نمیشه تصمیم را بر گرداند

در روش Hierarchical اول هر نقطه را یک خوشه
می گرفتیم و بعد merge می کردیم

ولی در روش divisive برعکس
ابتدا یک کلاستر داریم و در مرحله بعدی میشکنیم

در عمل از الگوریتم Divisive خیلی استفاده نمی
شود.

یک مثال در hirearchical هست :
یک ماتریس آمده در قدم اول
در امتحان شبیه این ماتریس میدهیم که شما در
ابتدا تشخیص دهید که ماتریس Distance هست یا
….

در امتحان میان ترم این نمونه سوال میاد
قدم اول Merge A,B
قدم دوم Update Min یا sinlge Linkage
قدم بعدی تکرار update Min
که نتیجه {{A,B},{C}
{{A,B},{C}},D}
دندروگرام هم میشه کشید.
برنامش هم میتونید بنویسید.

صفحه ۳ / ۱۷
صفحه ۵ / ۱۷

Single Linkage
Average Linkage
Warde Linkage

هر distance شما در یک خوشه باید قرار گیرد

الگوریتم خوشه بندی افرازی تفاوتش این است
Algorithm K-means
۱- decide on a value for k
۲- initialize the k cluster centers ( randomly , if
necessary )
۳- decide the class member ships of the N
objects by assigning them to the nearest
cluster center.
۴- Re-estimate the k Cluster centers, by
۵-

نقاط قوت :
k-means
قدرت محاسباتی خوبی دارد

نقاط ضعف :
داده های گسسته خیلی کارایی ندارد

بایدتعداد خوشه ها را باید ار قبل تعیین کنیم
نویز دیتا
برای کلاستر های مقعر مناسب نیست

ایمیل استاد
h . zare @ ut . ac . ir
hadizare @ gmail . com

 

Oct 052013
 

خلاصه مطالب تدریس یار ITS
۹۲/۰۷/۱۳

عنوان پروژه اعلام شود

مطابق نمونه در ۴ محور اصلی ارائه شود

محور ۱ : مدلها و تکنولوژی هایی که در ITS هست به صورت Large Scale

محور ۲ : معماری

قرار ما در پروژه دوم پیاده سازی یک زیر سیستم : تحقیق روی آن زیر سیستم
حتما نمونه پیاده سازی شده آن را بیاورید .

ارائه شفاهی بصورت Powerpoint باشد

شرط ارائه حضوری قراردادن مستندات تا روز دوشنبه روی سایت هست

فایل های زیر برای مطالعه روی پورتال قرار گرفته اند:

۱- review paper
۲- Architecture
۳- Optimal Investment Scheduling
۴- Perspectives on Future Transportation Research
—————————————-
مبحث درس :

مدیریت TDM
از دیدگاه شهری مدیریت Demand :
هر استرازتژی که برای تغییر رفتار های ترافیکی به کار می رود
وسایط نقلیه با ظرفیت پایین را کم کنیم و حمل و نقل عمومی را افزایش دهیم

از منابع موجود بیشترین استفاده بهینه را انجام بدهیم

ایجاد حمل و نقل پایدار ، ایجاد انگیزه ، اطلاعات حمل و نقلی real time

تمایل افراد را از حمل و نقل شخصی برداریم و به حمل و نقل عمومی برسانیم

مثال TDM :
پلان های مدارس و دانشگاه ها
Spesial Events
Tourism Destinations
اطلاع رسانی به موقع
————————–
Integration with infrasctructure
ارتباط TDM با بزرگراه ها
انتخاب زمان یا مسیر به افراد
ارتباط TDM با اولویت دادن به وسایط نقلیه با حجم بالا
در TDM به وسایل نقلیه کاری نداریم ، فقط برای راننده ها که آنها ترغیب به استفاده از مسایل حمل و نقل عمومی استفاده شود

اضافه کردن زیر ساخت جدید نمی خواهیم

 

با کلیک روی آگهی زیر مبلغ 400 ریال به حساب من واریز می گردد

با کلیک روی آگهی زیر مبلغ 1000 ریال به حساب من واریز می گردد