نادی

برنامه نویس و تحلیل گر داده علاقه مند به موتور های جستجوی مفهومی

Nov 162013
 

تمرین مهلت : ۴ آذر
GMM
پیاده سازی k-means
جواب خروجی های k-means بردار وزن ، کواریانس ، را به GMM می دهیم

 

روش PCA ( Pricipal Component Analysis)
یکی از روش های کاهش بعد هست

وقتی ابعد زیادی داریم باید از روش کاهش بعد استفاده کنیم
مثلا ۳ تا بعد را نسبت به هم رسم کنیم که حالت های خیلی زیادی می شود.

یا اینکه به صورت رندوم چند مولفه را حذف کنیم !!!

یا اینکه مولفه هایی را نگه داریم که بیشترین تاثیر گذاری را دارد

پس PCA روشی است که کاربرد های ( کاهش بعد ، فشرده سازی ، استخراج ویژگی ،تصویر سازی ) دارد

دو تعریف رایج برای PCA که الگوریتم یکسانی دارد :

تعریف ۱ : داده ها را در یک زیر فضا تصویر کنیم به طوری که هدفی آن واریانس داده های تصویر شده بیشینه باشد

تعریف ۲ : تصویر خطی که فاصله تصویر میانگین فاصله های مجذور شده بین نقاط داده های و تصویرهایشان ، کمینه شود.

Clustering-pca
داده های اصلی داده های قرمز رنگ هستند
از این داده های قرمز رنگ تصویری رسم می کنیم که نقاط سبز بدست می آید

با تعریف اول : نقاط سبز از هم بیشترین فاصله را داشته باشند
با تعریف دوم : مجموع خط های آبی رنگ کمترین باشد

Clustering-pca-formula-maximum-variance

فرمولاسیون ماکزیمم واریانس :

این فرمولاسیون مطابق با تعریف اول است .
مثلا ما ۱۰۰ تا داده ۴ بعدی داریم
N=100
D=4
می خواهیم واریانس تصویر داده ها حداکثر شود
در ابتدا فرض می کنیم که داده ها را در یک بعد بهینه می خواهیم تصویر کنیم

اندازه بردار اهمیتی ندارد ، جهت بردار مهم است
پس قیدی می گذاریم : Norm بردار u1 باید ۱ شود
یا اول از کل داد ه ها میانگین بگیریم بعد تصویر کنیم
میانگین داده ها ی تصویر شده را بدست آوردیم

S ماتریس کواریانس
u هم بردار
حتما این اسلاید ها را مطالعه کنید

Nov 122013
 

خلاصه مباحث درس حمل و نقل هوشمند – دکتر قطعی – ۹۲/۰۸/۲۱

Green Intelligent Transportation System

its-green
برای حمل و نقل بیشترین سرمایه گذاری در انرژی سبز را داشته باشند

سه ضلع :
۱- Next Generation Electric Vehicles
۲- Enabling Electric Highwayes ( شبکه الکتریکی – شارژ در وسیله – ایستگاه های تعویض باتری )
۳- Intelligenr Vehicles and Highways (ارتباطات خودرویی – )

Mutli discipiliary Design Optimization : بهینه سازی طراحی چند تخصصی
علاوه بر وظایف خودرو برای جاده هم باید وظایفی تعریف شود.

در سیستم های مرتبط با پیل های خورشیدی امکان شارژ در وسیله نقلیه موجود هست

Car sharing :

مشکل :
در مدلهای ترافیکی شبیه ساز ترافیکی به راحتی نمی توان سیستم های کنترلی درون خودرویی را شبیه سازی کرد

در حوزه شبیه سازی نرم افزارهایی تولید کنیم که رفتار های مختلف درون خودرویی را هم شبیه سازی کند.

 

—————————–

پروژه بزرگراه همت
سوال تحقیق : تعداد سرنشینان خودرو
سه فرضیه مطرح شد ، که اگر یک خط ویژه به حمل و نقل عمومی اختصاص پیدا کند سهم آن به ازای تمایل مسافران به استفاده از حمل و نقل عمومی چند درصد است

its-hemmat-research

درصد کاهش co2
درصد کاهش نیترات ها
درصد کاهش فسفات ها

مشابه اینکه به یک آدم چاق برای حل مشکل چاقی ، پوشیدن لباس بزرگتر راه حل نیست
یعنی در شهر های پر ازدهام همواره ایجاد بزرگراه ها راه حل اصلی نیست

طراحی باید چند تخصصی باشد ( حوزه صنعت ،حوزه اجتماعی …)

مدیریت تقاضا
تعریف سیستمهای حمل و نقل عمومی محله محور ( با هدف سفر های درون منطقه ای )
ظراحی شبکه و تعریف استراتژیهای محله محور
سیستم های هدایت مسیر
سیستم های زمانبندی
سیستم های مدیریت پویای ناوگان

تعریف شبکه های حمل و نقل عمومی انبوه در CBD شهر ها و تعریف مکانیزم های عوارض گذاری ورود به طرح ترافیک

لایه دوم سفر های بین مناطق

نقش APTS : هماهنگی بین این سه بخش
۱- مسیر یابی ( طراحی سفر با استفاده از نرم افزار های مسیر یابی )
۲- زمانبندی ( کمک به زمان رسیدن سه لایه – تبادل سفر – سرویس های به محله های مشترک
۳- مدیریت پویای ناوگان : جابجایی اساسی روی سرویس ها نداریم بلکه با توجه ب هنیاز های هر خط ( پویش و پایش ) به صورت آنلاین ببینیم
در تفکر GITS همه چیز باید برنامه ریزی باشد
اگر در یک ساعت نیازی به سرویس دهی وجود ندارد

سیستم کنترل طرح  با جریمه  و بدون جریمه ( HOT – HOV)

Office of Transportation and Air Quality
مرکز در ایالات متحده هست که در این زمینه کار میکند

تمرین :

یک سیستم که به نظر شما در حمل و نقل هوشمند سبز قرار دارد معرفی و توجیه و تفسیر نمایید

 

Nov 112013
 

Data matrix
N record
each record has p features

N is very large
p is very large
both of them
N no problem, p is very large
p no peoblem, N is very large

کاهش ویژگی Feature Reduction
فرض کنیم در فضای ۱۰ بعدی کار می کنیم می خواهیم بعد ها را کاهش دهیم

بر اساس مساله کار می کنند

supervised , unsupervised
minimum Information Loss

فاصله بین کلاس ها را هم بهتر است که بیشتر کنیم

x1 تا xn مشاهدات ما هستند
که فضای p بعدی ما هستند
G ماتریس تبدیل هست

داده های با حجم زیاد Hign Dimentional را باید حجمش را کم کنیم

دسته بندی

Feature Selection : اگر p تا بعد دارم فقط با فیوچر های موثر کار کنیم

Visualization
Data Compression
Noise Removal
—————-
Application of feature reduction
Face recognition
Handwrittien digit recognition
textmining
Image retrieval
Microarray Data Analysis
Protein classification

——————
Feature Reduction Algorithms :
Unsupervised :
-latent Semantinc Indexing ( LSI) : truncated SVD
– Independent Component Analysis (ICA)
PCA
CCA

Supervised :
LDA

Semi-supervised :
Research Topics
——————–
Linear
LSI
PCA
LDA
CCA : cononical Correclation
—————————–

PCA : principal Component Analysis

 

http://www.sas.com/data-visualization/overview.html

 

 

Nov 112013
 

خلاصه درس تجارت الکترونیک جلسه ۹۲/۰۸/۲۰ خانم مهندس قوامی پور

تمرین :
یک سری تمرین حین درس داریم
مثلا عمل تجاری را در پروژه با بایستی تعریف شود
هر تمرین در پورتال بایستی تحویل داده شود
پروژه :

یک پروژه تعریف می شود که یک سایت تجارت الکترونیکی پیاده سازی شود
در ۳ یا ۴ مرحله تحویل می شود

تحلیل نیازمندی ها و طراحی سیستم تجارت الکترونیک برای محدوده تجاری مشخص (اجباری )
– پیاده سازی سیستم تجارت الکترونیک سازمان با استفاده از ابزار های آماده ( اجباری)
– توسعه امکانات و قابلیت های ابزار های آماده برایایجاد سیستم های EC ( اختیاری )

پروژه دوم : پروژه تحقیقی – به صورت سمینار کلاسی که منجر به مقاله کنفرانسی یا ژورنال شود نمره اضافی دارد

پروژه ها تک نفره باید تحویل شوند
برای تحویل پروژه باید روی VPS باشد

(اگر کسی در پورتال ثبت نام نکرده باشد ایمیل کنید تا برایتان دسترسی باز شود)

http://home.morva.net/~ali_h/VAUT-CEIT-MS-ECSE/W-Books%20&%20Resources/

یک نگاهی به manual Magento بکنید ، ابزار ساده ای است
لینک آموزش magento :
http://takhtesefid.org/user/magentoecommerce#page=1;sort=time;order=-1

سمینار معمولا اواخر ترم تعریف می شود – یک powerpoint ترجیحا با صدا
تحلیل و طراحی اولیه را با نرم افزار ویزیو هم

تعریف :
قلم تجاری
اعمال تجاری

Nov 112013
 

 

Dear ….

Thank you for registering for “TRANSYT 15 – Demonstration of Features & Enhancements”.

Please send your questions, comments and feedback to:traffic@trl.co.uk

How To Join The Webinar

Fri, Nov 15, 2013 1:30 PM – 2:15 PM GMT

Add to Calendar

۱٫ Click the link to join the webinar at the specified time and date:

https://global.gotowebinar.com/join/9041814434045891073/744777553

Note: This link should not be shared with others; it is unique to you.

۲٫ Choose one of the following audio options:

TO USE YOUR COMPUTER’S AUDIO:
When the webinar begins, you will be connected to audio using your computer’s microphone and speakers (VoIP). A headset is recommended.

–OR–

TO USE YOUR TELEPHONE:
If you prefer to use your phone, you must select “Use Telephone” after joining the webinar and call in using the numbers below.
United Kingdom
Toll: +۴۴ ۲۰ ۷۱۵۱ ۱۸۷۵
Access Code: 724-553-679
Audio PIN: Shown after joining the webinar

Webinar ID: 105-776-275

View System Requirements

To Cancel this Registration

If you can’t attend this webinar, you may cancel your registration at any time.

Nov 112013
 

فرض کنید که ۷ تا Transaction داریم
یکی گوشت و مرغ و شیر میگیرد

برای محاسبه confidence

datamining-confidence

[image1]

Frequent itemset
Association Rules
برای محاسبه Confidence به دو صورت می توانید محاسبه کنید
۱- احتمال صورت به احتمال مخرج
۲-تعداد x بخش بر مجموع کل

 

datamining-confidence-example

[image2]
اگر شیر نتیجه میداد جوجه و لباس

الگوریتمهای زیادی برای پیدا کردن قواعد پیوند داریم

برای ۷ تا پیوند تعداد زیادی Rule رسیدیم
بنابراین برای hypermarket های بزرگ با این روش منطقی نیست
استراتژی محاسبه قواعد متفاوت است

خیلی از نتایج هم تکراری هست

الگوریتم های مختلفی که ارائه شده اند با اینکه متفاوت هستند ولی باید به نتایج یکسانی برسند ولی با هزینه های پیاده سازی متفاوت هستند
که در اینجا Apiriori Algorithm استفاده شده است

Apiriori Algorithm دو مرحله دارد
۱- تمام itmeset هایی که به کار رفته استفاده می کند
۲- از frequent temset استفاده می کند برای تولید قواعد

Frequent Itemset باید از minimum support بیشتر باشد
مثل خوشه بندی که یکجا دندوگرام را می بریم

ایده اصلی این الگوریتم از خاصیت Apiori استفاده می کند که هر زیر مجموعه Frequent itemset خودش یک frequent itemset هست

اگر یک مجموعه ABD – Frequent باشد بنابراین زیر مجموعه هاش هم حتما Frequent هستند

مثلا در ABD مجموعه AC چون زیر مجموعه اش نیست می تواند Frequent نباشند
بنابراین غیر Frequent ها را جدا می کند و کار ما را سریع می کند

Frequent Item set باید از مینیمم support ی که ما تعیین کردیم بیشتر باشد

اگر بتوانید یک مثال کتاب را حل کنید ( Rule ها را بنویسید )

 

 

 

 

Nov 092013
 

خلاصه درس حمل و نقل هوشمند – خانم مهندس نیک سیرت ۹۲/۰۸/۱۸

سامانه AITIS ( مدل تحلیلی – مدل شبیه ساز )

VISUM
نرم افزاری شبیه سازی است
در سطح ملی یا منطقه ای امکان شبیه سازی دارد
برای تحلیل Multi Modal هست
همه مد های حمل و نقل را می توانیم با هم در نظر بگیریم

مدل شبیه سازی میکروسکوپی
عمل و عکس العمل Particle های مختلف را می سنجیم
با پیاده سازی عمل و عکس العمل حمل و نقل را شبیه سازی می کنیم
یکی از کاربرد های مهم شبیه ساز این است که مدل هزینه / فایده داشته باشد

مدل پویا بودن : در مدل های شبیه ساز می توانند مل پویا داشته باشند
شبیه ساز مدل تصادف دارد
پیشنهاد مسیر به صورت real time

یک سری از فعالیت های مدل شبیه سازی میکرو :
car-following
Lane-changing
Gap-acceptance
Lane-Choice
Models of intersection controls

————————–
VISSIM
نرم افزار شبیه ساز میکرو بر اساس رفتار Particle ها هست
هم برای ترافیک شهری و حمل و نقل عمومی استفاده می شود.
زمان سفر – سرعت –
نمودار های تحلیلی خوبی ارائه می دهد

مثال های دوبعدی و ۳ بعدی در VISSIM

its-AITS-system its-visum

 

Nov 092013
 

۹۲/۰۸/۱۸
ادامه GMM

روش EM برای مخلوط های گوسی

ضرایب مولفه های گوسی
بردار میانگین
و ماتریس های کواریانس گوسی

قلب هر الگوریتم خوشه بندی cost function آن است
که به پارامتر های الگوریتم خوشه بندی می رسیم
به ما N تا بردار ویژگی میدهند یک GMM را باید به آن Fit کنیم

تشخیص تعداد خوشه ها
۱-خروجی روش k-means را به عنوان ورودی GMM ( که بردار هستند )

ضرایب مخلوط pk را چجوری می تونیم از k-means بدست بیاریم ؟
k-means یک الگوریتم هارد هست و هر نقطه را فقط به یک خوشه اختصاص می دهد
ماتریس کواریانس = بردار ویژگی منهای متوسط ضرب در ماتریس ترانهاده
وزن ها : تعداد اعضای هر خوشه تقسیم بر تعداد کل
——————–
ورودی و خروجی GMM چه چیز هایی هستند ؟
ورودی : N تا بردار ویژگی
خروجی : پارامتر های مخلوط گوسی

برای این داده ها مدلی را فیت می کنیم که داده ها را توصیف می کند

نکته : پارامتر های GMM را نمی توانیم در اول کار محاسبه کنیم ( فرم بسته ندارد )
پس یک سری فرمول غیر بسته ای که بدست آوردیم تابع درست نمایی را محاسبه می کنیم و مداوما تکرار می کنیم تا دیگر تغییر نکند

clustering-gmm-EM-kmeans

clustering-gmm-EM-kmeans2clustering-gmm-EM-kmeans3

clustering-gmm-EM-kmeans4
ماتریس قطری ایزوتوپریک
a) خوشه بندی بر اساس رندوم گرفته
b ) در مرحله دوم : مقدار احتمال پسین را پیدا کرده
c) قسمت maximation را انجام دادیم ( متوسط ها، وزن ها ، … )
d) دوباره احتمال پسین انتخاب کردیم
e) دوباره پارامتر های توزیع پسین را انتخاب کردیم ( در مرحله پنجم )
f) مرحله بیست که تابع درستنمایی تغییر نمی کند

 

clustering-gmm-EM-kmeans-example

Nov 052013
 

خلاصه درس حمل و نقل هوشمند – دکتر قطعی – ۹۲/۰۸/۱۴
its-920814Mutual Consistency

با استفاده از تقریب های ریاضی مشتق را ساده کرده
یک روشی را ارائه کرده مثل الگوریتم های مقدار بهینه ( گردایان نزولی Steepest Decent )این هم روند همگرایی به سمت نقطه بهینه دارند.

nonlinear programming
gradient approximation

Bilevel Programming – برنامه ریزی دوسطحی

its-920814-bilevelProgramming

در کنار این قید یک قیددیگر وجود دارد که یک مساله بهینه سازی جدید هست ( مینمم سازی f بین x و y)

مثلا x ها تعداد چراغ های راهنمایی هستند
و y ها متغیر های تخمین جریان هستند که توسط مساله دوم قابل پیگیری هست

شرایط KKT
یک مساله بهینه سازی می توانیم به صورت سیستم غیر خطی عنوان کنیم
یعنی برای پیدا کردن یک مساله بیهنه سازی یک دستگاه معادلات غیر خطی چند مجهوله حل کرد ، جوابهایی که صدق می کند یکی از آنها جواب بهینه باشد.
مقاله : یک روش تقریبی با استفاده از روشهای simplex
مقاله دیگر : برای حل مساله bilevel با استفاده از الگوریتم ژنتیک
مقاله دیگر : یک الگوریتم هوشمند ترکیبی

مساله bilevel programming روی سیستم غیر خطی کار می کنند

Simulation Optimization : برای بهینه سازی تابع خیلی وقت ها تابعی از مشتق استفاده نمی کنیم و بر اساس مقادیر خود تابع کار می کنیم.

گروه اول : تابع داشتیم ، نقطه پیدا می کردیم
گروه دوم : نقاط را داشتیم از روی آنها تابع پیدا می کردیم
گروه سومی گفتند اطلاعاتی را که از فرایند آماری پیدا کردیم این رابیاییم قالب تابع بدهیم

رگرسیون می تواند از روی مقادیر مختلف …

به این تابعی که بر اساس این روش بدست می آید متا مدل می گوییم

متا مدل : درباره یک فراند یکسری اطلاعات آماری جمع آوری کردیم فرایندی که تابع ساز باشد – ممکن است یک رگرسیون باشد یا شبکه عصبی باشد یا درون یاب باشد
الگوریتم های متا هیورستیک را روی متا مدل بکار بگیریم

چرا simulation Optimization ؟

فعالیت اول : ساخت سناریو های کنترلی
فعالیت دوم : قراردادن این فرابند کنترلی در نرم افزار های شبیه ساز
ستون دوم
فعالیت سوم :
مدلسازی مساله ATMS & ATIS

پارامتر های کنترلی را در مساله خودتان تغییر بدهید
ستون اول و دوم

جمع بندی نایی :
در ارتباط ATMS & ATIS سه تا تکنیک مطرح کردیم
نقاط قوت بر اساس چه دیدگاهی
نقاط ضعف برای چه شرایطی
فرصت برای چه سازمانی
محدودیت برای چه بخشی
تمرین : چه جنبه هایی از ATMS و ATIS برای شما مفید هست ؟

پیاده سازی نمی خواهیم ، فقط مدلسازی مفهومی می خواهیم
یک تحلیل SWOT تشکیل بدهید ( مثلا برای کنترل چراغ راهنما نقاط قوت برای هر یک از Entity ها چگونه است مثلا برای پلیس برای هم محله شما )

دو تا فایل درباره تحلیل SWOT قرار داده شده
از این دو تا مرجع استفاده کنید

تحویل : جلسه حضوری ۲۰ آذر

 

Nov 042013
 

خلاصه درس خوشه بندی ۹۲/۰۸/۱۳ دکتر زارع

ادامه بحث social Network

یک سری Object داریم که به هم متصل هستند

بزرگترین گراف همبند = Giant Component

Network crowd and marketing

kleinburg , jon

Community Structure یا Community detection
مفهومی هست به نام Clustering Coefficent ضریب خوشه بندی

Zacharay Karate Club
شبکه ای به عنوان Bench mark شناسایی جوامع پنهان هست
این شبکه دو بخش است
یک باشگاه – یک مربی و تعدادی هنر آموز
مربی به یک باشگاه دیگر می رود

Scientometric :به دنبال این است که شاخه مختلف علم چه ارتباطی می توان داشته باشد
و پیش بینی اینکه یک دانش جدید کجا بوجود می آید.
: information retreival

Determining Weights

Edge independent path

 

Nov 042013
 

برای تجزیه تحلیل سری های زمانی

مثلا فوریه ترانسفورم یک ایزومتری هست

موجک (wavelet) هم همینطور است
اگر بتوانیم …
Spectural Density را رسم کنیم پیک را که نگاه کنیم سیکل را به ما نشان می دهد
در نرم افزار itsm به راحتی تست می کنیم

Seasonal Index
سری زمانی

seasonal-Index

بر اساس این اطلاعات Cycle و Trend و Simlarity می توانیم در مورد Predection داده ها صحبت کنیم

در Time-Series Analysis با یک سری زمانی سر و کار داریم
ولی در داده کاوی با چندین سری زمانی سرو کار داریم یا با یک سری زمانی طولانی

داده ها را هم توزیع می کند و هم نرمال
برای تشخیص نا ایستایی ها
اگر می خواهید فشرده سازی هم انجام دهید wavelet Transform بهتراست

تبدیل فوریه : اگر بخواهیم برای متغیر تصادفی پیوسته انجام دهیم
تقریبی برای حالت پیوسته است

Enhanced Similarity Search Methods

در ITMS2000
در سری های زمانی اول داده ها را می خوانیم و سپس Time plot را رسم می کنیم

باید موارد نا ایستایی را حذف کنیم

واریانس به زمان وابسته هست

پس لاندا را صفر در نظر می گیریم
با این کار امدیم ناایستایی در واریانس را حذف کردیم
حالا سری که این سه مولفه را ازش حذف می کنیم
و سپس
سری باید بدون trend , seasonality , … , ….. باشد

 

datamining-DescreteFoureierTransform
datamining-DescreteFoureierTransform2

مدل زمانی ایستا
ARMA
ARAR
Auto regresive
میانگین متحرک

مدل برازش بدهیم Autofit را انتخاب می کنیم
با استفاده از روش AIC می توان بهترین مدل را انتخاب کرد
بهترین مدل ان است که AIC آن کمتر باشد

ARMA forecast
برای امتحان
کتاب Tan مرجع هست

Nov 032013
 

خلاصه درس تدریس یار خوشه بندی – مهندس حائری ۹۲/۰۸/۱۲
درخت تصمصم گیری
یک روشی هست که بر اساس قوانین .. ایجاد میشه

درخت تصمصم گیری تارگت شان متغیر های کمی هست
متغیر خروجی اگر کیفی باشد ، درخت رده بندی گفته می شود

می توانیم درخت های متعددی بکشیم
در C5 ممکن است چندین روش وجود داشته باشد ولی بهترینش را نشان می دهد ولی در درخت تصمیم همه درخت ها را نمایش می دهد

از معایبش اینکه اگر تعداد متغیر ها زیاد باشد در صفحه مونیتور نمی توان دید

درخت تصمیم کاربرد های زیادی دارد

برای اینکه الگوریتم C5 را فرا بخوانیم لازم بود type را بدانیم و آن چیز هایی که لازم نیست را حذف کنیم

ReadValue را می زدیم تا اطلاعات را بخواند

الگوریتم C5 ویژه متغیر های کیفی بود

این الگوریتم خیلی تحت تاثیر مشاهدات بی پاسخ قرار نمی گیرید

Target کیفی است ولی input هم می تواند کیفی باشد هم کمی

هر چقدر تعداد use Boosting ها مون کمتر باشد پیچیدگی کمتری خواهیم داشت

اگر از گزینه Expert استفاده می کردیم
گزینه Window Attributes قبل از اینکه C5 شروع بع کار کند متغیر هایی که در رشد درخت نقض سازنده ای نداشته باشد در مدل بندی استفاده نخواهد کرد

Costs :
use misclassification costs
اگر دیتایی بخواهد بد رده بندی شود جریمه ای در نظر گرفته شود یا خیر

در گزینه Analyze
Calculate predictor impotance : اهمیت هر کدام از متغیر های مسقل ورودی را برای ورود به ساخت درخت

 

 

Nov 022013
 

خلاصه درس تدریس یار حمل و نقل هوشمند – خانم مهندس نیک سیرت ۹۲/۰۸/۱۱
برنامه ریزی برای ارائه پرزنت ها گروه ها اماده باشند
متغیر های ترافیکی
دسته بندی کلی :
تقسیم بندی مدل ها بر اساس کلیات
از دیدگاه اجرایی : تحلیی و شبیه سازی

بر اساس معادلات ریاضی می توانیم مشخص کنیم
یک سری معادلات داریم که سیستم ترافیکی را مدل سازی می کنند.

در مدل تحلیلی به داده های زیادی احتیاج داریم
که بدست آوردن اطلاعات و ساخت مدل هزینه بر هست

مدل های شبیه ساز برای سیستم های وابسته به زمان خیلی خوب است
سطح مدل های را به ۳ سطح تقسیم بندی می کنیم :

مدلهای ماکرو
مدلهای مزو
مدلهای میکرو

فاکتور های اصلی در شبیه سازی ترافیک :
۱- تحقیقات پیشرفته در تئوری ترافیک
۲- استفاده از سخت افزار پیشرفته
۳- استفاده از نرم افزار پیشرفته
۴- توسعه در اطلاعات
۵-افزایش ترافیک و حمل و نقل اجتماعی
سیستم شبیه سازی را نباید کاملا شبیه سیستم واقعی تصور کنیم
در شبیه سازی برخی از پارامتر ها را نمی توانیم لحاظ کنیم ، مثل رفتار راننده ها

شبیه سازی بسیار ارزان تر از مدل تحلیلی است

در شبیه سازی می توانیم محل VMS را تغییر دهیم و نتایج را ببینیم

به مدل شبکه اضافه می کنید
رو روی vms اطلاعات جایگزین را می دهید

OD : مقدار جریان از هر مبدا به هر مقصد وجود دارد

یکی ار شبیه ساز های ماکرو Tansyt هست

مسیر های شریانی شهری و کنترل چراغهای ترافیک

تمرین این هفته : تحقیق در نرم افزار Tansyt

بقیه نرم افزار های شبیه ساز را هم در جلسه آینده بررسی می کنیم

 

 

Nov 022013
 

خلاصه درس تدریس یار خوشه بندی – مهندس برادران
پارامتر گاما z k
متغیر تصادفی است که نسبت داده می شود به خوشه k ام
احتمال پیشین : پیش از اینکه x وجود داشته باشد ، فقط احتمال پیشین می دهیم

تابع توزیع نرمال

مرکز یک توزیع نرمال محلی است که بیشترین چگالی داده وجود دارد

خوشه بندی با GMM
فرض کنیم یک GMM 3 مولفه ای را برای خوشه ها کافی است

استفاده از فقط liklihood – بردار x را اگر در هر گوسی بگذاریم و عدد بزرگتری را بدهد می گوییم مربوط به همان خوشه است

اگر پارامتر پسین هم داشته باشیم ، ممکن است در Prior هر خوشه هم ضرب کند.

اگر صورت کسر بیشتر بود تاثیری بر مخرج کسر ندارد

مخرج در خوشه بندی تاثیر ندارد

جمع prior ها در تابع GMM مساوی ۱ است

برای اینکه نرمال سازی انجام دهیم تقسیم می کنیم
چون احتمال پسین جمعش باید ۱ باشد

آیا جمع likelihood هم باید ۱ باشد ؟ خیر ، چون ممکن است داده های پرتی داشته باشیم که احتمال آن برای مرتبط شدن به هر خوشه ای بسیار کم باشد.
مهمترین رابطه GMM

[image1]

با فرض iid بودن داده ها (مستقل و یکسان )
کل داده ها را با X نمایش می دهیم
لگاریتم
log a + log b
ضرب لگاریتم که پشت خط هستند میشه جمع لگاریتم ها شون
اگر در GMM مشتق بگیریم به رابطه بسته نمی رسیم بنابراین EM ارائه شد

تابع likelihood
مشتق نسبت به میو کا ( متوسط یک خوشه مشتق می گیریم )
برای خوشه بندی یک تابع Cost تعریف می کنیم که در اینجا تابع likelihood است

Nk یک عدد اعشاری است

– ماکزیمم سازی بدون قید
– ماکزیمم سازی مقید

 

 

Nov 022013
 

مدل کلی فرآیند مهندسی و ایجاد سیستم های تجارت الکترونیکی

مراحل فرآیند مهندسی و ایجاد ECS

پیش فرض های متدولوژی مهندسی ECS

ecs-flowchart

[image 1]
نمودار فرآیند کلی مهندسی و ایجاد سیستم های تجارت الکترونیکی

فهرست مراحل فرآیند کلی مهندسی سیستم تجارت الکترونیکی

تعیین محدوده اعمال در کسب و کار تجاری

اعمال خریدار ( قبل از خرید – حین خرید – پس از خرید )

اعمال فروشنده ( قبیل از فروش – حین فروش – پس از فروش )

اعمال واسطه ( قبل از خرید و فروش – حین خرید و فروش – پس از خرید و فروش)
مولفه ها و ابعاد موثر در نحوه انجام فروش

نوع پیکره بندی قلم تجاری برای فروش ( طرح .


نوع تبادل ( نقد – اقساط / اعتباری )
محدوده جغرافیایی ( داخلی / خارجی )
نوع شخصیت خریدار ( حقیقی / حقوقی / دولتی )
نحوه تحویل ( تدریجی / فوری )
تعهدات فروشنده ( بیمه / حمل )
حجم خرید ( خرد / عمده / کلان )
نوع تبادل مالی
تعیین دامنه فعالیت ها در کسب و کار تجاری

ماتریس اقلام / عملیات کسب و کار تجاری
– عبارتست از ماتریسی که نمایش دهنده اعمال تجاری لازم بر روی اقلام تجاری می باشد
سطر ها : اقلام و عوامل تجاری
ستون ها : عمال تجاری
درایه ها : نقش تجاری انجام دهنده فعالیت

تعیین فهرست فعالیت ها و خدمات کسب و کار تجاری
– عنوان هر فعالیت : عمل تجاری + قلم یا عامل تجاری
نکته :
تفاوت وضعیت خریداران در هنگام اقدام خرید

انواع وضعیت در خریدار
( شناخت نوع نیاز / فروشنده / قیمت ها / شرایط )
انواع وضعیت در فروشنده
( شناخت نیاز مشتری / انطباق کالا و خدمات با نیاز های مشتری )

شناخت معماری کسب و کار موجود

هدف :
۱- شناخت کلیه نقش ها و عوامل اجرا کننده مراحل کسب و کار تجاری
۲- اجرای کسب و کار تجاری در بستر یک سازمان ( وابستگی عناوین نقش ها و عوامل اجرایی به معماری سازمان – وابستگی نیازمندی های هر نقش یا عامل اجرایی )
مروری در معماری ۷ لایه
[image 7 layer]


ecs-Architect

 

 

ecs-Architect2

 

 

جریان های کاری در سازمان های تجاری

 

ecs-workflow ecs-workflow2

Oct 292013
 

Damberg 1996

مرحله ۱ : زمان سفر در هر یال ثابت (زمان سفر تک تک خیابان های ممکن در مسیر بدون ترافیک ) در نظر می گیریم (بهترین حالت زمان سفر آزاد – کاملا بدون ترافیک – را در هر خیابان در نظر می گیریم ) تمام مجموعه مسیر های بین مبدا و مقصد را پیدا می کنیم
مرحله ۲ : تابع لاجیت را برای بدست آوردن بار ترافیکی روی هر مسیر استفاده می کنیم
و از روی فرمول … میزان جریان ترافیکی که از روی یک یال (خیابان) عبور می کند را نسبت به جریان های ترافیکی مسیر ها می توانیم بدست بیاوریم

ترکیبی از الگوریتم دایکتسرا و جریمه کردن

مثلا سه بار الگوریتم دایکسترا با در نظر گرفتن پارامتر های جریمه ای
حذف کردن یال مناسب نیست

its-920807

در فاز پیاده سازی ۳ تا کوتاهترین مسیر را در نظر بگیرید

مسیر منتخب رو از مدار انتخاب خارج میکنیم

ابتدا با یک الگوریتم مسیرهای کوتاه را پیدا می کنیم-وقتی پیدا کردیم حالا مجموع مثلا ۳ مسیر کوتاه را پیدا می کنیم(برای مخرج لاجیت)

حذف یال خیلی مناسب نیست
ولی جریمه کردن ممکن است نتیجه خوبی بدهد

its-920807-2

الگوریتم k shoertest path

میران تفاضل جریان ثانویه را حساب می کنیم اگر بزرگتر از اپسیلون بود ادامه میدهیم
و اگر کمتر از اپسیلون بود متوقف می کنیم

cost ترکیبی از زمان و هزینه است

۲ تا flow داریم (جریان اولیه –  جریان ثانویه )

۱- TrueFlow (جریان ترافیکی بدون ترافیک )

۲- Estimated Flow by Logit  (یک بار داخل تابع logit می گذاریم)

 

یک بار بر اساس جریان یالی آزاد میزان جریان را حساب می کنیم
جریان اولیه و با توجه به جریان های قبلی هزینه ها را Update کردیم
با توجه انتخاب الگوریتم logit جریان بعدی باید نزدیک به هم بشوند

۲ هفته دیگه مهلت تمرین تمدید می شود
در جلسه حضوری ۴ شنبه کد ها را از نزدیک بررسی میکنیم

مطابقت دوطرفه برای مساله تنظیم

تخمین سفر path estimator

استفاده از الگوریتم ژنتیک :
– نحوه نمایش ژنتیکی جوابهای مساله
راهی برای ساختن جمعیت اولیه جواب ها
تابع ارزشیابی که میزان شایستگی جواب ها را نشان می دهد.
عملگر های ژنتیکی که ترکیب ژنی فرزندان را صورت داده و جمعیت جدید تولید نماید.
مقادیر پارامتر های ژنتیکی
گام ۱ : پارامتر های مورد ننیاز الگوریتم ژنتیک تعیین و متغیر های تصمصم را به صورت دودویی و بر اساس کران پاین و بالا و کد نمایید.
گام ۲ : جمعیت تصادفی اولیه از متغیر های چراغ راهنما تولید کند
گام ۳ : سطح پایین را به وسیله روشی از PFE حل و جریانهای تعادل کاربر تصادفی برای هر یال شبکه محاسبه کنید.
گام ۴ : زمانهای چراغ راهنمای مطرح شده در گام دو و جریان های تعادلی یال های شبکه محاسبه شده در گام سه را به نرم افزار Transyt داده ، معیار کارایی سیستم را به وسیله آن محاسبه نمایید
گام ۵ : عملگر آمیزش و عملگر ژنتیکی را به کار ببرید
گام ۶ : جمعیت جدید را از روی جمعیت قبلی و فرزندان بسازید.
گام ۷ : اگر تفاوت میان میانگین شایستگی جمعیت و شایستگی بهترین عضو جمعیت کمتر از ۵% باشد جمعیت اولیه ساخته و به قدم سه باز گردید . در غیر انصورت به سراغ قدم بعد بروید.
گام ۸ : اگر بیشترین تعداد مجاز جمعیت گیری حاصل شده باشد، جواب با بالاترین شایستگی را جواب بهینه مساله گرفته و در غیر این صورت به سراغ قدم سه بر گردید

بعد از پیاده سازی تخصیص ترافیک را که انجام دادید

به عنوان تمرین ۲ : جواب مقادیر سبز چراغ راهنما بر این اسا س قابل پیاد هسازی هست یا نه

کد الگوریتم ژنتیک برای بهینه سازی زمانبندی چراغ راهنما بنویسید

Oct 282013
 

خلاصه درس خوشه بندی – دکتر زارع – ۹۲/۰۸/۰۶
امتحان هفته بعد میانترم   نیست
در حد روشهای سلسله مراتبی و مباحث اولیه خوشه بندی – مثل نمونه سوالی که دادیم

هفته بعد امتحان میان ترم نیست
یا اینکه یک تمرین بدهیم
بحث Model Selection

Social Network

Intruduction to Social Networks
Jure Leskoves
Stanford University
مهندسی سامانه های شبکه ای
علم جدید در قرن ۲۱ هست
Big Data
Data Science

سال ۱۹۶۴ آزمایش ارسال ۱۰۰ بسته پستی به آمریکا انجام شده که حداکثر با ۶ لینک این کار انجام شده
پدیده Small World
بخشی از این را فیزیکدانان و بعد ریاضی دانان و بعد کامپیوتری ها به دنبال نتیجه گیری از شبکه های اجتماعی هستند
۶ Degree of seperated

کتاب Networks an introduction m e j newman
یک گراف کشیده از ارتباطات اینترنت

Connection Between political blogs
http://connectedthebook.com/
Networks : Organizations
ارتباط ها را با یالها نمایش می دهیم
شبکه اقتصادی

مغز انسان
Human Brain 10 -100 billions neurons
https://www.humanbrainproject.eu/

شبکه زیستی پروتئین ppi

شبکه متابولیک

برای فهم ارتباطات شبکه :
Empirical : پرسشنامه ای
Mathematical ریاضی
Algorithms الگوریتمی

اولین مدل های شبکه ای را به روش ریاضی erdus , و reny ارائه دادند

جچوری به این مدلهای برسیم
یک سری pattern و خواص آماری و یک سری معیار باید بتوانیم استخراج کنیم
مدل ها را استخراج کنیم
و بفهمیم که شبکه ها چرا اینگونه ساخته شده اند

اقای ves vigiani – complex network بحث بخش ویروس های کامپیوتری را تشخیص داد ، رفتار دینامیک

شبکه ها برای دسترسی پذیری به اطلاعات ، جهانی شدن
Networks : Impact

Dotnet Bilioners

معرفی شبکه
ارتباطهای بیماری ها به هم

Networks Really Matter
Network یک کلکسیونی از اشیا مختلف هست که به هم وصل شده اند

Objects : Node , Vertices
Intractions : Links , edges
System : Network , Graph

نظریه گراف : نمایش ریاضی

برای تحلیل شبکه از گراف استفاده می کنیم

نمایش صحیح برای شبکه
در برخی جاها می توان نمایش یکتا ارائه داد

شبکه های جهت دار یا بدون جهت

شبکه می تواند connected باشد می تواند Disconnected هم باشد .

دوستانی که مقاله فرستاده بودند ،امشب خوانده می شود
ISI جدید باشد

 

 

Oct 272013
 

خلاصه درس تدریس یار داده کاوی ۹۲/۰۸/۰۵
K-means

Unomary Detection
تحلیل خوشه ای نیاز به هیچ پیش شرط آماری نیست

یک متغیر Target یا هدف باید داشته باشیم
که یا از قبل مشخص می کنیم به عنوان Target
یا به جای اینکه از use type node setting استفاده کنیم از use
custom setting استفاده می کنیم

یکی از این الگوریتم ها الگوریتم C5 هست

الگوریتم C5 اولا برای متغیر های کیفی ( چه به فرم اسمی باشد یا
به فرم ترتیبی )

ملاک برای خوشه بندی چه متغیر هایی می تواند باشد ؟
باید مجموعه ای از متغیر های ( کمی و یا کیفی ) در دسته بندی
متغیر ها مورد استفاده قرار بگیرد

متغیر های ورودی Input را باید وارد کنیم

در نسخه IBM modeler 14 یک گزینه اضافه شده : Use Weight Field
(مثلا به تفکیک سال )

Build model each split
اگر مدلی را به عنوان تقسیم کننده انتخاب کرده باشیم ، برای هر
بخش تقسیم شده کدش را نمایش می دهد

مدل می تواند Simple ساده باشد یا Expert حرفه ای

درخت تصمیم بایستی با کمترین شاخه بتواند ما را با نتیجه برساند
در تمرین قبل الگوریتم C5 را اجرا کنید و بفرستید

 

Oct 262013
 

خلاصه درس تدریس یار خوشه بندی ۹۲/۰۸/۰۴
تمرین : حتما از مقالات جدید استفاده کنید
مثلا از Fuzzy FCMeans استفاده کنید
هر الگوریتم خوشه بندی یک تابع هدف دارد که آنرا مشخص می کنیم
چند تا معیار پیدا کردن خوشه های بهینه را گفته است
تعداد خوشه بندی بهینه در روش های مختلف ممکن است متفاوت باشد

گزارش حتما باید فارسی باشد.
تا جمعه ۹۲/۰۸/۱۰ تمدید شد.

به فرمت : HomeWork1_nadi
مرجع GMM ما از کتاب Bishop می گوییم
روابط بویژه از طریق فرمولاسیون

روش مخلوط گوسی مثل Fuzzy هست

تعلق به خوشه های مختلف ممنکن است متفاوت باشد

میانگین و واریانس پارامتر ها هستند
اگر داده ها چند بعدی بودند
یک ماتریس برای میانگین داشتیم – یک بردار برای واریانس

مثلا می گوییم : در مدل سازی یک مجموعه داده ای از یک مخلوط با ۳ تابع گوسی استفاده شده

توزیعی وزنش بیشتر است که تابع های بیشتری به آن Fit شده اند
Pi,k بیشتری دارد

پارامتر وزن : pi k
بردار میانگین : mio k
مولفه : Sigma k

یک متغیر تصادفی Z تعریف می کنیم ، یک بردار است
تعداد مولفه هایش به تعداد مولفه های گوسی هست
۳ مولفه دارد
هر کدام از مولفه ها می توانند ۰ یا ۱ باشند
و مجموع موله ها باید۱ شود
k تا حالت می شود

به جای اینکه بگوییم مولفه گوسی سوم ، متناظر Z آنرا می گوییم

پس توزیع Z پر رنگ میشه :
z=[z1 z2 z3]

توزیع توام

Ta-Clustering-GMM-pxk

p(a/b)= p(a)*p(b/a) / S(p(a,b))

در صورت وزن هر گوسی را در تابع توزیع ضرب می کنیم
تقسیم بر مجموع pi ها در تابع نرمال ها
اسلاید ۹ : Prior Probablility
zk =1 احتمال پیشین
احتمال پسین ، احتمال گوسی k پس از مشاهده x

—————————–

تمرین به صورت PDF و داخل یک فایل زیپ باشد

 

Oct 222013
 

شرح استفاده از نرم افزار Turbo Architect
توسط خانم مهندس روشنی

۱- تعیین اهداف و راهبرد ها – تعیین ذینفعان و نیاز کاربران
۲- تعیین موجودیت ها – تعیین مفاهیم عملیاتی – تعیین نیاز های عملکردی – تعیین خدمات
۳- تعیین جریان اطلاعات – تعیین رابط ها
۴- استاندار سازی ITS – تهیه لیت توافق نامه ها
۵- استفاده از معماری
۶- نگهداری از معماری
از Stack Holder Group می توانیم ذینفعان را مشخص کنیم

فهرست موجودیت ها
باید مشخص کنیم که این سیستم شامل کدام زیر سیستم استاندارد شده در آمریکا هست.

سر برگ خدمات : AutoSelect Services

http://bounced.azdot.gov/Highways/TTG/ITS-Architecture/index.html

 

دانلود نرم افزار Turbo Architecture ۷٫۰

با کلیک روی آگهی زیر مبلغ 400 ریال به حساب من واریز می گردد

با کلیک روی آگهی زیر مبلغ 1000 ریال به حساب من واریز می گردد