۱۳۹۱/۱۲/۰۸
فاصله اطمینان برای نسبت جامعه
در یک جامعه دانشگاهی ( قبول شدگان و رد شدگان ) می خواهیم فاصله
اطمینان را بدست بیاوریم
آزمایش دو جمله ای برای n-1 داریم
فاصله اطمینان که برای p می خواهیم بدهیم
۱۳۹۱/۱۲/۰۸
فاصله اطمینان برای نسبت جامعه
در یک جامعه دانشگاهی ( قبول شدگان و رد شدگان ) می خواهیم فاصله
اطمینان را بدست بیاوریم
آزمایش دو جمله ای برای n-1 داریم
فاصله اطمینان که برای p می خواهیم بدهیم
برای دسترسی science direct نامه ای به کتابخانه بزنید
در آدرس جدید قرار دادند
امروز می خواهیم در مورد نرم افزار word صحبت کنیم
نرم افزار LaTeX خیلی بهتر است
نیم فاصله را می توان را با این کلید ها ایجاد کرد shift + Ctrl + 2 , Del
Word Wide Blank نیست
در ورد اعداد را با فونت عربی می زند
ورد Spell check دارد
Grammer check دارد
Readiblity دارد
در ورد فاصله بین خط ها کم و زیاد می شود
و ثابت نوشتن اندازه فرمولهای ریاضی
نرم افزار Virastyar
Spell check دارد و مشکل نقطه گذاری ندارد
نیم فاصله درست میکند
اعداد عربی را فارسی می کند
و پینگلیش رو به فارسی تبدیل میکند
شرکت یکتا وب شرق یک نرم افزار مشابه داره توسعه میده
Grammerly هم هست برای اصلاح گرامر ( انگلیسی )
ginger هم یک سایت هست که به صورت آنلاین گرامر را چک میکند.
http://www.gingersoftware.com
یک نرم افزار از Grammerly قوی تر هست به نام white smoke
نرم افزار white smoke 5 نمره میدهد ، readibility ,redunduncy ,
originality
پیشنهاد هم میدهد در spell و گرامر و خوانایی و
یک مقاله به ۳ ویراستار احتیاج دارد
ویراستار ادبی
ویراستار فنی
ویراستار علمی
اکر مقاله ای به زبان انگلیسی بنویسید در دانشگاه مجانی براتون
تصحیح میکنه و می فرسته ( در معاونت پژوهشی )
الگوریتم Find-S
الگوریتم حذف کاندید
الگوریتم List – then – Eliminate
الگوریتم Find-S
اشکال این الگوریتم اینه که نکات منفی را نشان نمی دهد و فقط
یک راه حل را نشان میدهد
تنها یک فرضیه به دست می آید
مثال های آموزشی را در نظر نمیگیره
Find-S به سوالات زیر پاسخ نمیدهد
۱- آیا الگوریتم به مفهوم صحیح رسیده ، آیا فرضیه سازگار دیگری
وجود دارد
۲- چرا اختصاصی ترین فرضیه برگزیده شود ؟
۳- آیا مثال های آموزشی سازگار هستند ؟
۴- اگر چندین فرضیه اختصاصی حدکثر وجود داشت یا نداشت چه
میشود
——————————————————
نحوه سوال : یک فرضیه بدم ، الگوریتمش را پیدا کنید
———————————————————-
الگوریتم حذف کاندید
یکی از مشکلات این هم نویز هست ( داده های آموزشی بدون
نویز باید باشد )
سازگاری :
فضای مدل : (version Space )
در اینجا همه …. که …. مجموعه سازگار است
———————————————————-
الگوریتم List – then – Eliminate
لیست کردن و سپس حذف کردن
الگوریتم خوبی است ولی پیچیدگی زیادی دارد و ممکن است
عملی نباشد
—————————————————-
حد کلی maximaly
حد اختصاصی ( S )
برای الگوریتم حذف کاندید فضای مدل طوری ساخته نمی شود که
با داده های آموزشی سازگار باشد
G0 حد کلی
S0 حد اختصاصی
———–
صفحه ۱۰
مثال اول مثال S0 همش پوچ بود میاد مرزش رو عوض میکنه ( مرز
G0 رو عوض نکرد )
مثال دوم باز مثبته – مرز S رو عوض میکنه
باز G2 من مثل G1 هست
G2 عمومی ترین فرضیه ها بود
ولی باید طوری تعمیم بدم که مثال منفی را شامل نشه
اینجا Sunny بوده Rainy شده
تغییرات دومی که اینجا هست Warm بوده … شده
Change منفی است و باید Same شود
G3 دیگه G2 نیست – عوض شد
اینجا که قرمز نشان داده دلیلش اینه که باید یه جوری عوض بشه
پس G3 تبدیل شد به G4
چون این فرضیه ناسازگار بود
دو فرضیه در G4 دارم و در S4 هم دو تا فرضیه دارم
صفحه ۱۱ پنج تا فرضیه داریم
حالا Vesion Space رو پیدا کردیم
دسته بندی روشهای حل :
برای حل ۵ روش متفاوت داریم
۱- روش تحلیلی یا کلاسیک
۲- روش های تصویری Graphical Methods (چشمی – هوش انسانی )
۳- روش های عددی ( ساده ترن روش )
۴- روش های مدرن یا غیر متعارف (هیورستیک
در حل مساله ۳ تا استثنا وجود دارد (اگر مساله کمترین مربعات خطی بود یا LPبرنامه ریزی خطی بود یا محدب بود ) خیالمون راحت میشه
همین که بهترین الگوریتم انتخاب بشود برای دانشجویان مهندسی کفایت می کند
دوشنبه ۱۳۹۱/۱۱/۳۰
این ترم یک مقاله Full Paper نمی خواهیم ، آزمایشی و تمرینی می خواهیم کار کنیم.
بهتره مقاله ای که انتخاب میکنید در راستای مقاله ای باشد که برای درس پروژه به کار بیاد.
تکلیف اول : طرح یک مساله جدید ، نحوه حل در ۲ صفحه توضیح دهید
دانشجوی فوق لیسانس ، قراره بعد ار فارغ التحصیلی توانایی پیدا کنه که بتونه در حل مسائل
برای رسیدن به این توانایی درس پاس کردن کافی نیست
باید تحقیقات زیادی انجام داد
در تحقیق علاقه شرط اول هست
هدف بسیار مهم است
باید حتما یک راهنما داشته باشید
دلیلش اینه که استاد راهنما کسیه که برای شما هدف را ترسیم میکنه ،یا به عبارت دیگه سوالی رو مطرح میکنه
طرح مساله سخت تر از حل مساله هست
مساله ای را طرح کنید که جدید باید باشد و قابل حل
استاد راهنما : کسی است که صورت مساله را دارد و جوابش هم یا دارد و یا حدودا جواب را می داند
اگر مساله را دارید حتما باید چک کنید که Open Problem باشد و کسی قبلا حل نکرده باشد
انتخاب استاد راهنما دو طرفه است
persia diaconace دکترای آمار و کامپیوتر دانشگاه استنفورد
مقاله کوتاه short Commiunication
تمام مجلاتی که آخرش letters دارد مثل
mathematical letters
مقالات کوتاه دارند
ممکن است بشود که یک letter رو در شش ماه هم تمام کرد ولی خیلی کار سختی است
موضوع را بنویسید و در موردش Abstract هم بنویسید
مقالاتی را که انتخاب میکنید برای ۲ سال اخیر باشد ( جدید باشد )
(غیر از این قبول نمیکنم )
برای ژورنال باشد ( و نه برای کنفرانس )
تجربه علمی خودتون نه
مروری هم می تواند باشد (Survay )
مقاله survay راحت نیست و کسی می تواند کار کند که ۳۰ ساله کار کرده باشد
بهتره که در زمینه کاری خودتون باشد ، فقط ممکنه که استاد راهنما نتونه خیلی کمکتون کنه
مثلا در مقاله ثابت میکنید که این الگوریتم دقیق تری دارد
در این دانشکده استاد ها ۸ نفر هستند که می توانند استاد راهنما باشند
در مورد جغرافی – فیزیک – هندسه میشه
در دوره لیسانس اسم دانشگاه مهم است ولی در دوره دکترا استاد راهنما مهم تر از نام دانشگاه هست
در تحقیق باید جسارت داشته باشید
همه راه های تحقیق را برید و جسارت داشته باشید
وقتی دارید کار تحقیقاتی انجام میدید ، حرف های استاد راهنما را هم حتی بینابین گوش کنید
ممکنه من حرفی که میزنم خودمم هم کامل قبول نداشته باشم.
دکتر قطعی و دکتر تشکری – در مورد سیستم های هوشمند حمل و نقل کار می کنند.
این ترم یک مقاله Full Paper نمی خواهیم ، آزمایشی و تمرینی می خواهیم کار کنیم.
بهتره مقاله ای که انتخاب میکنید در راستای مقاله ای باشد که برای درس پروژه به کار بیاد.
برای تبدیل پروژه به پایان نامه (باید مقاله ISI بدید : شوخی )
پایان نامه برای کارشناسی ارشد است
رساله برای دکتری است .
الفبای مقاله نویسی را یاد می دهیم
در درجه اول سوال را طرح کنید ( موضوع را انتخاب کنید )
فارسی بودن یا انگلیسی بودن
در اول کار از روی مقاله های قبلی تقلید کنید و ایده بگیرید
برای انتخاب مقاله باید تیز باشد ، اگر استاد راهنما در مساله مسلط نباشه فایده نداره ( وقت تلف کردن است )
از همین دیتا بیس ها جستجو کنید که استاد هاتون در چه زمینه هایی کار کردند
از وب سایت های استاد ها هم جستجو کنید
ایمیل های استاد محمد پور :
adel@aut.ac.ir
statdatamining@gmail.com
۶۴۵۴۲۵۳۳
اتاق ۱۰۴
قبل از مراجعه حضوری تماس بگیرید یا ایمیل بزنید
کارت طرح غدیر برای کتابخانه هاست که میتونید بگیرید و دانشگاه های دیگه هم سر کلاس های استاد های دیگر هم برید.
سایت دانشگاه استانفورد حضور در کلاسهای مجازیش آزاده
https://www.coursera.org/
Certificate هم میدهد
فیلم هایش را هم میتونید بگیرید مخصوصا از MIT
تکلیف اول : طرح یک مساله جدید ، نحوه حل در ۲ صفحه توضیح دهید
۹ تا تکلیف میخوام که هر کدام ۲ نمره دارد
روز ۱۶ اسفند لپ تاپ یا فلش بیارید که DVD ها رو کپی کنید
که ۹۰% کارمون کار با همین DVD هاست
سایت اسکاپوس scopus : جای مقاله ها را درمجلات مشخص کرده است
mathScient هم هست که مخصوص رشته ریاضی هست
SienceDirect که میگن خیلی خوبه ، در صورتی که یک فروشنده مقالات
Elsivier
برای اینکه بتوانیم مرز دانش یک اپسیلون تکان بدهیم
ACM Digital Library – E-journal
سایت doaj مجلات مجانی هست در رشته شما ۷۰ – ۸۰ تا هست
IEEE 100 تا نشریه دارد
البته نسخه های قدیمی در کتابخانه موجود است
چند تا مجله درباره image proccecing دارد
برای هر صفحه ویرایش ۳۰ $ پول میگیره
اگر بخواهید که ۱ ماهه جواب بده ۱۰۰۰ دلار میگیره
از نظر کیفیت اول هست
GigaPaper مجانی هست
inspec یک سایت بین رشته ای است
Intute از سال ۲۰۱۱ بستنش ( توسعه پیدا نمیکنه )
Lecture Notes in Computer Science
مقالاتی که طولانی هستند ولی کتاب نمی شوند – لکچر نوت می شوند ولی متاسفانه در ISI منظم نیست – چند سال عضو هست – جند سال هم عضو نیست
exa.ir قبلا ۵ تمون می گرفت چندین بانک اطلاعاتی را در اختیار قرار می داد
libgen.org هم هست
۱۲۰۰۰ مقاله در science direct مجانی هست
دانشگاه ما بهتر از ۵۰% دانشگاه های خارجی است که بانک اطلاعاتی را عضو هستند
جند تا در دنیا استثنا هستند که تمام بانک های اطلاعاتی را عضو هستند مثل British Library
تفاوت عمده Scopus این است که Cloud هست
یعنی تمام نوت ها و کاهاتون در اکانت تون هست
SIAM مجلات فوق العاده با کیفیت در زمینه Applied mathematics and Computer Science Jornal هست
SpringerLink : برای علوم کامپیوتر مجلات زیادی دارد و مثل Science Direct کتاب فروشی هست
Web of Science :
مزیت ISI نسبت به Scopus تعداد سالهایی که در نظر میگیره خیلی بیشتره
خوب مقاله را ارجاع که میدهیم site میگوییم
منابع : reference
برا اساس تعداد ارجاعات if (Impact Factor ) ) محاسبه می شود
یعنی از مقاله شما در چند تا مقاله دیگه ارجاع داده شده
اگه خوش به خوش ارجاع بده مهم نیست
دکتر صالحی – سوپلک فرانسه بیشترین ارجاعات داشت در رشته برق
Hot Paper می گویند ( مقاله ای که ارجاعاتش زیاد باشد )
ArXive سایت pre print هست – یعنی قبل از چاپ مقاله در این سایت ثبت شود می توان شکایت کرد
معمولا هر کسی که یک مقاله مینویسه قبلش حتما در Arxive ثبتش میکنه
و ممکنه خیلی غلط داشته باشد
دلیل اینکه چرا مقاله رو می فرستند به خاطر اینکه به مقالشون ارجاع بدید
مقاله میتونه فارسی هم باشه
۹۹% دانشجو ها مقالات را انگلیسی در نظر میگیرند
در حد ۳ – ۴ صفحه هم کفایت میکنه
رگرسیون
یک سری ورودی داریم
یک سری خروجی داریم
در رگرسیون دنبال رابطه خطی بین ورودی ها و خروجی ها هستیم
ضرایب رگرسیون را تشخیص بدیم
مدل چیست ؟
چند نوع مدل داریم ؟
مدل : نمایش دهنده بعضی پدیده ها هست
مدل تعیینی : به صورت دقیق ریاضی هست ( مثل : نیرو = شتاب * جرم )
مدل احتمالی : بعضی قسمت های مدل احتمالی تعیینی است + درصدی خطا
که ممکن است این خطا ناشی از اندازه گیری باشد
مدل رگرسیونی : یعنی خطای تصادفی در مساله داریم
مدل رگرسونی که پیدا میکنیم رابطه بین متغیر ها
متغیر های وابسته dependent ( متغیر های پاسخ )(متغیر output)
متغیری است که باید پیش بینی کنیم
مثال : تاثیر تبلیغ در فروش
کاربرد آن برای پیشبینی ( estimation ) است
باید متغیر های مساله را مشخص کنیم
ابتدا فرض میکنیم که رابطه خطی است
انواع رگرسیون :
۱- رگرسیون ساده ( یک متغیر وابسته – یک متغیر مستقل )
۱-۱ رگرسیون ساده خطی
۱-۲ رگرسیون ساده غیر خطی
۲- رگرسیون چند گانه ( بیش از ۲ متغیر مستقل داشته باشیم
صفحه ۲۸ فرمول
در مدل تعیینی
Y(i)=B(0)+B(1)X(i)+e(i)
e خطای تصادفی
X = رگرسور Input
Y = output
۰ beta = عرض از مبدا
beta 1 شیب خط
صفحه ۳۴
در نمونه آماری ما نقطه هایی را در نظر میگیرم و خط را تخمین میزنیم
e(i) خطای
معادله خط را بر آورد کردیم
خطی را که پیدا میکنیم باشد اپسیلون های کمتری داشته باشد
بهترن برازش (خط ) را باید پیدا کنیم
برازشی بهتر است که فاصله بین y و y^ کمترین باشد
خطی خوب است که مجموع مربعات خطا کمترین باشد List Square minimun (SSE)
اگر هیچ هزینه ای برای تبلیغ نکنیم میزان فروش -۰٫۱ می شود
با نرم افزار متلب انجام میدیم
X بار یعنی میانگین
۱- تشخیص مستقل از متن گوینده با استفاده از ترکیب SVM و مدل آماری مرتبه دو – نویسنده سید عباس حسینی
۲- بررسی روشهای شناسایی ایمیل های هرز و پیاده سازی و تست سیستم فیلترینگ SpamHunting – نویسنده حامد کیانی
۳- طبقه بندی صفحات وب با استفاده از ماشین بردار پشتیبان بر اساس رویکرد یادگیری وزن دار – نویسنده سهیلا جعفری
خوزانی
۴- یک مدل فازی جدید برای درونیابی توابع پیوسته خطی – نویسنده مریم اسدی ، پگاه توکلخواه
۵- پیش پردازشی برای استراتژیهای تکاملی – نویسنده علی سبطی
۶- طراحی ساختار و آموزش وزنهای شبکه عصبی MLP با استفاده از استراتژی تکامل با طول متغیر – نویسنده عباس صراف
شیرازی
۷- استفاده از SVM فازی و برچسب گذاری صوری در بازیابی اطلاعات – نویسنده محمد رحیمی
۸ – Reliability Enhancement of Deregulated Power Systems Using the Strategy of Transmission Lines Pricing and
Optimum Power Distribution Based on Reliability Index by Genetic Algorithm – A. H. Ranjbar, H. Omranpour, H.
Hosseinian, S. Shiri نویسنده
۹- کشف ناهنجاری در حساب های داخلی موسسات بانکی – نویسنده لعبت عزیزی
۱۰ – Query Relaxation – نویسنده سید ناصر نوراشرف الدین
دانلود PDF موضوعات مقاله های ترم های گذشته یادگیری ماشین – دانشگاه امیر کبیر
معرفی شده توسط استاد http://www.doaj.org
معرفی شده توسط دوستان http://irandatamining.com
معرفی شده توسط خودم http://www.dayche.com
Download PDF : The Elements of Statistical Learning
امروز ۱۵ بهمن ۹۱
باشگاه دانشجویان ارشد مجازی امیرکبیر رو به آدرس http://vua.nadiran.com ایجاد کردم
تا محیطی باشه برای تبادل اطلاعات دوستان و مشارکت گروهی
موفق و سربلند باشید
محمد نادی