توضیحات
مهندسی یادگیری ماشین به سرعت به یکی از محبوبترین مشاغل حوزه فناوری تبدیل شده، زیرا سازمان و متخصصین به حوزههای مرتبط با علوم دادهها علاقهمند شدهاند. اساسا یک مهندس یادگیری ماشین وظیفه ساخت مدلهایی برای حل مشکلات واقعی را دارد.
یک مهندس یادگیری ماشین، برخی مواقع مدلهای یادگیری ماشینی که یک دانشمند علم دادهها با آن کار میکند را بهینهسازی میکند و در مواردی نقش معماری را بازی میکند که پیشنیازها و ملزومات موردنیاز سایر مشاغل دادهمحور را آماده میکند تا این مشاغل بتوانند با سهولت بیشتری از دادهها استفاده کنند.
در دوره مهندسی یادگیری ماشین هدف تربیت متخصصین این حوزه برای ورود به بازار کار میباشد.
این دوره مشتمل بر 5 درس مبانی آمار و جبرخطی، مبانی علم داده و یادگیری ماشین، پایتون در علم داده، سریهای زمانی در پایتون و متن کاوی و وب کاوی کاربردی در 120 ساعت، به صورت 40 جلسه 3 ساعته طرحریزی شده است.
زمانبندی: روزهای دوشنبه و چهارشنبه ساعت 17 تا 20
مبانی آمار و جبرخطی:
16 ساعت
مدرس: امیررضا تجلی
- مقدمه ای بر تجزیه و تحلیل آماری
- آمار توصیفی و استنباطی
- برآورد پارامترهای یک جامعه با استفاده از آمار نمونه
- Data Wrangling and Data Manipulation
- مقدمه ای بر روش های نمونه گیری دادهها
- متغیرهای تصادفی، انتظار (میانگین) و واریانس
- احتمالات و توزیع های آماری
- توزیع نرمال
- نرمال سازی و استانداردسازی داده ها
- کوواریانس | همبستگی
- Multicollinearity
- آزمون فرضیه ها و confidence intervals
- تست های تی، فیشر و ANOVA | تست کایدو
- رگرسیون خطی
- تجزیه و تحلیل دادههای اکتشافی
مبانی علم داده و یادگیری ماشین:
32 ساعت
مدرس: محمدرضا محتاط
- مفاهیم پایه دادهکاوی
- کاربردهای دادهکاوی
- متدولوژی Crisp DM
- آمادهسازی داده جهت دادهکاوی
- تجمیع و یکپارچهسازی دادهپ
- مدیریت داده نویزی
- مدیریت داده پرت
- مدیریت ناهنجاری
- مدیریت داده مفقوده
- مدیریت داده نامتوازن
- کمی کردن دادههای کیفی
- نرمالسازی و استانداردسازی
- یادگیری ماشین
- مدلهای طبقهبندی
- الگوریتم نزدیکترین همسایه
- الگوریتم درخت تصمیمگیری
- الگوریتم مبتنی بر قاعده
- الگوریتم ماشین پشتیبان بردار
- الگوریتم تجمیعی
- الگوریتم شبکه عصبی
- الگوریتم رگرسیون خطی ساده
- الگوریتم رگرسیون چندگانه
- الگوریتم رگرسیون چندمتغیره
- الگوریتم رگرسیون چندجملهای
- مدلهای خوشهبندی
- الگوریتم Kmeans
- الگوریتم Kmedoids
- الگوریتم DBscan
- الگوریتم سلسله مراتبی
- قوانین انجمنی
- الگوریتم Apriori
- الگوریتم FP Growth
- ارزیابی مدلهای یادگیری ماشین
- پیادهسازی مفاهیم در نرمافزار SPSS Modeler
- شروع کار با IBM SPSS Modeler
- توابع پایه نرمافزار
- مصورسازی داده
- خوشهبندی با الگوریتم Kmeans و سلسله مراتبی
- شناسایی دادههای پرت
- قواعد انجمنی با الگوریتم Apriori
- طبقهبندی با الگوریتمهای بیزین، SVM، شبکه عصبی و...
- سری زمانی با الگوریتم Arima
- آنالیز RFM
پایتون در علم داده:
36 ساعت
مدرس: امیررضا تجلی
- یازها و چالش های موقعیت های شغلی مختلف علم داده با توجه به یادگیری زبان پایتان
- مرور اجمالی بر محیط های توسعه (IDE) و بیان نقاط ضعف و قوت هر کدام
- راه اندازی پایتان، معرفی کلی زبان برنامه نویسی پایتان، معرفی انواع کابخانه ها و چگونگی طریقه ورود داده از منابع مختلف
- ارائه مبانی ابتدایی در محیط برنامه نویسی پایتان
- نصب و راه اندازی کتابخانه های Scikit-Learn جهت پیاده سازی الگوریتم های یادگیری ماشین
- تفاوتVerification و Validation
- تفاوت Data Gathering و Data Collecting
- تفاوت های DataBase, DataSet, Data Frame
- تفاوتData Analysis و Data Analytics
- تفاوت داده های Train و Test و Validation
- تفاوت مفاهیم Overfitting و Underfitting
- داده کاوی و یادگیری باناظر و بدون ناظر در پایتان:
- بررسی و تحلیل مسائل طبقه بندی (Classification) بر روی حوزه های مختلف من جمله سلامت، پتروشیمی و خودروسازی
- پیاده سازی الگوریتم درخت تصمیم و جنگل های تصادفی Decision Tree & Random Forest
- الگوریتم ماشین های بردار پشتیبان Support Vector Machine
- الگوریتم نزدیک ترین همسایگی KNN
- الگوریتم نایو-بیز Naïve Bayes
- الگوریتم شبکه های عصبی Neural Networks
- الگوریتم رگرسیون لجستیک Logistic Regression
- پیاده سازی الگوریتمهای یادگیری تجمیعی (Ensemble Learning) شامل: Boosting و Bagging
- بررسی و تحلیل مسائل رگرسیون (Regression)
- پیاده سازی الگوریتم های رگرسیونی شامل رگرسیون خطی و چند متغیره
- بررسی و تحلیل مسائل مسائل خوشه بندی (Clustering)
- پیاده سازی الگوریتمهای K-Means , K mediods و DBscan
- بررسی و تحلیل مسائل مسائل قواعد انجمنی (Association rules)با استفاده از تکنیک Apriori در پایتان
- ارزیابی مدل- امتیاز دهی مدل و اعتبار سنجی (K Fold Cross Validation)
- پیاده سازی روش های اعتبار سنجی و بهبود مدل
- بهینهسازی الگوریتمها و توسعه مدل
سریهای زمانی در پایتون:
12 ساعت
مدرس: امیررضا تجلی
- مقدمه ای بر سریهای زمانی
- مصورسازی داده در سریهای زمانی
- کشف الگو در سریهای زمانی
- چالش دادههای مفقوده در سریهای زمانی
- Cross Validation در سریهای زمانی
- مانایی و نامانایی در سریهای زمانی
- روشهای آماری در سریهای زمانی
- تفاوت نویز و سریهای stationary
- سریهای زمانی فصلی
- خودهمبستگی
- روشهای ACF and PACF
- مدل Autoregressive
- مدل Moving Average
- مدل ARIMA & SARIMA
- مدل ARCH & GARCH
- الگوریتم Prophet
- مقدمهای بر شبکههای عصبی در سری زمانی
- معماری LSTM
متن کاوی و وب کاوی کاربردی:
24 ساعت
مدرس: محمدرضا محتاط
- مقدمهای بر متنکاوی
- آشنایی با کتابخانههای متنکاوی پایتون
- ورود دادههای متنی در پایتون
- پیشپردازش متن
- ساخت بردار ویژگیها با استفاده از کلمات
- طبقهبندی متن
- خوشهبندی متن
- مدلسازی موضوعی در متون
- مدل شبکه عصبی Word2Vec
- تحلیل احساسات
- خلاصه سازی متن
- خوشه بندی مت
- خزش وب با پایتون
- مفاهیم پایه تحلیل شبکه اجتماعی
- سناریوی ایجاد شبکه
- پارامترهای تحلیل شبکه
- شناسایی اجتماعات در گراف
سخنرانان

محمدرضا محتاط

امیررضا تجلی
برگزارکنندگان

دیجینکست
سوالات متداول

دنبال کننده
کل رویدادها
رویداد فعال
آکادمی دیجینکست با هدف شبکهسازی میان افراد مستعد در حوزه تکنولوژی بویژه هوش مصنوعی و برنامهنویسی ایجاد شده. در آکادمی دیجینکست دروههای آموزشی، کارگاه و ایونتهایی برگزار میشود که هدف از این فعالیتها آموزش به افرادی است که به این حوزهها علاقه دارند. آکادمی دیجینکست با استفاده از دانش و تجربه متخصصان کسبوکارهای موفق، استعدادها را شناسایی و ...