در مورد چی صحبت میکنیم؟
قراره در این دوره با مفاهیم اولیه Reinforcement Learning آشنا بشیم. برخلاف روشهای سنتی یادگیری ماشین روش یادگیری تقویتی یا Reinforcement Learning سعی میکنه با تجربه کردن در محیط یاد بگیره. درست مثل کودکی که با تجربه و خطا و نگاه کردن به محیط اطرافش مهارتهایی را یاد میگیره. در این دوره قراره مفاهیم و تعاریف اولیه این حوزه را باهم بررسی کنیم و سعی کنیم راه را برای ادامهی این مسیر هموار کنیم.
پیشبینی میشه تا ۳ سال آینده این زمینه، زمینه پیشرو در حوزه هوشمصنوعی باشه. در حال حاضر خیلی از شرکتها در تلاشند تا این حوزه را صنعتی کنند و از اون بهره ببرند. اقتصاد، رباتیک،حوزه انرژی، حمل و نقل، مدیریت و ... همه از حوزههایی هستند که از این حوزه تاثیر خواهند پذیرفت.
وبینار در ۴ جلسه دو ساعته در روزهای پنجشنبه و جمعه از ساعت ۱۴ تا ۱۶ برگزار خواهد شد.
- آشنایی با مسائل ساده Reinforcement Learning
- بررسی روش Dynamic programming در حل مسائل
- بررسی روش Monte Carlo در حل مسائل
- بررسی روش Temporal difference در حل مسائل
- آموزش روش Q-learning و SARSA
- مقایسهی روشهای Tabular
- پیادهسازی روش Q-learning
- جزییات روشهای گفته شده و بحثهای تکمیلی
مباحث همه از روی کتاب مرجع این حوزه Reinforcment learning an introduction برگرفته شده.
سخنرانان

علی قندی
تحلیلگر داده در بلددانشجوی دکتری حوزه هوش مصنوعی دانشگاه صنعتی شریف
دیتا ساینتیست در مجموعه بلد(هلدینگ هزاردستان)
زمانبندی
عنوان | شروع | پایان |
---|---|---|
آشنایی با مفاهیم REinforcement learning | ۱۴ | ۱۵ |
آشنایی اولیه با مدل ریاضی | ۱۵ | ۱۶ |
سوالات متداول
گالری تصاویر
برگزارکننده

علی قندی
من دانشجوی حوزه داده در دانشگاه صنعتی شریف در مقطع دکتری هستم. چندسالی هست که در حوزه دادهکاوی و هوش مصنوعی فعالیت دارم و در حال حاضر هم به عنوان تحلیلگرداده (data scientist) در شرکت نقشه بلد(مجموعه هلدینگ هزاردستان) مشغول به کار هستم. میتوانید رز