یادگیری برخط - نیم‌سال اول ۱۴۰۰

مدرسین	ایمیل
محمدهادی فروغمند	foroughmand@sharif.ir
کسری علیشاهی	alishahi@sharif.ir

اهداف درس

درس همزمان جنبەی آموزشی و پژوهشی دارد. یکی از اهداف مهم کسب آمادگی برای دنبال کردن مقالات و ادبیات روز در موضوع یادگیری برخط، پژوهش در زمینەهای نزدیک و به کارگیری این ایدەها در مدل‌سازی و ارایەی راه حل برای مسالەهای واقعی است.

شرح مختصر درس

تصمیم‌گیری در حضور عدم قطعیت، چالشی همیشگی، با اهمیت و همراه با کابردهای روزافزون است. یادگیری برخط چارچوبی است برای مدل‌سازی و طراحی فرآیند تصمیم‌گیری در دنبالەای از موقعیت‌ها، بر مبنای اطلاعاتی (نه لزوماکامل) از تصمیم‌های قبلی و نتایج آن‌ها. در این فرآیند، یادگیرنده هم‌زمان که پیامدهای تصمیم‌های مختلف را می‌آموزد، هزینەی این تصمیم‌ها را نیز پرداخت می‌کند و بنابراین مسالەی اصلی برقراری توازنی است میان تصمیم‌هایی که منجر به کشف بهتر محیط می‌شوند (اکتشاف) و آنهایی‌که بر مبنای آنچه تا کنون آموختەایم کمترین هزینە را دارند (بهرەبرداری). دستەی خاصی از مسالەهای یادگیری برخط، با عنوان مسالەهای بندیت، در سال‌های اخیر مورد توجه زیادی قرارگرفتەاند و پژوهش‌های انجام شده دربارەی آنها، نظریەای غنی به وجود آورده که نویدبخش پیشرفت‌های اساسی در یادگیری برخط و حوزەهای مرتبط مانند یادگیری تقویتی در آیندەی نزدیک است.

سرفصل‌ها

مقدمه
- بازی حدس زدن!
- مشاوره با مشاوران!
- بندیت چنددستەی
کاهش گرادیان برخط
- رگرسیون برخط
ارتباط یادگیری برخط و یادگیری کلاسیک
- ارتباط پشیمانی و PAC
- مسالەی دستەبندی برخط
بازخورد محدود
- بندیت چنددستەای و الگوریتم EXP3
- بندیت زمینەای و الگوریتم EXP4
- بندیت خطی
- بندیت‌های ترکیبیاتی
- بندیت ناایستا
کاهش آیینەای
- بەروزرسانی ضربی وزن‌ها
- EXP3
پیروی از پیشروی منظم‌شده
- مسیریابی درگراف
مسالەها و مباحث انتخابی …

پیش‌نیازها

تسلط به احتمال و توانایی اولیه در انجام آزمایش و شبیەسازی کامپیوتری ضروری است. آشنایی هرچه بیشتر با فرآیندهای تصادفی، آمار و یادگیری، الگوریتم، بهینەسازی (محدب)، نظریەی بازی‌ها برای پیگیری درس مفید است.

منابع

[1] Shalev-Shwartz, Shai. Online learning and online convex optimization. Foundations and trends in Machine Learning 4.2 (2011): 107-194.
[2] Elad Hazan. Introduction to Online Convex Optimization, Now Publishers, .2016
[3] Tor Lattimore, Csaba Szepesvari. Bandit Algorithms. Cambridge University Press, 2020.
[4] Francesco Orabona A Modern Introduction to Online Learning. 2021

ارزشیابی

طرح الف) آموزشی
- تمرین (۶ نمره): دو یا سه سری تمرین تحویلی
- امتحان پایان‌ترم (٧ نمره): امتحانی شفاهی از مفاهیم، مسالەها، اثبات‌ها یا طرح اثبات قضیەها
- امتحان خانەبَر (٨ نمره): امتحانی برای حل مسالەهای سخت!

طرح ب) پژوهشی
- تمرین (۶ نمره): دو یا سه سری تمرین تحویلی
- امتحان پایان‌ترم (٧ نمره): امتحانی شفاهی از مفاهیم، مسالەها، اثبات‌ها یا طرح اثبات قضیەها
- پروژه (١٠ نمره): طرح یک مسالە، تلاش برای حل مساله با شبیەسازی، محاسبه، بررسی مثال، حدس، اثبات، ….گزارش مکتوب و شفاهی از کارهای انجام شده.

توضیحات

کسانی که طرح ارزشیابی پژوهشی را انتخاب می‌کنند، همراه درس یادگیری برخط درس سمینار نظریەی یادگیری را نیز خواهند گرفت و نمرەی درس سمینارشان همان نمرەی درس یادگیری برخط خواهد بود. به علت محدودیت در تصحیح و بررسی تمرین‌ها، امتحانات و پروژەها، ظرفیت درس محدود خواهد بود. ابتدا نوبت ثبت نام با دانشجویان تحصیلات تکمیلی است و پس از آن با توجه به ظرفیت باقیمانده، درخواست‌های دانشجویان کارشناسی بررسی و با ثبت نام تعدادی از آنها موافقت خواهد شد.