ابزار کاربر

ابزار سایت


دانشکده:دروس:22855:14001:main

یادگیری برخط - نیم‌سال اول ۱۴۰۰

مدرسین ایمیل
محمدهادی فروغمند foroughmand@sharif.ir
کسری علیشاهی alishahi@sharif.ir

اهداف درس

درس همزمان جنبەی آموزشی و پژوهشی دارد. یکی از اهداف مهم کسب آمادگی برای دنبال کردن مقالات و ادبیات روز در موضوع یادگیری برخط، پژوهش در زمینەهای نزدیک و به کارگیری این ایدەها در مدل‌سازی و ارایەی راه حل برای مسالەهای واقعی است.

شرح مختصر درس

تصمیم‌گیری در حضور عدم قطعیت، چالشی همیشگی، با اهمیت و همراه با کابردهای روزافزون است. یادگیری برخط چارچوبی است برای مدل‌سازی و طراحی فرآیند تصمیم‌گیری در دنبالەای از موقعیت‌ها، بر مبنای اطلاعاتی (نه لزوماکامل) از تصمیم‌های قبلی و نتایج آن‌ها. در این فرآیند، یادگیرنده هم‌زمان که پیامدهای تصمیم‌های مختلف را می‌آموزد، هزینەی این تصمیم‌ها را نیز پرداخت می‌کند و بنابراین مسالەی اصلی برقراری توازنی است میان تصمیم‌هایی که منجر به کشف بهتر محیط می‌شوند (اکتشاف) و آنهایی‌که بر مبنای آنچه تا کنون آموختەایم کمترین هزینە را دارند (بهرەبرداری). دستەی خاصی از مسالەهای یادگیری برخط، با عنوان مسالەهای بندیت، در سال‌های اخیر مورد توجه زیادی قرارگرفتەاند و پژوهش‌های انجام شده دربارەی آنها، نظریەای غنی به وجود آورده که نویدبخش پیشرفت‌های اساسی در یادگیری برخط و حوزەهای مرتبط مانند یادگیری تقویتی در آیندەی نزدیک است.

سرفصل‌ها

  • مقدمه
    • بازی حدس زدن!
    • مشاوره با مشاوران!
    • بندیت چنددستەی
  • کاهش گرادیان برخط
    • رگرسیون برخط
  • ارتباط یادگیری برخط و یادگیری کلاسیک
    • ارتباط پشیمانی و PAC
    • مسالەی دستەبندی برخط
  • بازخورد محدود
    • بندیت چنددستەای و الگوریتم EXP3
    • بندیت زمینەای و الگوریتم EXP4
    • بندیت خطی
    • بندیت‌های ترکیبیاتی
    • بندیت ناایستا
  • کاهش آیینەای
    • بەروزرسانی ضربی وزن‌ها
    • EXP3
  • پیروی از پیشروی منظم‌شده
    • مسیریابی درگراف
  • مسالەها و مباحث انتخابی …

پیش‌نیازها

تسلط به احتمال و توانایی اولیه در انجام آزمایش و شبیەسازی کامپیوتری ضروری است. آشنایی هرچه بیشتر با فرآیندهای تصادفی، آمار و یادگیری، الگوریتم، بهینەسازی (محدب)، نظریەی بازی‌ها برای پیگیری درس مفید است.

منابع

  • [1] Shalev-Shwartz, Shai. Online learning and online convex optimization. Foundations and trends in Machine Learning 4.2 (2011): 107-194.
  • [2] Elad Hazan. Introduction to Online Convex Optimization, Now Publishers, .2016
  • [3] Tor Lattimore, Csaba Szepesvari. Bandit Algorithms. Cambridge University Press, 2020.
  • [4] Francesco Orabona A Modern Introduction to Online Learning. 2021

ارزشیابی

  • طرح الف) آموزشی
    • تمرین (۶ نمره): دو یا سه سری تمرین تحویلی
    • امتحان پایان‌ترم (٧ نمره): امتحانی شفاهی از مفاهیم، مسالەها، اثبات‌ها یا طرح اثبات قضیەها
    • امتحان خانەبَر (٨ نمره): امتحانی برای حل مسالەهای سخت!
  • طرح ب) پژوهشی
    • تمرین (۶ نمره): دو یا سه سری تمرین تحویلی
    • امتحان پایان‌ترم (٧ نمره): امتحانی شفاهی از مفاهیم، مسالەها، اثبات‌ها یا طرح اثبات قضیەها
    • پروژه (١٠ نمره): طرح یک مسالە، تلاش برای حل مساله با شبیەسازی، محاسبه، بررسی مثال، حدس، اثبات، ….گزارش مکتوب و شفاهی از کارهای انجام شده.


توضیحات

کسانی که طرح ارزشیابی پژوهشی را انتخاب می‌کنند، همراه درس یادگیری برخط درس سمینار نظریەی یادگیری را نیز خواهند گرفت و نمرەی درس سمینارشان همان نمرەی درس یادگیری برخط خواهد بود. به علت محدودیت در تصحیح و بررسی تمرین‌ها، امتحانات و پروژەها، ظرفیت درس محدود خواهد بود. ابتدا نوبت ثبت نام با دانشجویان تحصیلات تکمیلی است و پس از آن با توجه به ظرفیت باقیمانده، درخواست‌های دانشجویان کارشناسی بررسی و با ثبت نام تعدادی از آنها موافقت خواهد شد.

/opt/bitnami/dokuwiki/data/pages/دانشکده/دروس/22855/14001/main.txt · آخرین ویرایش: 2022/09/07 10:44 توسط 127.0.0.1

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki