بهترین آموزش ها، مثال ها، پروژه ها و دوره های آموزشی تقویتی

  • 2022-07-11

در یادگیری تقویتی، سیستم شما می آموزد که چگونه با انجام کارها و تماشای آنچه اتفاق می افتد به طور مستقیم با محیط تعامل داشته باشد - اما بدیهی است که چیزهای بیشتری در آن وجود دارد.

اگر به RL علاقه مند هستید، این مقاله تعداد زیادی محتوای جدید را برای کشف این مفهوم در اختیار شما قرار می دهد. در چند سال گذشته کارهای زیادی با یادگیری تقویتی انجام شده است و من برخی از جالب ترین مقالات، ویدیوها و موارد استفاده را با ارائه مفاهیم، رویکردها و روش های مختلف جمع آوری کرده ام.

در این لیست خواهید یافت:

  • آموزش های تقویتی،
  • نمونه هایی از جایی که می توان از یادگیری تقویتی استفاده کرد،
  • پروژه های یادگیری تقویتی جالب،
  • دوره هایی برای تسلط بر یادگیری تقویتی

همه این مطالب به شما کمک می کند تا از مبتدی RL به RL pro بروید.

آموزش های تقویتی

1. RL with Mario Bros – در این آموزش منحصربفرد بر اساس یکی از محبوب ترین بازی های آرکید تمام دوران – Super Mario – در مورد یادگیری تقویتی بیاموزید.

2. یادگیری ماشینی برای انسان ها: یادگیری تقویتی - این آموزش بخشی از کتاب الکترونیکی با عنوان "یادگیری ماشینی برای انسان ها" است. مفهوم اصلی یادگیری تقویتی را توضیح می دهد. مثال‌های متعدد، راهنمایی در مورد گام بعدی که در آینده الگوریتم‌های یادگیری تقویتی باید دنبال شود، و توضیح تصویری آسان برای دنبال کردن وجود دارد.

3. مقدمه ای بر یادگیری تقویتی - در اینجا دانش زیادی وجود دارد که با وضوح و اشتیاق فراوان توضیح داده شده است. با مروری بر یادگیری تقویتی با فرآیندها و وظایف آن شروع می شود، رویکردهای مختلف یادگیری تقویتی را بررسی می کند و با مقدمه ای اساسی از یادگیری تقویتی عمیق پایان می یابد.

4. یادگیری تقویتی از ابتدا – این مقاله شما را با فرآیند یادگیری RL از ابتدا توسط نویسنده آشنا می کند. نویسنده دانش زیادی از یادگیری تقویتی عمیق از کار در Unity Technologies دارد. حتی مبتدیان نیز قادر خواهند بود دیدگاه کلی او را از مفاهیم اصلی یادگیری تقویتی درک کنند.

5- یادگیری تقویت عمیق برای معاملات خودکار سهام - در اینجا شما می توانید با استفاده از یادگیری تقویت کننده ، یک راه حل برای یک استراتژی تجارت سهام پیدا کنید ، که روند سرمایه گذاری را بهینه می کند و بازده سرمایه گذاری را به حداکثر می رساند. مقاله شامل یک توضیح مناسب در مورد سه الگوریتم ترکیبی است: بهینه سازی سیاست پروگزیمال (PPO) ، بازیگر مزیت-انتقادی (A2C) و شیب سیاست قطعی عمیق (DDPG). بهترین های هر الگوریتم برای ارائه راه حلی برای استراتژی های بهینه شده تجارت سهام هماهنگ شده است.

6. کاربردهای یادگیری تقویت در دنیای واقعی-بررسی کنید که چارچوب های یادگیری تقویت کننده در هنگام طراحی مدل های تصمیم گیری ، کم ارزش هستند. یک مطالعه دقیق از برنامه های RL در پروژه های دنیای واقعی ، توضیح اینکه چارچوب یادگیری تقویت کننده چیست ، و لیست استفاده های آن در محیط های دنیای واقعی را نشان می دهد. این برنامه ها را به 8 زمینه یادگیری ، متشکل از موضوعاتی مانند یادگیری ماشین ، یادگیری عمیق ، بازی های رایانه ای و موارد دیگر باریک می کند. نویسنده همچنین به بررسی رابطه RL با سایر رشته ها می پردازد و در مورد آینده RL بحث می کند.

7. RL عملی-این repo github یک دوره منبع باز در مورد یادگیری تقویت است که در چندین دانشگاه دانشگاه تدریس می شود. این repo برای حمایت از دانشجویان آنلاین با گزینه دو محلی - روسی و انگلیسی حفظ می شود. این دوره دارای خدماتی مانند اتاق های گپ ، طبقه بندی ، سؤالات متداول ، فرم های بازخورد و یک محیط دوره مجازی است. برنامه درسی دوره همه چیز را از اصول اولیه RL گرفته تا بحث و اجرای مدلهای مختلف ، روشها و موارد دیگر پوشش می دهد.

8. یادگیری تقویت ساده با TensorFlow قسمت 0: یادگیری Q با جداول و شبکه های عصبی-قسمت اول یک سری آموزش در مورد یادگیری تقویت با Tensorflow. نویسنده به بررسی الگوریتم های یادگیری Q ، یکی از خانواده های الگوریتم های RL می پردازد. نسخه ساده نگاه جدولی الگوریتم ابتدا اجرا می شود. راهنمایی دقیق در مورد اجرای شبکه های عصبی با استفاده از رویکرد TensorFlow Q-Algorithm به طور قطع ارزش علاقه شما را دارد.

نمونه هایی از مکان استفاده از یادگیری تقویت

1. مهندسی موشک - چگونگی استفاده از یادگیری تقویت در زمینه توسعه موتور موشک را بررسی کنید. اطلاعات ارزشمندی زیادی در مورد استفاده از یادگیری ماشین در صنایع تولیدی پیدا خواهید کرد. ببینید که چرا یادگیری تقویت کننده نسبت به سایر الگوریتم های یادگیری ماشین هنگام تولید موتورهای موشک مورد علاقه است.

2. کنترل چراغ راهنمایی - این سایت مقالات تحقیقاتی متعدد و نمونه های پروژه را ارائه می دهد که استفاده از یادگیری تقویت کننده اصلی و یادگیری تقویت عمیق در کنترل چراغ راهنمایی را نشان می دهد. این آموزش ، مجموعه داده ها و مقالات نمونه مربوطه است که از RL به عنوان ستون فقرات استفاده می کنند تا بتوانید یافته جدیدی را از خود بدست آورید.

3. بازاریابی و تبلیغات-ببینید که چگونه یک سیستم هوش مصنوعی از یک مجموعه داده از قبل موجود یاد بگیرید که ممکن است غیرقابل نفوذ یا در دسترس نباشد ، و چگونه می توان هوش مصنوعی را در زمان واقعی با ایجاد محتوای تبلیغاتی یاد گرفت. این جایی است که آنها از یادگیری تقویت شده استفاده کرده اند.

4- یادگیری تقویت در بازاریابی |توسط Deepthi A R - این مثال بر تغییر پویایی تجارت که بازاریابان برای سازگاری با آن نیاز دارند ، تمرکز دارد. هوش مصنوعی مجهز به یک طرح یادگیری تقویت می تواند از تغییرات در زمان واقعی بیاموزد و به تدوین یک استراتژی مناسب برای بازاریابی کمک کند. در این مقاله ، تغییر محیط کسب و کار به عنوان یک مشکل و یادگیری تقویت به عنوان راه حلی برای آن برجسته شده است.

5- روباتیک - این ویدئو نشان دهنده استفاده از یادگیری تقویت شده در روباتیک است. هدف نشان دادن اجرای عوامل یادگیری تقویت کننده خودمختار برای روباتیک است. نمونه بارز استفاده از یادگیری تقویت در روباتیک.

6. توصیه - سیستم های توصیه به طور گسترده در سایت های تجارت الکترونیک و تجاری برای تبلیغات محصول استفاده می شوند. همیشه یک بخش توصیه در بسیاری از سیستم عامل های محبوب مانند YouTube ، Google و غیره نمایش داده می شود. توانایی هوش مصنوعی برای یادگیری از تعامل کاربر در زمان واقعی ، و سپس به آنها محتوا را پیشنهاد می کند ، بدون یادگیری تقویت کننده امکان پذیر نبود. این مقاله استفاده از الگوریتم های یادگیری تقویت و پیاده سازی های عملی را در سیستم های توصیه نشان می دهد.

7. بهداشت و درمان-بهداشت و درمان یک صنعت بزرگ است و بسیاری از فناوری های پیشرفته به آن محدود شده است ، جایی که استفاده از هوش مصنوعی جدید نیست. سوال اصلی در اینجا نحوه بهینه سازی هوش مصنوعی در مراقبت های بهداشتی و یادگیری آن بر اساس تجربیات در زمان واقعی است. این جایی است که یادگیری تقویت کننده وارد می شود. یادگیری تقویت کننده دارای ارزش غیرقابل انکار برای مراقبت های بهداشتی است ، با توانایی آن در تنظیم رفتارهای نهایی. با استفاده از RL ، سیستم های بهداشت و درمان می توانند با کاهش هزینه ها ، درمان دقیق تر و دقیق تری را ارائه دهند.

8. NLP - این مقاله استفاده از یادگیری تقویت را در ترکیب با پردازش زبان طبیعی نشان می دهد تا یک سؤال و پاسخ به بازی ماجراجویی را بزنید. این مثال ممکن است الهام بخش برای فراگیران باشد که درگیر راه حل های پردازش زبان طبیعی و بازی هستند.

9. تجارت - یادگیری تقویت عمیق نیرویی است که می توانید در هنگام بازار تجارت سهام با آن حساب کنید. مثال در اینجا نشان می دهد که چگونه می توان از تکنیک های یادگیری تقویت کننده عمیق برای تجزیه و تحلیل بازار تجارت سهام و ارائه گزارش های سرمایه گذاری مناسب استفاده کرد. فقط یک هوش مصنوعی مجهز به یادگیری تقویت می تواند گزارش های دقیق بازار سهام را ارائه دهد.

پروژه های جالب یادگیری تقویت

1. کارلا-کارلا یک شبیه ساز منبع باز برای تحقیقات رانندگی خودمختار است. هدف اصلی کارلا پشتیبانی از توسعه ، آموزش و اعتبار سنجی سیستم های رانندگی خودمختار است. با بسته بندی کد و پروتکل های منبع باز ، کارلا دارایی های دیجیتالی را فراهم می کند که از آن استفاده می کنند. اکوسیستم کارلا همچنین برای تقویت نقشه ها با چراغ راهنمایی و اطلاعات علائم راهنمایی و رانندگی ، کد را برای اجرای مدل های یادگیری تقویت کننده مشروط ، با GUI مستقل ، ادغام می کند.

2. یادگیری عمیق پرنده پرنده - اگر می خواهید در مورد الگوریتم های یادگیری عمیق Q به روشی جالب بیاموزید ، پس این repo github برای شما مناسب است. این پروژه از یک شبکه Q عمیق برای یادگیری نحوه بازی پرنده Flappy استفاده می کند. این مفهوم الگوریتم یادگیری عمیق Q است که در خانواده یادگیری تقویت است.

3. Tensorforce-این پروژه یک چارچوب یادگیری تقویت کننده عمیق با منبع باز تخصصی در طراحی کتابخانه انعطاف پذیر ماژولار و قابلیت استفاده مستقیم برای برنامه های تحقیق و عمل ارائه می دهد. در بالای چارچوب TensorFlow Google ساخته شده است. این برنامه دارای اجرای طراحی سطح بالا مانند طراحی مبتنی بر مؤلفه ماژولار ، جداسازی الگوریتم و کاربرد RL و مدلهای Tensorflow تمام عیار است.

4- هدف اصلی ری تهیه API های جهانی برای ساخت برنامه های توزیع شده است. این پروژه از بسته RLLIB استفاده می کند ، که یک کتابخانه یادگیری تقویت کننده مقیاس پذیر است که باعث تسریع بار کاری یادگیری ماشین می شود.

5- Neurojs - JavaScript محبوب است و برای توسعه وب سایت ها ضروری است. اگر نیاز به یادگیری تقویت کننده در پروژه وب JS خود داشته باشید ، چه می کنید؟سلام به Neurojs ، یک چارچوب JavaScript برای یادگیری عمیق در مرورگر با استفاده از یادگیری تقویت کننده. همچنین می تواند برخی از کارهای شبکه عصبی را نیز انجام دهد.

6. ماریو هوش مصنوعی - اگر به دنبال یک پروژه با الگوریتم های یادگیری تقویت کننده برای شبیه سازی بازی ها هستید ، مطمئناً علاقه شما را جلب خواهد کرد. Mario AI برای آموزش مدلی که سطح اول Super Mario World را به طور خودکار بازی می کند ، با استفاده از پیکسل های خام به عنوان ورودی ، یک برنامه کدگذاری را ارائه می دهد. الگوریتم اعمال شده یک الگوریتم عمیق Q-Learning در خانواده الگوریتم های یادگیری تقویت است.

7. نماینده تجارت عمیق-پروژه منبع باز که یک نماینده تجاری مبتنی بر یادگیری تقویت شده برای بیت کوین را ارائه می دهد. این پروژه از شبکه DeepSense برای تقریب عملکرد Q استفاده می کند. هدف این است که فرایند تجارت را با استفاده از یک الگوریتم یادگیری تقویت کننده بهینه سازی عامل عمیق یادگیری Q ساده کنید. این می تواند منبع بزرگی از دانش باشد.

8. PWNAGOTCHI - اگر شما با استفاده از تکنیک های یادگیری عمیق تقویت ، این پروژه ذهن شما را به هم می زند. PWNAGOTCHI سیستمی است که از محیط Wi-Fi اطراف خود یاد می گیرد تا حداکثر مواد کلیدی WPA را که ضبط می کند به حداکثر برساند. بر خلاف اکثر سیستم های مبتنی بر یادگیری تقویت ، Pwnagotchi پارامترهای خود را با گذشت زمان تقویت می کند تا در ترکیدن شبکه های WiFi در محیط هایی که در معرض آن قرار می گیرند بهتر شود.

دوره هایی برای یادگیری تقویت

1. تخصص یادگیری تقویت (Coursera) - یکی از بهترین دوره های موجود در بازار. این دوره با داشتن رتبه کلی 4. 8 ستاره و 21000+ دانش آموز که قبلاً ثبت نام کرده اند ، به شما کمک می کند تا مفاهیم یادگیری تقویت را تسلط دهید. شما یاد می گیرید که چگونه یک راه حل کامل RL را پیاده سازی کنید و از کاربرد آن برای حل مشکلات دنیای واقعی توجه کنید. در پایان این دوره ، شما قادر خواهید بود وظایف را به عنوان یک مشکل یادگیری تقویت کننده و راه حل های مناسب آن رسمی کنید ، مفاهیم الگوریتم های RL را درک کنید ، و اینکه چگونه RL در زیر چتر گسترده تر یادگیری ماشین قرار می گیرد.

2. یادگیری تقویت در پایتون (Udemy) - این یک دوره حق بیمه است که توسط Udemy با قیمت 29. 99 دلار ارائه می شود. این امتیاز در کل 4. 5 ستاره با بیش از 39000 زبان آموز ثبت نام کرده است. این دوره یک زمین بازی یادگیری برای کسانی است که به دنبال اجرای یک راه حل هوش مصنوعی با یادگیری تقویت شده در برنامه نویسی پایتون هستند. از طریق پیاده سازی های نظری و عملی ، شما می آموزید که روشهای یادگیری ماشین مبتنی بر شیب را برای یادگیری تقویت ، برنامه نویسی الگوریتم های یادگیری تقویت کننده متعدد استفاده کنید و همچنین رابطه بین RL و روانشناسی را بدانید.

3. یادگیری تقویت کننده عملی (Coursera) - با رتبه بندی 4. 2 و 37،000+زبان آموز ، این دوره بخش اساسی تخصص یادگیری ماشین پیشرفته است. شما تضمین می کنید که از اجرای عملی الگوریتم های RL آگاهی کسب کنید. شما در مورد پایه های روش های RL و استفاده از فناوری های شبکه عصبی برای RL بینش خواهید گرفت. یک بخش جالب آموزش شبکه های عصبی برای انجام بازی به تنهایی با استفاده از RL است.

4- درک الگوریتم ها برای یادگیری تقویت - اگر شما در زمینه یادگیری تقویت کننده کاملاً مبتدی هستید ، این ممکن است بهترین دوره برای شما باشد. با داشتن امتیاز کلی 4. 0 ستاره و مدت زمان تقریباً 3 ساعت در سکوی PluralSight ، این دوره می تواند راهی سریع برای شروع خود با الگوریتم های یادگیری تقویت باشد. شما می توانید اطلاعات عمیقی در مورد الگوریتم ها برای یادگیری تقویت ، اصول اساسی الگوریتم های یادگیری تقویت ، طبقه بندی RL و الگوریتم های خانواده RL مانند Q-Learning و Sarsa دریافت کنید.

5- یادگیری تقویت شده توسط Georgia Tech (UDacity) - یکی از بهترین دوره های رایگان موجود ، که توسط Georgia Tech از طریق پلت فرم UDacity ارائه شده است. این دوره برای کسانی که به دنبال درک دنیای یادگیری ماشین و هوش مصنوعی از دیدگاه نظری هستند ، تدوین شده است. این بینش غنی از تحقیقات اخیر در مورد یادگیری تقویت کننده ارائه می دهد ، که به شما در کشف مدلهای تصمیم گیری خودکار کمک می کند.

6. زمستان یادگیری تقویت (آموزش استنفورد) - این دوره توسط دانشگاه استنفورد به عنوان یک جلسه زمستانی ارائه می شود. برخی از الزامات اساسی برای این دوره وجود دارد ، مانند مهارت برنامه نویسی پایتون ، دانش جبر خطی و حساب ، مبانی آمار و احتمال و اصول اولیه یادگیری ماشین. این دوره سخنرانی های هنری را ارائه می دهد. در پایان ، شما قادر خواهید بود ویژگی های کلیدی RL ، برنامه های RL را در مورد مشکلات دنیای واقعی ، اجرای برنامه نویسی الگوریتم های RL تعریف کنید و دانش عمیقی از الگوریتم های RL داشته باشید. این دوره برای کسانی که به دنبال منابع یادگیری سطح پیشرفته در اکوسیستم RL هستند مناسب است.

7. هوش مصنوعی پیشرفته: یادگیری تقویتی عمیق با پایتون – اگر به دنبال یک دوره پیشرفته سطح بالا در زمینه یادگیری تقویتی هستید، بدون شک این بهترین دوره موجود در پلتفرم Udemy برای شماست. این یک دوره آموزشی ممتاز با برچسب قیمت 29. 99 دلار، امتیاز 4. 6 ستاره است که بیش از 32000 دانش آموز در سراسر جهان را سرگرم می کند. این فقط در مورد یادگیری تقویتی در سطح پایه نیست، بلکه یادگیری تقویتی عمیق با اجرای عملی آن با استفاده از برنامه نویسی پایتون است. اجرای عملی عوامل یادگیری عمیق، الگوریتم‌های یادگیری Q، شبکه‌های عصبی عمیق، شبکه‌های RBF، شبکه‌های عصبی کانولوشنال با یادگیری عمیق Q از جمله موارد اصلی این دوره هستند.

8. آموزش تقویتی عملی - یکی دیگر از دوره های محبوب ارائه شده توسط Coursera، بهترین برای کسانی که به دنبال دانش عملی یادگیری تقویتی هستند. دارای امتیاز کلی 4. 2 ستاره با بیش از 37000 دانش آموز در حال حاضر ثبت نام شده است.

منتظر چی هستی؟شروع به یادگیری!

امیدواریم این منابع به شما کمک کند تا درک عمیقی از یادگیری تقویتی و کاربردهای عملی آن در دنیای واقعی داشته باشید.

RL بخش جذابی از یادگیری ماشینی است و ارزش آن را دارد که وقت خود را برای تسلط بر آن صرف کنید. موفق باشید!

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.