<div dir="ltr"><div dir="ltr">Reminder...this is tomorrow at noon.</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Nov 5, 2020 at 9:53 AM Aayush Bansal <<a href="mailto:aayushb@cs.cmu.edu">aayushb@cs.cmu.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><font color="#000000" face="arial, sans-serif">Oriol Vinyals (Google DeepMind) will be giving an online seminar on "Model-free vs Model-based Reinforcement Learning" from 12:00 noon - 01:00 PM ET on Nov 10.</font><div><font face="arial, sans-serif" color="#000000"><br></font></div><div><div><font color="#000000" face="arial, sans-serif"><u>Zoom Link</u>: <a href="https://cmu.zoom.us/j/95812775909?pwd=ZlBNbDdpbkNvVzFGZ0ZHbm03VVdBZz09" target="_blank">https://cmu.zoom.us/j/95812775909?pwd=ZlBNbDdpbkNvVzFGZ0ZHbm03VVdBZz09</a></font></div><div><font color="#000000" face="arial, sans-serif"><br></font></div><div><font color="#000000" face="arial, sans-serif">CMU AI Seminar is sponsored by Fortive. <br></font></div><div><div><div><font face="arial, sans-serif" color="#000000"><br></font></div><div><font face="arial, sans-serif" color="#000000">Following are the details of the talk:</font></div></div></div></div><div><font face="arial, sans-serif" color="#000000"><br></font></div><div><font color="#000000" face="arial, sans-serif"><b>Title: </b>Model-free vs Model-based Reinforcement Learning<br></font></div><div><font face="arial, sans-serif" color="#000000"><br></font></div><div><font color="#000000" face="arial, sans-serif"><b>Abstract: </b>In this talk, we will review model-free and model-based RL, two paradigms that have enabled global breakthroughs in AI research. This research included the ability to defeat professionals at the games of Go, Poker, StarCraft, or DOTA, and in other fields such as Robotics. Using the examples of the AlphaGo and AlphaStar agents, I'll present two approaches from these paradigms in RL and will conclude the talk by presenting some exciting new research directions that may unlock the power of model-based RL in a wider variety of environments, including stochastic, partial observable, with complex observation and action spaces.<br></font></div><div><font face="arial, sans-serif" color="#000000"><br></font></div><div><font face="arial, sans-serif" color="#000000"><br></font></div><div><font color="#000000" face="arial, sans-serif"><b>Bio:</b> Oriol Vinyals is a Principal Scientist at Google DeepMind and a team lead of the Deep Learning group. His work focuses on Deep Learning and Artificial Intelligence. Prior to joining DeepMind, Oriol was part of the Google Brain team. He holds a Ph.D. in EECS from the University of California, Berkeley, and is a recipient of the 2016 MIT TR35 innovator award. His research has been featured multiple times at the New York Times, Financial Times, WIRED, BBC, etc., and his articles have been cited over 90000 times. Some of his contributions such as seq2seq, knowledge distillation, or TensorFlow are used in Google Translate, Text-To-Speech, and Speech recognition, serving billions of queries every day, and he was the lead researcher of the AlphaStar project, creating an agent that defeated a top professional at the game of StarCraft, achieving Grandmaster level, also featured as the cover of Nature. At DeepMind he continues working on his areas of interest, which include artificial intelligence, with particular emphasis on machine learning, deep learning, and reinforcement learning.<br></font></div><div style="outline:none;padding:10px 0px;width:22px;margin:2px 0px 0px"><font color="#000000" face="arial, sans-serif"><br></font></div><div><font face="arial, sans-serif" color="#000000"><br></font></div><font face="arial, sans-serif" color="#000000"><div><div><div><div><div><font face="arial, sans-serif">To learn more about the seminar series, please visit the website: <a href="http://www.cs.cmu.edu/~aiseminar/" target="_blank">http://www.cs.cmu.edu/~aiseminar/</a></font></div></div></div></div><br></div></font><div><font color="#000000" face="arial, sans-serif"><br></font></div><font color="#000000" face="arial, sans-serif">-- <br></font><div dir="ltr"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div style="margin:0px;padding:0px 0px 20px;width:864px"><div><div style="margin:8px 0px 0px;padding:0px"><div><div dir="ltr"><div><font color="#000000" face="arial, sans-serif">Aayush Bansal<br></font></div><div><a href="http://www.cs.cmu.edu/~aayushb/" target="_blank"><font color="#000000" face="arial, sans-serif">http://www.cs.cmu.edu/~aayushb/</font></a></div><div style="font-size:medium"><br></div></div></div></div></div></div></div></div></div></div></div></div></div></blockquote></div><div dir="ltr" class="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div style="margin:0px;padding:0px 0px 20px;width:864px;font-family:Roboto,RobotoDraft,Helvetica,Arial,sans-serif"><div style="margin:8px 0px 0px;padding:0px"><div style="font-size:medium"></div><div style="font-size:medium"></div></div><div style="font-size:medium"></div></div></div></div></div></div></div>