<div dir="ltr">---------- Forwarded message ---------<br><div class="gmail_quote"><div dir="ltr"><div><div><div class="gmail_quote"><div dir="ltr" class="gmail_attr">From: <strong class="gmail_sendername" dir="auto">Linda Campbell</strong> <span dir="auto"><<a href="mailto:lv2c@andrew.cmu.edu" target="_blank">lv2c@andrew.cmu.edu</a>></span><br>Date: Thu, Nov 30, 2023 at 9:57 AM<br>Subject: S3D Seminar Series: Yi Wu - Friday 12/8<br>To:  <<a href="mailto:s3d-seminar@cs.cmu.edu" target="_blank">s3d-seminar@cs.cmu.edu</a>><br></div><br><br><div><div lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word"><div><p class="MsoNormal">S3D Seminar Series</p><p class="MsoNormal"> </p><p class="MsoNormal">Friday, December 8, 2023</p><p class="MsoNormal">12:00 p.m. – 1:15 p.m.  <a href="https://calendar.google.com/calendar/event?action=TEMPLATE&tmeid=MDYzM210bjJlcjIyaXBkdGRlY2M4NHV1Y2MgYW5kcmV3LmNtdS5lZHVfbjBscGtkaWFyYTJhdWhqaXVjbmpsbmVoYzhAZw&tmsrc=andrew.cmu.edu_n0lpkdiara2auhjiucnjlnehc8%40group.calendar.google.com" target="_blank">Google calendar</a></p><p class="MsoNormal">In person at TCS 358</p><p class="MsoNormal">Or online via Zoom:  <span style="color:red"><a href="https://cmu.zoom.us/j/93910552516?pwd=S1hRUXhJendVYzBEUC94dlNvd0Y2UT09" target="_blank"><span style="color:blue">https://cmu.zoom.us/j/93910552516?pwd=S1hRUXhJendVYzBEUC94dlNvd0Y2UT09</span></a></span><span><br></span><i style="background-color:rgb(255,255,0)">Lunch provided starting at 11:45 a.m.</i></p><p class="MsoNormal"><b>Title: </b> Language Model meets Reinforcement Learning: Building Strong Language Agents for Strategic Gameplay</p><p class="MsoNormal"><b>Speaker:  </b>Yi Wu, Assistant Professor, <span style="color:black">Institute for Interdisciplinary Information Sciences (IIIS), Tsinghua University</span></p><p class="MsoNormal"><b>Abstract:</b>  Thanks to the advances in large language models (LLM), there has been a recent trend to develop intelligent language agents for complex tasks. Most existing applications of language agents are purely LLM-based, i.e., by directly prompting LLMs to output actions. Although interesting emergent behaviors can be observed, their performances in complex multi-agent games can be limited due to the lack of domain-specific training. This talk will cover some recent projects in my group on developing language agents that can both yield strong gameplay performances and cooperate with real human players in challenging multi-agent games. The key idea is to combine language modeling and reinforcement learning. The language model will serve as an interface for reasoning and interpreting high-level commands while reinforcement learning helps substantially improve the gameplay performance of the agent. We demonstrate our agents in three domains, including an agent that can follow high-level commands to play a real-time strategy game, an Overcooked agent that can cooperate with humans via languages to cook dishes, and an agent that outperforms average human players in the Werewolf game. </p><pre><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:black">Bio: </span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> <span style="color:black">Yi Wu is now an assistant professor at the Institute for Interdisciplinary Information Sciences (IIIS) at Tsinghua University. He obtained his Ph.D. degree from UC Berkeley in 2019 under the supervision of Prof. Stuart Russell. Before moving back to Tsinghua, Yi was a full-time researcher at OpenAI. His research focuses on improving the generalization capabilities of learning agents. He is broadly interested in a variety of topics in AI, including multi-agent reinforcement learning, human-AI interaction, language grounding, and robot learning. His representative works include the MADDPG/MAPPO algorithm, OpenAI's hide-and-seek project, and the value iteration network, which won the best paper award at NIPS 2016.</span></span></pre><p class="MsoNormal"> </p><p class="MsoNormal"><img border="0" width="178" height="148" style="width:1.8489in;height:1.5416in" id="m_-6062672861712878825m_3372527174364757140Picture_x0020_2" src="cid:dd5e2d918efcd31f_0.1"></p><p class="MsoNormal"> </p><p class="MsoNormal" style="margin-bottom:12.0pt"><b><u><span>Upcoming S3D Seminar Series Talks</span></u></b></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt">February 7:  George Fairbanks*</span></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt">TBD:  Yesemin Acar*</span></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt">April 17:  Mani Srivastava*</span></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt">April 24:  Premkumar Devanbu*</span></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt">May 1:  David Rand* (joint with CSS)</span></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt"> </span></p><p class="MsoNormal"><span style="color:#3c4043;letter-spacing:.15pt">*indicates part of the Distinguished Speakers Series</span></p><p class="MsoNormal"> </p><p class="MsoNormal"> </p></div></div>
</div></div></div></div></div>
</div></div>