<div dir="ltr"><div>Hello everyone,</div><div><br></div><div>This is a reminder that this talk is tomorrow.</div><div><br></div><div>Best,</div><div>Ellen</div><br><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">Ellen Vitercik</b> <span dir="ltr"><<a href="mailto:vitercik@cs.cmu.edu">vitercik@cs.cmu.edu</a>></span><br>Date: Sat, Mar 26, 2016 at 1:41 PM<br>Subject: AI Lunch -- Shayan Doroudi -- March 29, 2016<br>To: <a href="mailto:ai-seminar-announce@cs.cmu.edu">ai-seminar-announce@cs.cmu.edu</a><br><br><br><div dir="ltr"><span style="font-size:12.8px">Dear faculty and students,</span><br style="font-size:12.8px"><br style="font-size:12.8px"><span style="font-size:12.8px">We look forward to seeing you this Tuesday, March 29th, at noon in NSH 3305 for AI lunch. To learn more about the seminar and lunch, or to volunteer to give a talk, please visit the </span><a href="http://www.cs.cmu.edu/~aiseminar/" style="font-size:12.8px" target="_blank">AI Lunch webpage</a><span style="font-size:12.8px">. <b>We are looking for someone to give a talk on April 12th.</b></span><br style="font-size:12.8px"><br style="font-size:12.8px"><span style="font-size:12.8px">On Tu</span>esday, Shayan Doroudi will give<span style="font-size:12.8px"> a t</span><span style="font-size:12.8px">alk titled "</span><span style="font-size:12.8px">Importance Sampling for Fair Policy Selection</span><span style="font-size:12.8px">."</span><br style="font-size:12.8px"><br style="font-size:12.8px"><b style="font-size:12.8px">Abstract</b><span style="font-size:12.8px">: </span><span style="font-size:12.8px">Importance sampling is a statistical technique that is used in batch reinforcement learning settings to give unbiased estimates of how well a policy will perform given data from another policy. In addition to evaluating policies, importance sampling has also been used for policy selection and policy search. In this talk, I show that importance sampling is unfair when used to choose policies; that is, in some cases it chooses the worse of two choices more than half of the time. I present several (possibly counterintuitive) examples of where this unfairness may be of practical concern. I then show that, in theory, we can make fair decisions with importance sampling by restricting attention to a particular class of policies. Using insights gathered from the theory, I present a practical policy search algorithm that uses importance sampling with a novel form of regularization.</span><div style="font-size:12.8px"><div><br></div><div>This is joint work with Emma Brunskill and Phil Thomas.</div><div><br></div></div><div style="font-size:12.8px"><span style="font-size:12.8px">Best,</span></div><div style="font-size:12.8px">Ellen and Ariel</div></div>
</div><br></div>