<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>Dear everyone,</div><div><br></div><div>This is a reminder that the&nbsp;Computational Linguistics and Natural Language Processing lunch will be held this Wednesday at noon in GHC 4405. &nbsp;Jacob Eisenstein will be speaking about studying geographic linguistic variation from text, details below. &nbsp;Lunch will be served, as usual :-).</div><div><br>Best,<br>Nathan &amp; Ben<br><br>--</div><div><br></div><div>CL+NLP Lunch<br><b>Wednesday, December 1<br>GHC 4405</b><br>12pm-1:30pm<br><br><b>Jacob Eisenstein</b><br>Postdoc, CMU Machine Learning Department<br></div><div><br></div><div><br></div><div>TITLE: <b>Large-Scale Dialectology and Sociolinguistics from Social Media</b><br><br>ABSTRACT: Sociolinguistics and dialectology study how language varies&nbsp;across socially-distinct groups of speakers. While these fields&nbsp;feature a strong quantitative tradition, the standard methodology&nbsp;requires the researcher to specify the linguistic dimensions of&nbsp;variability in advance -- before correlating them against&nbsp;extra-linguistic factors. Moreover, much of this work depends on&nbsp;interviews for gathering data, raising problematic issues of how to&nbsp;elicit "truly" vernacular speech. However, the rapid growth of social&nbsp;media offers exciting new possibilities for the study of&nbsp;socially-oriented linguistic variation.</div><div><br></div><div>Using a new corpus of&nbsp;geo-tagged text from Twitter, we have developed two computational&nbsp;techniques for studying linguistic variation from raw text. These&nbsp;methods are capable of identifying both coherent linguistic&nbsp;communities as well as specific lexical features that distinguish&nbsp;social and geographical groups. Applying these methods to Twitter, we&nbsp;have discovered new and robust lexical-geographic relationships that&nbsp;were undocumented in prior work. In addition, we are able to use raw&nbsp;text to accurately predict metadata such as the geographic location of&nbsp;social media content authors.</div><div><br></div><div>Speaker bio:</div><div>Jacob Eisenstein is a postdoctoral fellow in the Machine Learning&nbsp;Department at Carnegie Mellon University. His research focuses on machine&nbsp;learning for discourse, non-verbal communication, and social media. Jacob&nbsp;completed his Ph.D. at MIT in 2008, winning the George M. Sprowls award&nbsp;for his dissertation, “Gesture in Automatic Discourse Processing.”</div><div><br></div><div><a href="http://www.cs.cmu.edu/%7Enlp-lunch/" target="_blank">http://www.cs.cmu.edu/~nlp-lunch/</a></div><div><br></div><br><div>
<span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>--</div><div>Benjamin Lambert</div><div>Ph.D. Student of Computer Science</div><div>Carnegie Mellon University</div><div><a href="http://www.cs.cmu.edu/~belamber">www.cs.cmu.edu/~belamber</a></div><div>Mobile: 617-869-1844</div><div><br></div></div></span></div></span></div></span></div></span></div></span></div></span><br></span></div></body></html>