<div dir="ltr"><div>Automatic extraction of medications in tweets @ BioCreative VII - track 3</div><div><br></div><div>The goal of this task is to extract the spans of medications in tweets. The dataset consists of all tweets posted by 212 Twitter users. This data represents the natural and highly imbalanced distribution of drug mentions on Twitter, with only approximately 0.2% of the tweets mentioning a medication. Training and evaluating a sequence labeler on this data set will closely model the detection of drugs in tweets in practice. See <a href="https://biocreative.bioinformatics.udel.edu/tasks/biocreative-vii/track-3/">BioCreative - Task 3</a> for more information.</div><div><br></div><div>In short: <br></div>      •     212 Twitter user timelines (~200,000 tweets) annotated with the spans of medications (timelines have their natural and highly imbalanced distribution, ~0.2% of the tweets mention a medication)<br>      •     Additional balanced dataset of tweets available (4,975+/4,648-)<br>       •     Baseline system available<br>     •     Codalab opened at <a href="https://competitions.codalab.org/competitions/23925">https://competitions.codalab.org/competitions/23925</a><br> •     Evaluation period: Sept. 1st, 9:00 UTC - Sept. 4th, 23:59 UTC<br><br>[Apologies for cross-posting]<br><br>Best regards,<br>Davy</div>