<div dir="ltr"><b><font size="4">Postdoctoral Researcher in </font><span lang="EN-US" style="line-height:14.95px;font-family:Calibri,sans-serif;color:black"><font size="4">Natural Language Processing with experience in software development based on microservices</font></span></b><br clear="all"><div><br></div><div>We are looking for a highly-motivated doctor to join the UC3M team working in the European IntelComp project (<a href="https://intelcomp.eu/" target="_blank">https://intelcomp.eu/</a>). The role of the selected candidate will involve research on Natural Language Processing for Science, Technology and Innovation (STI)-related texts, SW implementation for dockerized environments, as well as support in the technical coordination of the project.<i><b><br></b></i></div><div><i><b><br></b></i></div><div><i><b>IntelComp project description:</b></i></div><div><br></div><div>The objective of IntelComp is to deliver a platform that provides tools for assisting the whole spectrum of STI policy, i.e., agenda setting, modeling design, implementation, monitoring and evaluation. It will do so by involving multi-disciplinary teams to co-develop innovative analytics services, Natural Language Processing pipelines and Artificial Intelligence workflows and by exploiting open data, services and computational resources from the EOSC, HPC environments and federated distributed operations at the European Union, national and regional level.<br></div><br>IntelComp will adopt a living labs approach, targeting the following three domains: Artificial Intelligence, Climate Change and Health.<div><br></div><div><div><i><b>Research Group:</b></i></div><div><br></div><div>The Machine Learning for Data Science (ML4DS) research group of University Carlos III de Madrid has a background of over 20 years in R+D+i in the field of Machine Learning and its applications to Data Analysis and Information Processing. It is a reference in Spain as an early adopter and developer of cutting edge technologies, and their transfer to society through numerous research projects and contracts with companies from the private sector. It is currently working on important challenges to make Machine Learning more scalable and accessible to the final users. IntelComp is aligned with these objectives, since it addresses the training of models with tens of millions of documents from the STI field, and the implementation of tools to facilitate the construction of these models by experts from a variety of research fields.</div><div><br></div><div><div><i><b>Responsibilities:</b></i></div><div><br></div></div></div><div>- Design and application of analysis algorithms based on topic models and graphs. Algorithm parallelization and GPU-based implementation.<br>- Design of procedures to facilitate the construction and use of topic models and graphs by domain experts (AI, climate change, health), and the construction of analysis tools by the end users of the platform (policy makers).</div><div>- Participation in the living labs of the project.<br>- Deployment in microservices-based environments (docker, kubernetes).<br>- Automation and parallelization of corpus generation processes: crawling subsystems, ingestion in the project database, etc. </div><div>- Application of preprocessing techniques for documents and texts, automatic translation pipelines and natural language preprocessing, etc.<br>- Dissemination of results through research papers, participation in dissemination sessions, workshops, etc.<br></div><div><br></div><div><i><b>Candidate profile: </b></i></div><div><i><b><br></b></i></div><div>- PhD in Natural Language Processing or similar.<br>- Excellent research record in these areas: Machine Learning, Natural Language Processing, Topic Modeling, ML applications for STI, ML with graphs.<br>- Demonstrable contributions to SW projects in the aforementioned areas.<br>- Python expertise, especially with NLP and ML libraries (scikit-learn, pandas, Dask, nltk, spaCy, etc.), as well as Deep Learning (pytorch, tensorflow).</div><div>- Advanced knowledge of web-oriented programming languages and libraries (JavaScript, D3.js ...).<br>- Advanced knowledge of databases (SQL, MongoDB ...).<br>- Experience in software development / integration in dockerized environments. DevOps experience (kubernetes, ansible) oriented to SW development (not systems administration).<br>- Awards and other academic distinctions.<br></div><div><br></div><div><div><i><b>Description of job position and benefits:</b></i></div><div><i><b><br></b></i></div><div>- Gross salary of 37972,44 EUR/year</div><div>- Employment 1 year with the possibility of extension for a second year.</div><div>- Work on a multidisciplinary project made up of 13 beneficiary teams from different countries and varied profiles (ML, NLP, HPC, STI experts, policy makers consultants and implementers, etc.).</div><div>- Economic support for professional related travel and research needs.</div><div><br></div><div><u>Applications must be received by September 6th, 2021.</u></div><div>The position will start on October 1st, 2021 (starting date is flexible).<br></div><div><br></div><div><b><i>Further information:</i></b></div><div>Dr. Jerónimo Arenas-García: <a href="mailto:jarenas@ing.uc3m.es" target="_blank">jarenas@ing.uc3m.es</a></div><div><br></div><div><b><i>Application:</i></b></div><div>Additional information is provided <a href="https://aplicaciones.uc3m.es/ConvocatoriasSI/publico/getFichero.htm?numidfichero=1593350" target="_blank">here</a>. </div><div>Applications need to be submitted electronically through the <a href="https://aplicaciones.uc3m.es/ConvocatoriasSI/publico/detalleConvocatoria/485162.htm" target="_blank">UC3M website</a> accompanied by: </div><div>- Copy of National Identity document or passport</div><div>- Curriculum and supporting documentation of the merits provided</div><div>- Copy of PhD degree title</div></div><div><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">JERONIMO ARENAS GARCIA<br>Universidad Carlos III de Madrid</div></div>