<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>
<div style="font-family: -webkit-standard;">NASA Funding Opportunity for Early Career Faculty in Big Data, Machine Learning, Artificial Intelligence for NASA Data Challenges</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">Please see <a href="http://tinyurl.com/NASA-17ECF">http://tinyurl.com/NASA-17ECF</a> for listing of four topics, including "Big Data and Artificial Intelligence Solutions for NASA Data Challenges" (provided below
 for reference) as well as general program information, eligibility, proposal requirements, and other relevant information.</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">For questions, please e-mail <a href="mailto:hq-ecf-call@mail.nasa.gov">hq-ecf-call@mail.nasa.gov</a>. </div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">Due dates:</div>
<div style="font-family: -webkit-standard;">NOIs (strongly encouraged): March 3, 2017 (5PM Eastern)</div>
<div style="font-family: -webkit-standard;">Proposals: March 31, 2017 (5PM Eastern, 2PM Pacific)</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">-----</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">Topic 4 - Big Data and Artificial Intelligence Solutions for NASA Data Challenges</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">The objective of this topic is to develop and apply advanced data science methodologies, such as predictive analytics and machine learning, to aid domain experts in discovering new insights for NASA science and exploration---called
 computer-aided insight generation.</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">NASA invests significant resources in collecting and storing two primary types of large, heterogeneous datasets from space exploration and science missions. The first type of data, referred to as science data, are
 data that directly relate to the science objective of the mission, such as Earth science data collected by satellite instruments. Other science data, as distinct from direct observations, could be predictions of physical phenomena from modeling and simulations.
 The second type of data, referred to as operations data, are data that represent the operational state and health of the spacecraft systems and instruments that support the collection of the science data. </div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">NASA’s science data are designed to provide insight into physical processes and advance scientific disciplines. While traditional analysis approaches such as those focused on physics-based modeling have yielded transformative
 insights, science data may be under-utilized, particularly as the scale, complexity, and multi-disciplinary nature of the data and phenomena grow. NASA has substantial operations data from science missions that are often critical to perform the science reconstruction
 and generate science data products, but are even more valuable when they are transformed into useful insights and knowledge that can inform improvements for current and future missions. Manual and multi-disciplinary analyses of these data are becoming increasingly
 impractical due to the quintessential "Big Data" problem of rapidly growing data volume, variety (in data types, data rates, and other characteristics), and velocity (rate at which data is produced). Veracity of these data---the question of how accurate the
 data are---is also an important challenge to overcome for any confident insight generation.</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">Modern "Big Data" problems are not unique to NASA. Other organizations, including other government agencies and U.S. industry also have datasets for which manual methods are impractical. Common challenges include: </div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">* Understanding the full data lifecycle</div>
<div style="font-family: -webkit-standard;">* Capturing and curating data from repositories that may not be well-architected to enable easy access to distributed, heterogeneous data</div>
<div style="font-family: -webkit-standard;">* Developing novel statistical approaches (or other approaches including physics-based modeling) for data analysis and other mechanisms for identifying and extracting interesting features and patterns</div>
<div style="font-family: -webkit-standard;">* Methodologies for validating results and comparing predictions to measurements, and visualizing massive datasets and results</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">Organizations are increasingly utilizing commercial as well as free or open-source computer software that implement machine learning and data mining algorithms to aid in analyzing large, complex datasets. Many organizations
 are extending these existing tools for their own needs. Universities are performing research and development to create new algorithms and methods in machine learning and data mining, among others. However, most developments have not been applied to NASA science
 and operations data nor have they been developed with issues unique to the NASA community in mind.</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">A variety of machine learning and other artificial intelligence technologies such as case-based reasoning and goal-oriented planning can learn from science or operations data and can generate predictions or classifications
 efficiently, such as for understanding long-term equipment health trends. NASA problems sometimes require combinations of science and operations data to explore trade-offs for current and future mission planning as well as to generate new insights for advancing
 the science discipline. Additionally, for NASA applications, it is valuable to have technologies that can be utilized by domain experts to discover useful insights. This requires data-driven methods that exhibit transparency, the ability to accept feedback,
 and utilization of existing domain knowledge in the form of physics-based models.</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">This solicitation topic specifically seeks innovative university research to develop computer-aided insight generation tools that can be applied to science and operational data of NASA science and exploration. Potential
 research focuses include, but are not limited to, computer-aided tools that:</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">* Produce new insights (as defined below) from NASA science and operations data, or combinations of NASA science and operations data</div>
<div style="font-family: -webkit-standard;">* Fuse physics-based and other traditional scientific modeling approaches with advanced data science methodologies such as predictive analytics, artificial intelligence, and machine learning approaches</div>
<div style="font-family: -webkit-standard;">New developments of computer-aided tools to generate insights from NASA science and operations data should consider the following features, at a minimum:</div>
<div style="font-family: -webkit-standard;">* Ability to collect and curate datasets (such as providing provenance metadata) through interaction with existing data repositories</div>
<div style="font-family: -webkit-standard;">* Ability to formulate and test hypotheses regarding data quality and anomalies from the combination of science and operations data</div>
<div style="font-family: -webkit-standard;">* Ability to scale analyses to large and heterogeneous datasets</div>
<div style="font-family: -webkit-standard;">* Ability to reveal, in a human-interpretable form, how decisions/insights are derived</div>
<div style="font-family: -webkit-standard;">* Ability to accept user feedback on the results (in the form of corrections and features that constitute the user's rationales for the corrections)</div>
<div style="font-family: -webkit-standard;">* Ability to provide validation, such as comparing models vs. measurements </div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;">Proposers selected for award are expected to demonstrate their tools on NASA science and operations data during the course of the award. To enable this, NASA domain experts will facilitate access to data and models
 necessary to pursue the research. Proposers selected for award are also expected to compare the performance of any novel methods developed with relevant existing machine learning and data mining tools, as appropriate. Proposers are encouraged to leverage open-source
 tools and engage in open-source communities of practice.</div>
<div style="font-family: -webkit-standard;">Please refer to Section 7---Points of Contact for Further Information of this Appendix if you have technical questions pertaining to this topic.</div>
<div style="font-family: -webkit-standard;"><br>
</div>
<div style="font-family: -webkit-standard;"><br>
</div>
</div>
<div>
<div>
<p></p>
<p></p>
<p></p>
<!--EndFragment-->
<p></p>
<!--EndFragment-->
<p></p>
<p></p>
<!--EndFragment--></div>
<!--EndFragment-->
<p></p>
<!--EndFragment--></div>
</body>
</html>