<div dir="ltr">Dear colleagues,<div><br></div><div>A new data set for the study of sequence learning algorithms is available as of today. The data set consists of pen stroke sequences that represent handwritten digits, and was created based on the MNIST handwritten digit data set.</div><div> </div><div>MNIST stroke sequence data set: </div><div><a href="https://github.com/edwin-de-jong/mnist-digits-stroke-sequence-data/wiki/MNIST-digits-stroke-sequence-data">https://github.com/edwin-de-jong/mnist-digits-stroke-sequence-data/wiki/MNIST-digits-stroke-sequence-data</a></div><div><br></div><div>The code project that was used to create the data set is available as well:</div><div><a href="https://github.com/edwin-de-jong/mnist-digits-as-stroke-sequences/wiki/MNIST-digits-as-stroke-sequences-(code)">https://github.com/edwin-de-jong/mnist-digits-as-stroke-sequences/wiki/MNIST-digits-as-stroke-sequences-(code)</a><br></div><div><br></div><div>The 70000 digit images were thresholded and thinned, yielding skeletons of the images. Using a TSP algorithm, hypothetical pen stroke sequences were then inferred. The resulting data set provides a sizeable and diverse test bed, and can serve as a benchmark data set for evaluating and comparing sequence learning algorithms. </div><div><br></div><div>Further details can be found at the links above; please feel free to contact me in case of any questions or suggestions.</div><div><br></div><div>Best regards,</div><div><br></div><div>Dr. Edwin D. de Jong</div><div>__</div><div><br></div></div>