我通常会建议在著名的机器学习数据集上进行有针对性的练习。
这是因为众所周知的机器学习数据集,如UCI机器学习库中的那些,很容易使用。它们很小,适合存储,可以在工作站上处理。这些数据集都经过充分研究和理解,因此您可以与基线进行比较。
您可以在“ 使用UCI机器学习库中的小型内存数据集练习机器学习 ”中了解有关机器学习数据集实践的更多信息。
https://machinelearningmastery.com/practice-machine-learning-with-small-in-memory-datasets-from-the-uci-machine-learning-repository/
这个过程适合用来理解机器学习算法的原因是,为了获得标准机器学习算法的结果,您会遇到一些限制。您会想要了解更多信息,包括如何从给定算法中获得更多信息,或者了解有关如何最佳配置算法,或是如何实际工作等。
好奇心将促使您研究机器学习算法的理论。您将被迫整合对算法的理解,以获得更好的结果。
我们在不同背景的年轻开发人员中都看到了同样的效果,最终他们会去研究开源项目、教科书甚至论文的代码,以便磨练他们的技艺。他们这么做的动力是:想要成为一个更有能力程序员!
如果你很好奇并且有动力去取得成功,你就无法抗拒去研究算法背后的理论。