通过这本书,你将超越理论,学习构建实际机器学习应用的具体步骤。内容包括数据的向量化、矩阵和数组操作、从多种数据源(如CSV、JSON、SQL数据库、云存储等)加载数据、处理不同类型数据(数值、分类、文本、图像以及日期时间数据)、特征降维、模型评估与选择等。你还将学习到线性和逻辑回归、决策树、随机森林、最近邻算法、支持向量机(SVM)、朴素贝叶斯、聚类以及基于树的模型等多种机器学习技术。此外,书中还介绍了如何使用不同框架保存、加载和部署训练好的模型。
作者Kyle Gallatin是一位专注于机器学习基础架构的软件工程师,拥有丰富的数据分析、数据科学和机器学习领域的工作经验。他不仅是一位专业的数据科学教育者,还是一名志愿计算机科学教师,并频繁在软件工程与机器学习领域的交叉学科发表文章。Kyle目前在Etsy的机器学习平台团队担任软件工程师,致力于推动机器学习技术的发展和应用。