书籍简介
《没有标签的数据》揭示了处理未标注数据的关键算法和模型的所有实践实现,充满了案例研究,展示了如何将每项技术应用于现实世界的问题。
在《没有标签的数据》中,您将学习到:
机器学习和无监督学习的基本构建块和概念
结构化和非结构化数据(如文本和图像)的数据清理
聚类算法,如K-means、层次聚类、DBSCAN、高斯混合模型和谱聚类
降维方法,如主成分分析(PCA)、SVD、多维尺度法和t-SNE
关联规则算法,如aPriori、ECLAT、SPADE
无监督时间序列聚类、高斯混合模型和统计方法
构建神经网络,如生成对抗网络(GANs)和自编码器
使用Python工具和库,如scikit-learn、numpy、Pandas、matplotlib、Seaborn、Keras、TensorFlow和Flask
如何解释无监督学习的结果
如何为您的问题选择合适的算法
如何将无监督学习部署到生产环境
机器学习解决方案的维护与更新
《没有标签的数据》介绍了数学技巧、关键算法和Python实现,帮助您构建针对无标签数据的机器学习模型。您将发现无监督机器学习的方法,这些方法可以解开原始、现实世界的数据集,并支持您的业务做出正确的战略决策。
这本书不仅仅是理论的堆砌,它架起了复杂数学和实践Python实现之间的桥梁,涵盖了从模型开发到生产部署的全过程。您将发现机器学习和无监督学习的业务用例,并访问相关的研究论文,帮助您完善知识体系。
技术概述
生成式AI、预测算法、欺诈检测等许多分析任务都依赖廉价且丰富的无标签数据。无标签数据的机器学习——即无监督学习——将原始文本、图像和数字转化为有关客户的洞察、精确的计算机视觉和用于训练AI模型的高质量数据集。本书将向您展示如何实现这一点。
关于本书
《没有标签的数据》是一本全面介绍无监督学习的指南,深入探讨其数学基础、算法和实际应用。书中通过零售、航空和银行的实际案例,结合完整的Python代码进行讲解。您将学习到核心技术,如聚类和降维,并深入探讨自编码器和生成对抗网络(GANs)等高级主题。通过本书,您将了解如何将无监督学习应用于商业场景,并学会如何开发端到端的机器学习模型。
书中内容
精通无监督学习算法
实际的业务应用
精心策划AI训练数据集
探索自编码器和GANs的应用
读者对象
本书面向数据科学专业人士,假设读者具备Python和基础机器学习的知识。
作者简介
Vaibhav Verdhan 是一位资深的数据科学专业人士,拥有在大型制药公司从事数据科学项目的丰富经验。
目录
第1部分
机器学习简介
聚类技术
降维方法
第2部分
4. 关联规则
5. 聚类
6. 降维
7. 无监督学习在文本数据中的应用
第3部分
8. 深度学习:基础概念
9. 自编码器
10. 生成对抗网络(GANs)、生成式AI和ChatGPT
11. 端到端模型部署
附录A 数学基础
购买打印版书籍,您将免费获得电子书(PDF或ePub格式),并获得在线liveBook格式的访问权限(包括其AI助手,可以用任何语言回答您的问题)。
书评
“这是一本很好的无监督学习技术入门书。” —— Richard Vaughan
“用Python深入探讨无监督学习的极佳书籍!” —— Todd Cook
封底文字
《没有标签的数据》展示了处理无标签数据的关键算法和模型的所有实践实现,充满了案例研究,展示了如何将每项技术应用于现实世界的问题。在《无监督学习的模型与算法》中,您将学习到:
《无监督学习的模型与算法》介绍了数学技巧、关键算法和Python实现,帮助您构建针对无标签数据的机器学习模型。您将发现无监督机器学习方法,这些方法能够解开原始、现实世界的数据集,并支持您的业务做出明智的战略决策。本书避免陷入理论的泥潭——它架起了复杂数学和实践Python实现之间的桥梁,涵盖了从模型开发到生产部署的全过程。
专知便捷查看,访问下面网址或点击最底端“阅读原文”
https://www.zhuanzhi.ai/vip/dbd8434c229b99aca4d0a059bd8ad001
点击“阅读原文”,查看下载本文