李航所著《机器学习方法》的内容简介、序言、目录及部分章节内容,系统介绍了机器学习的主要方法,涵盖监督学习、无监督学习和深度学习三大部分,以下是详细总结:
一、书籍整体架构
- 作者与出版社
- 内容概述
- 第 1 篇:监督学习
- 第 2 篇:无监督学习
- 第 3 篇:深度学习
书籍定位:适合人工智能、数据挖掘等专业的本科生、研究生及研发人员参考。二、第 1 篇:监督学习
(一)核心概念与框架
- 机器学习定义:基于数据构建概率统计模型并用于预测分析,特点是数据驱动、多学科交叉。
- 分类:包括监督学习、无监督学习、强化学习等,监督学习从标注数据中学习映射关系。
- 三要素
- 模型
- 策略:通过损失函数(如 0-1 损失、平方损失)和风险函数(经验风险、结构风险)优化。
- 算法
关键问题- 模型评估:训练误差与测试误差,过拟合问题及正则化、交叉验证解决方法。
- 泛化能力
- 模型类型
:生成模型(如朴素贝叶斯)与判别模型(如 k 近邻)。
(二)主要算法
- 感知机
- 模型:线性分类器,\(f(x)=\text{sign}(w·x+b)\)。
- 学习策略:最小化误分类点到超平面的距离,损失函数为误分类点的负距离和。
- 算法:原始形式与对偶形式,基于随机梯度下降,线性可分数据收敛。
k 近邻法- 核心思想
- 关键要素:距离度量(如欧氏距离、\(L_p\)距离)、k 值选择(影响模型复杂度)、分类决策规则。
- 实现
朴素贝叶斯法- 假设
- 公式:\(y=\arg\max_{c_k}P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)\)。
- 参数估计
决策树- 构建:特征选择(信息增益、信息增益比、基尼指数),递归生成树。
- 剪枝:通过损失函数\(C_\alpha(T)=C(T)+\alpha|T|\)简化模型,避免过拟合。
- 算法:ID3(信息增益)、C4.5(信息增益比)、CART(基尼指数,可用于分类与回归)。
三、第 2 篇:无监督学习
(一)核心概念
- 基本原理
- 问题类型
- 三要素
(二)主要方法
- 聚类
- 层次聚类
- k 均值聚类:最小化样本到簇中心的平方误差和,迭代更新簇中心。
降维与矩阵分解- 奇异值分解(SVD):将矩阵分解为奇异向量和奇异值,用于降维与矩阵近似。
- 主成分分析(PCA)
话题模型- 潜在语义分析(LSA)
- 概率潜在语义分析(PLSA)
- 潜在狄利克雷分配(LDA):贝叶斯话题模型,吉布斯抽样或变分 EM 算法训练。
其他方法- 马尔可夫链蒙特卡罗法(MCMC)
- PageRank 算法
四、第 3 篇:深度学习
(一)核心网络模型
- 前馈神经网络
- 结构:多层感知机,激活函数(如 ReLU、sigmoid)。
- 学习算法
卷积神经网络(CNN)循环神经网络(RNN)- 结构:处理序列数据,长短期记忆网络(LSTM)、门控循环单元(GRU)解决梯度消失问题。
- 应用
序列到序列模型- 编码器 - 解码器架构:结合注意力机制(如 Transformer),用于机器翻译等。
预训练语言模型
- GPT:自回归模型,基于 Transformer 解码器。
- BERT
生成对抗网络(GAN)(二)共同特点
- 模型复杂度
- 训练方法:基于大规模数据,梯度下降优化,需调参(如学习率、批量大小)。
- 应用场景
五、总结与延伸
- 方法关联:传统机器学习是深度学习基础,两者适用于不同数据规模(传统适合小数据,深度适合大数据)。
- 学习路径
:从监督学习入门,逐步深入无监督与深度学习,注重数学推导与实践结合。
- 未来方向
关注微信公众号“人工智能产业链union”回复关键字“AI加油站10”获取下载地址。
【AI加油站】第八部:《模式识别(第四版)-模式识别与机器学习》(附下载)