输入:数据集 ,其中样本 是维向量,,降维后的目标维度 。
定义以下符号:
其中
假设投影直线是向量 ,对任意样本 ,它在直线 上的投影为 ,两个类别的中心点 , 在直线 的投影分别为 、。
LDA的目标
定义类内散度矩阵
类间散度矩阵
据上分析,优化目标为
根据广义瑞利商的性质,矩阵 的最大特征值为 的最大值,矩阵 的最大特征值对应的特征向量即为 。
LDA算法降维流程如下: 输入:数据集 ,其中样本 是n维向量,,降维后的目标维度 。
输出:降维后的数据集 。
步骤:
LDA是个二分类的降维方法。