【信息科学与工程学】【数据科学】第四十八篇 大数据与数据科学和应用数学01
编号 | 类型 | 领域 | 子领域 | 问题 | 问题的数学分析及数值分析(含几何/拓扑/代数/集合论/分形/泛函/模糊函数/抽象函数/数论/数理逻辑/其他) | 算法逐步推理思考的数学表达式 | 参数列表及参数的边界范围及条件及常数 | 关联知识 |
|---|---|---|---|---|---|---|---|---|
1 | 降维算法 | 大数据与数据科学 | 主成分分析(PCA) | 对中心化后的数据集 X∈Rn×d,求第一主成分方向 w1 | 该问题本质是最大化投影方差,属线性代数和优化理论。协方差矩阵 S=n1X⊤X是半正定对称阵,其最大特征值对应的特征向量即为所求。几何上,第一主成分是数据方差最大的方向。 | 步骤1: 数据中心化:X~=X−n11n1n⊤X |
