Py学习  »  Python

Python金融大数据分析-PCA分析

马哥Linux运维 • 6 年前 • 846 次点击  

作者:钱塘小甲子

来源:

http://blog.csdn.net/qtlyx/article/details/53647159

1.pandas的一个技巧

    apply() 和applymap()是DataFrame数据类型的函数,map()是Series数据类型的函数。apply()的操作对象DataFrame的一列或者一行数据, applymap()是element-wise的,作用于每个DataFrame的每个数据。 map()也是element-wise的,对Series中的每个数据调用一次函数。

2.PCA分解德国DAX30指数

    DAX30指数有三十个股票,听起来不多的样子,其实还是挺多的,我们很有必要对其进行主成分分析,然后找出最重要的几个股票。想必PCA的原理大家应该都是知道,说白了就是在一个回归中找到影响最大的那几个,当然,数学原理就涉及矩阵分解,什么SVD呀。

    先上点代码

这样,你就可以看到前十个股票对DAX30指数的贡献量了。


    这里,我们采用只用第一个成分去拟合以及前五个成分去拟合,发现效果好的出奇。这样我们就做到了降维的工作了。我们再来展开看一下PCA的效果。

    这里,我们把PCA后的值与原始值进行散点图的绘制,




    我们看到,整体效果还是不错的,但是很显然,两边和中间总是有点问题,所以,如果我们要提高,我们可以在中间分段进行PCA,这样的话,效果应该会更加好。


linux面授班开班倒计时

4天

学员限量招募
长按识别二维码,立刻联系红豆
今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/weixin/WXfL3M80WQ
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/1935
 
846 次点击