Py学习  »  Python

抓了几千万条热门股数据,用Python量化验证后发现结果竟然...... | 邢不行

邢不行 • 1 年前 • 366 次点击  

这是邢不行第 106 期量化小讲堂的分享

作者 | 邢不行、密斯锌硒




在体育领域一直流传着大热必死的说法,历史上也不乏夺冠大热门爆冷出局的故事。



在金融领域也有大名鼎鼎的金融第三定律:热门的东西不要碰



01

大热必死


针对这一定律,我们之前也写过相关的文章。


点击左图阅读原文


比如每年都买去年业绩最好的明星基金或每天买龙虎榜上的股票,都会亏成狗


点击左图阅读原文


我做这么多分享,就是想让大家谨记:别碰热门的东西。了解这点,你亏钱的概率能降低80%


肯定也会有人反驳,2020年最热门的是茅指数,跟着买就能赚钱,23年最热门的是AI概念,买到就是赚到。



为此我们特意找来了热门股票的相关数据,为大家再次证明什么叫大热必死



02

雪球社区


本文的数据来源比较独特,来自雪球社区。



可能有朋友没有听说过雪球,这里给大家做简单介绍。


雪球是一个成立于2010年的投资者社区,早期注重股市资讯,现已发展为聚集了四五千万股民的大型股票讨论平台


雪球的用户更注重研究基本面财报,信仰价值投资长期投资,和淘股吧用户注重技术分析和打板形成了鲜明对比。



很多基金经理和券商分析师也都在雪球活跃至今,我自己认识的一些机构基金经理平时也的确更喜欢用雪球。



之前雪球粉丝最多的用户是百亿私募希瓦基金的CEO梁宏,现在的第一大V则是段永平



段永平也是我本人最推崇的几个人之一,我还发过很多关于他的朋友圈。



我个人认为段永平选择雪球作为发声平台极其明智。雪球的股民素质总体上是全网相对较高的,在这里大家可以更理性的探讨问题。


换到某些平台上,段永平说再正确的话都可能会被喷



03

雪球热门股


1

雪球热门股


鉴于雪球上有各个股票的讨论,雪球官方就据此信息实时统计了当前最热门的股票,并制成榜单。



它反映了过去一段时间雪球用户对某股票的关注度,搜索讨论的越多就越热门


雪球会显示过去一天和一小时最热门的100个股票,且会随着本身热度而变化。



我们做量化的看到这样的数据就会非常敏感,万一里面蕴含着很重要的投资信息呢?比如热门股是否未来更有可能暴涨


2

热门股数据


为此从2021年开始,我安排专人写了程序,每5分钟爬取一次雪球的热门股数据并记录,两年多来也形成了较丰厚的历史数据


值得一提的是,这个数据除了我们自己收集外,暂时还没有其他任何渠道可得。


整理后的热门股数据如图所示:



它不仅会标出每天热门股的热度值,还会记录热度值的变化等信息,懂行的同学定能发现数据的珍贵


如果你对这个数据感兴趣的话,可以加我微信xbx297,都是可以免费发给你的。


有了数据后,我们就能统计出每天的热门股都有哪些,并进一步探究买最热门的股票能否帮我们赚钱


3

年度热门股


首先我们统计了2022全年2023上半年最热门的股票。



2022年的热点较散乱,2023年最热门的股票则大多集中在AI概念,只有三只股票连续两年稳坐热搜前十。


4

热门股当日表现


同时我们也可以挑一天来看雪球此时最热门的股票有哪些。



可以发现这些热门股有涨有跌,有属于热门板块涨上热搜的,也有跌多了上热搜的。


为此我们又统计了热门股当日的股价表现。



结果显示约36%的股票在上热搜时下跌64%的股票则上涨。


当然也有一些股票是因为产生了绯闻上热搜



至此我们就初步了解了雪球热门股的大致情况。


接下来我们就可以借助Python代码,尝试去探究对散户而言每天开盘买入过去24小时所有热门股,并持有未来1/2/3/10天的平均收益能有多少?


在进行计算前我们需从实际出发,剔除开盘涨停而无法买入的热门股、当时ST/退市/上市不满一年的新股。



如果你对这个代码感兴趣的话,可以加我微信xbx297,都是可以直接发给你的。



04

热门股表现


1

热门股整体


程序运行结果如图所示:



如果我们每天在开盘买入过去24小时最热门的股票,持有1天的上涨概率是48.68%平均收益有0.21%,还是不错的。


我们同样计算出持有2天-10天的情况,结果如下:



不仅持有热门股的收益率急转直下,并且呈现出了持有越久亏损越多的规律。


这也可以证明雪球上的热门股未来表现整体不佳


2

前十热门股


当然这里我们考察的是全部热门股股票,如果只看每天热搜榜前十效果又将如何?


我们在之前的python代码上稍作修改即可得到想要的结果。


如果你对这个代码感兴趣的话,可以加我微信xbx297,都是可以直接免费发给你的。



代码运行结果如图所示:



开盘买入热度前十的热门股并持有1/2/3天后的表现优于热门股整体,平均收益皆为正。


但也呈现出持有越久亏损越大的规律,持有10个交易日平均跌幅1.62%,整体而言改善较少。


这也再次印证了本文的观点:在金融市场千万不要去碰此时此刻最热门的东西


3

其他热门股


当然肯定还有朋友不服气,想看看只买因上涨而上热搜的股票是否效果会更好?


我们依然只需修改下代码即可运行,如果你需要这个代码的话,可以加我微信xbx297,都是可以直接发给你的。



最新结果仍旧令人失望:



这些当日上涨的热门股在未来1-10天的上涨概率显著低于50%,且平均收益也均为负


更离谱的是,如果只买当日下跌的热门股,虽然整体仍旧拉垮,但它的表现要好于上涨的热门股。



甚至我们还对热门股上热搜前所处的股价走势做了相关的研究,具体情况如图所示,就不多加赘述了。




05

尾声


至此我们共研究了7种不同类型的热门股,发现只要股票上了热门后,未来平均表现都是日益下跌


因此股票最热门时即是巅峰后续等待它的就是慢慢下跌,淡出股民视野。



我们辛苦收集的雪球热门股数据,虽然目前实盘用处不大,但仍会继续更新


相信等到未来A股完全放开个股做空机制时,这份数据就会价值千金


最后也希望大家可以谨记:散户少亏钱的第一定律是尽量不要去人多的地方



本质上和巴菲特说过的别人贪婪我恐惧”殊途同归


比如前段时间我看到了这样的截图:



当时我特地发了朋友圈。至于观点的对错与否,就需要时间来给答案了。




06

后记


文章的最后,和大家分享一点量化投资的心得。


经常有人问我小白如何入门量化投资,有什么资料分享。


我特意为大家准备了一个《量化投资新手学习大礼包》。



首先是我们自己总结的适合零基础新手的量化投资学习路径,可以让你知道自己每一步需要达到什么阶段。



接下来你可以通过我整理的量化文章合集,来更全面的了解量化投资到底是什么。



我还精选了适合各个学习阶段的策略研报合集,正如我一直所说,量化研报是很好的量化实践项目,深度研报可以显著提升你的量化水平。



这一份代码则适合喜欢研究技术指标的人,你可以跟着教程轻松计算出所有技术指标,并测试这个指标的有效性。



如果你有一定的基础,还可以尝试回测一些策略,我为你准备好了十几个不同类型的经典策略和它们的代码,相信总有一个适合你自己去魔改开发,运用到实盘。



最后也是最关键的,量化的基础就是准确的历史数据,我会送你一份股票历史日线数据和一份财务数据,你可以用它测试所有技术指标和财务指标,也可以用来回测大部分策略



识货的你一定能够发现这个大礼包的价值吧。如果你需要的话,可以加我信xbx297,都是可以直接免费发给你的。



联系作者


往期文章推荐

散户反着买,别墅靠大海?股票上了龙虎榜还能买吗?【邢不行】

量化交易一定是机器人+自动化+高频交易吗?| 常见量化交易误区合集,新手脱坑入门指南 | 【邢不行】

抄底总在半山腰?抄底A股的时机何时到来?|【 邢不行】

投资不识筹码峰,炒遍A股也枉然?| 如何用python计算筹码分布数据 |【邢不行】

烂板如何出妖股?每天买炸板股票,不亏反赚100倍?| 【邢不行】

跟着社保买,别墅靠大海?跟着国家队炒股,还会亏钱吗?| 附最新选股结果【邢不行】

A股月份效应 | Python量化A股市场魔咒,5穷6绝7翻身准确吗?| 【邢不行】

股东刚减持,股价却起飞?用Python量化A股解禁数据,利空出尽是利好? | 【邢不行】

量化散户交易数据:追涨爆亏99%,杀跌少赚28倍?| 追涨杀跌一时爽,散户钱包火葬场?【邢不行】

散户打板,一夜暴富?Pyhton量化11万次涨停,跟着买,收益竟...?【邢不行】

颠覆认知!“垃圾股”策略长期跑,10年翻100倍、近2年6倍,吊打茅指数!| 【邢不行】

分析师的嘴,骗人的鬼?年薪百万的券商分析师靠谱吗?Python量化大数据给你答案!【邢不行】

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/163137
 
366 次点击