Py学习  »  机器学习算法

托特:北大系深度学习科班团队进军量化(公司篇)

格上财富 • 1 年前 • 122 次点击  


作者:付饶

来源:格上研究


托特:北大系深度学习科班团队进军量化

在一次偶然的阅读中,我曾读到过这样一则轶事。


2016年8月,英伟达的CEO黄仁勋将世界上第一台超算DGX-1捐给了成立不到1年的OpenAI,那时候的他们显然不知道ChatGPT将成为这家小公司未来旗下的其中一个产品。


点击小程序查看完整文字版


在他捐出这台超算的时候,有100多家公司已经发出了订单,但黄仁勋却把第一台捐给了OpenAI。超算DGX-1花费3000人3年的时间研发,是首个轻量化的小型超算,计算的能力相当于250台传统服务器。


有了这台超级计算机,OpenAI的研发效率大大提高,原本需要一年的计算量,只需要一个月就能够轻松完成。这也为当下爆火的ChatGPT的问世,种下了最初的种子。


这台超算上写着一行字:为了计算和人类的未来,我捐出世界上第一台DGX-1。



之所以会想到这则故事,是因为这次讲到量化管理人托特的故事,也是从初创公司一路走来,他们刚开始尝试将深度学习应用在金融领域的时候,也从未想过深度学习,量化技术能够在未来对市场有着如此深远的影响力。时间也恰好发生在2016年。


2016年,张登就读于在北京大学信息科学与技术学院,主攻人工智能方向的研究。在一次创新创业课程的展示上,张登展示了在人工智能方面的研究成果。同样是托特创始人的丛榕当时也作为参会人,聆听了这场讲座。当时丛榕通过偶然的机会了解到有量化公司在用深度学习技术进行量化策略的研发,而他对于这一领域的研究方向十分看好。


会后,丛榕找到张登,讨论了将前沿的机器学习理论应用在金融市场的可能性,两人一拍即合,当即决定进入量化领域进行尝试。随后张登介绍了同学邢亚杰一起入伙,邢亚杰专业是计算机视觉研究,也对深度学习的应用感兴趣,希望尝试新的事物。所以在当年的暑假,张登和邢亚杰便开始了最初的尝试。


随后一年时间里,陆续又加入了数位同学。这几位年轻的学子,在丛榕的带领下,在校期间即开始了量化领域的研究和策略模型开发。模型的开发持续了数年,当时的研发小组也逐渐成长,几名核心成员毕业后,仍然选择继续来到托特,继续量化领域的研究和投资。


托特的核心策略团队均来自于北京大学,学术背景涵盖人工智能和金融工程的多个前沿领域。团队具备优异的软件工程能力和人工智能相关技术的科研经验,多位成员曾在机器学习、计算机视觉、自然语言处理、生物统计学等不同领域的顶级会议上发表论文。


对于人工智能领域的研究者来说,研发方向很多,在图像识别、语音识别,以及在商业上都具有可能性,而金融只是众多应用的其中一种。相对于其它方向,尽管金融数据在处理的过程中有很多需要关注的细节和壁垒,但数据是标准化和完善的,量价、基本面数据能够较为容易获取,从数据到模型到交易可以完全程序化。这样的数据特点就能够让模型有足够数据进行学习,也更容易实践、迭代。所以在金融市场的量化交易,也可以成为人工智能能够落地的点。


机器学习作为新兴的技术,这一领域的人才多为年轻人,新一代的研发人员对于机器学习的理解反而相比于早一代的研究人员更加深入和细致。金融数据并不像其他的应用领域,机器学习的成功率能够达到90%多,相反,金融数据有着低信噪比的特点。因此在量化投资领域,想要建立优秀的深度学习模型,如何设计适合于金融数据的模型,该如何处理金融类的数据,就需要依赖设计者的逻辑直觉和对技术的深入理解,而不能简单的套用公式代码了。


至今,托特的团队已经在一起磨合近7年,几名核心成员有相同的志向,价值观一致,致力于做长期的投资,为长远做打算。2022年3月底,托特投资获得私募管理人牌照后,于5月正式接受持有人委托。截至目前,管理规模20亿。


在人类群星闪耀之时,也许有很多人正过着平凡的一天,也许有人席卷在世俗的庸碌,也许有人追随者无谓的浮华。但也有人正读到了让他灵感初现的文字,有人正在草稿纸上留下了思考的痕迹,也有人刚刚获得了第一笔改变命运的订单,也许还有很多人正在为了让世界变得更好而努力着。


相信无论在什么时候,一定会有人在大多数人不知道的角落,为了未来和热爱去尝试和奋斗,也许他当时汗水并不会被看到,但当他的成果被看到的那一天,他当时所付出的努力也必将是一则令人感动和尊敬的美谈。


托特:将深度学习技术运用到金融市场


提到人工智能、机器学习,虽说大部分投资者对于机器学习、深度学习等名字并不陌生,但其实对于深度学习在构建模型的过程中实际上的作用和提高理解的实则了解不多。所谓深度学习技术,是通过模型来实现对历史数据的观察。相比于人对于数据的观察,机器能够同时考虑更多的维度,并且机器能够观察到人类难以察觉的信息之间的关联,效率大大提升。


深度学习的底层原理


我们先来讲解深度学习模型的原理,用视觉的识别来举例子。我们都知道,人脑可以准确地区分出不同的物体,如果想要让机器通过类似人脑的方式识别和区分物体,就需要弄清楚人脑是通过何种机制来进行区分。


科学家发现,人类在识别物体的过程中,是通过逐层分级的方式。所谓的逐层分级,简单来理解就是一步一步来识别。假设我们要区分出人脸和汽车,首先,最基础的,人类会观察到物体的边缘,人脸和汽车的边缘都是类似的,类似于向某个方向延申的线。其次,在这些边缘的延申处,大脑会继续识别特征,比如眼球的形状,汽车的轮子等等。接着,再扩大范围识别更多的特征,将这些特征进行筛选和识别,最终识别出图像所对应的物体。



用这样的方式进行建模,就有了非常经典的深度学习模型。当我们给深度学习模型输入大量的图片信息,经过一段时间的学习之后,深度学习模型就能够做到识别图像中的特定物体。而这背后建模的核心,也是将识别的过程分成多个层次,一步步地区分出特征并进行识别。而每一层所做的事情,往往是比较简单的。


人脑进行决策的最小单位是一个神经元,单个神经元的功能是获得输入,经过一定的规则,将结果输出给下游,单个神经元的运行模式并不难理解,小规模的神经元活动就是机械的行为,比如条件反射。随着神经元规模增加,就会开始处理更加复杂的运算和逻辑思维。


深度学习网络的每一层就类似于神经元,随着神经元数量的增加,机器开始体现出一定的“智能”。动物的智力与大脑皮质上神经元的数量有关, 数量越多,智力就越高。当机器拥有足够数量的“神经元”的时候,则相当于其“智力”水平可能已经赶上了一些动物。


所以当我们使用计算机模拟人脑,增加足够的模型参数量之后,机器也能够体现出智能的属性。这就类似于人教给机器逻辑后,机器可以不依赖于人规定规则,模型能够自己进行一些所谓的思考和判断,学习和探索深层规律,随着模型规模提升,就可能产生研究人员自己可能都预料不到的结果了,这样的结果就会让人们觉得机器拥有了智慧。


如何将深度学习的技术应用到股票市场?


深度学习领域本身是一个非常宽泛的研究领域,其在股票市场的应用只是其庞大分支中的一部分。 股票价格数据具有低信噪比的特点,建模的过程不同于其他领域的建模方式。


在图像识别的领域,输入大量图片之后,图像上无论在哪里只要出现了需要识别的物体,机器就能够进行有效的识别,识别的成功率往往可以高达90%。而股票的数据则难以做到这么高的成功率,因为驱动股票价格变化的因素可能有很多,股票价格的变化也许是无效交易者产生的,也许是有信息的,在建模的过程中,如何将有效的信息从众多信息中筛选出来,关注更有效更重要的信息,是股票数据建模过程中最复杂的。


在股票数据建模的过程中,需要考虑用全方位的信息来识别股票的驱动。股票一个时刻会同时上涨,上涨行为可能难以知道是同一个原因驱动,还是巧合。深度学习的能力,可以更好地解决此问题。模型可以做到同时读取不同的数据,并寻找数据之间的关联关系,最终实现为更加准确地了解上涨的原因。如同生物的大脑存在功能分区,不同区域有不同的神经结构来负责不同的功能,最终以特定的方式整合在一起才形成完整的智能,深度学习模型中也需要针对数据形式和功能需求来设计特定的模型结构,并将其有效地组织成一个完整的模型。人在建模过程中扮演的角色,就在于基于对数据和任务的认识,利用各种技术完成这一过程,从而使模型能够更有效地从数据当中学习规律,完成我们需要的任务。


作为一家科技驱动的量化私募基金公司,托特的创始团队从2016年开始专注于量化投资领域的研究、创新与实践,是国内最早应用深度学习技术进行量化交易的团队之一。基于严谨的研究方法、先进的人工智能技术、强大的大数据平台和软件开发能力,托特构建了多周期多品种的策略体系,致力于为客户创造长期稳定的超额收益。


点击小程序查看完整文字版



版权声明:部分文章推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。

格上财富:十五年深度研究,甄选阳光私募、PE/VC、海外基金等高端理财产品,为您的资产增值保驾护航!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153674
 
122 次点击