社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

托特——追求纯alpha 北大系深度学习科班团队玩转量化

格上财富 • 1 年前 • 130 次点击  



来源:格上研究



托特:北大系深度学习科班团队进军量化


在一次偶然的阅读中,我曾读到过这样一则轶事。


2016年8月,英伟达的CEO黄仁勋将世界上第一台超算DGX-1捐给了成立不到1年的OpenAI,那时候的他们显然不知道ChatGPT将成为这家小公司未来旗下的其中一个产品。


在他捐出这台超算的时候,有100多家公司已经发出了订单,但黄仁勋却把第一台捐给了OpenAI。超算DGX-1花费3000人3年的时间研发,是首个轻量化的小型超算,计算的能力相当于250台传统服务器。


有了这台超级计算机,OpenAI的研发效率大大提高,原本需要一年的计算量,只需要一个月就能够轻松完成。这也为当下爆火的ChatGPT的问世,种下了最初的种子。


这台超算上写着一行字:为了计算和人类的未来,我捐出世界上第一台DGX-1。



之所以会想到这则故事,是因为这次讲到量化管理人托特的故事,也是从初创公司一路走来,他们刚开始尝试将深度学习应用在金融领域的时候,也从未想过深度学习,量化技术能够在未来对市场有着如此深远的影响力。时间也恰好发生在2016年。


2016年,张登就读于在北京大学信息科学与技术学院,主攻人工智能方向的研究。在一次创新创业课程的展示上,张登展示了在人工智能方面的研究成果。同样是托特创始人的丛榕当时也作为参会人,聆听了这场讲座。当时丛榕通过偶然的机会了解到有量化公司在用深度学习技术进行量化策略的研发,而他对于这一领域的研究方向十分看好。


会后,丛榕找到张登,讨论了将前沿的机器学习理论应用在金融市场的可能性,两人一拍即合,当即决定进入量化领域进行尝试。随后张登介绍了同学邢亚杰一起入伙,邢亚杰专业是计算机视觉研究,也对深度学习的应用感兴趣,希望尝试新的事物。所以在当年的暑假,张登和邢亚杰便开始了最初的尝试。


随后一年时间里,陆续又加入了数位同学。这几位年轻的学子,在丛榕的带领下,在校期间即开始了量化领域的研究和策略模型开发。模型的开发持续了数年,当时的研发小组也逐渐成长,几名核心成员毕业后,仍然选择继续来到托特,继续量化领域的研究和投资。


托特的核心策略团队均来自于北京大学,学术背景涵盖人工智能和金融工程的多个前沿领域。团队具备优异的软件工程能力和人工智能相关技术的科研经验,多位成员曾在机器学习、计算机视觉、自然语言处理、生物统计学等不同领域的顶级会议上发表论文。


对于人工智能领域的研究者来说,研发方向很多,在图像识别、语音识别,以及在商业上都具有可能性,而金融只是众多应用的其中一种。相对于其它方向,尽管金融数据在处理的过程中有很多需要关注的细节和壁垒,但数据是标准化和完善的,量价、基本面数据能够较为容易获取,从数据到模型到交易可以完全程序化。这样的数据特点就能够让模型有足够数据进行学习,也更容易实践、迭代。所以在金融市场的量化交易,也可以成为人工智能能够落地的点。


机器学习作为新兴的技术,这一领域的人才多为年轻人,新一代的研发人员对于机器学习的理解反而相比于早一代的研究人员更加深入和细致。金融数据并不像其他的应用领域,机器学习的成功率能够达到90%多,相反,金融数据有着低信噪比的特点。因此在量化投资领域,想要建立优秀的深度学习模型,如何设计适合于金融数据的模型,该如何处理金融类的数据,就需要依赖设计者的逻辑直觉和对技术的深入理解,而不能简单的套用公式代码了。


至今,托特的团队已经在一起磨合近7年,几名核心成员有相同的志向,价值观一致,致力于做长期的投资,为长远做打算。2022年3月底,托特投资获得私募管理人牌照后,于5月正式接受持有人委托。截至目前,管理规模20亿。


在人类群星闪耀之时,也许有很多人正过着平凡的一天,也许有人席卷在世俗的庸碌,也许有人追随者无谓的浮华。但也有人正读到了让他灵感初现的文字,有人正在草稿纸上留下了思考的痕迹,也有人刚刚获得了第一笔改变命运的订单,也许还有很多人正在为了让世界变得更好而努力着。


相信无论在什么时候,一定会有人在大多数人不知道的角落,为了未来和热爱去尝试和奋斗,也许他当时汗水并不会被看到,但当他的成果被看到的那一天,他当时所付出的努力也必将是一则令人感动和尊敬的美谈。


托特:将深度学习技术运用到金融市场


提到人工智能、机器学习,虽说大部分投资者对于机器学习、深度学习等名字并不陌生,但其实对于深度学习在构建模型的过程中实际上的作用和提高理解的实则了解不多。所谓深度学习技术,是通过模型来实现对历史数据的观察。相比于人对于数据的观察,机器能够同时考虑更多的维度,并且机器能够观察到人类难以察觉的信息之间的关联,效率大大提升。


深度学习的底层原理


我们先来讲解深度学习模型的原理,用视觉的识别来举例子。我们都知道,人脑可以准确地区分出不同的物体,如果想要让机器通过类似人脑的方式识别和区分物体,就需要弄清楚人脑是通过何种机制来进行区分。


科学家发现,人类在识别物体的过程中,是通过逐层分级的方式。所谓的逐层分级,简单来理解就是一步一步来识别。假设我们要区分出人脸和汽车,首先,最基础的,人类会观察到物体的边缘,人脸和汽车的边缘都是类似的,类似于向某个方向延申的线。其次,在这些边缘的延申处,大脑会继续识别特征,比如眼球的形状,汽车的轮子等等。接着,再扩大范围识别更多的特征,将这些特征进行筛选和识别,最终识别出图像所对应的物体。



用这样的方式进行建模,就有了非常经典的深度学习模型。当我们给深度学习模型输入大量的图片信息,经过一段时间的学习之后,深度学习模型就能够做到识别图像中的特定物体。而这背后建模的核心,也是将识别的过程分成多个层次,一步步地区分出特征并进行识别。而每一层所做的事情,往往是比较简单的。


人脑进行决策的最小单位是一个神经元,单个神经元的功能是获得输入,经过一定的规则,将结果输出给下游,单个神经元的运行模式并不难理解,小规模的神经元活动就是机械的行为,比如条件反射。随着神经元规模增加,就会开始处理更加复杂的运算和逻辑思维。


深度学习网络的每一层就类似于神经元,随着神经元数量的增加,机器开始体现出一定的“智能”。动物的智力与大脑皮质上神经元的数量有关, 数量越多,智力就越高。当机器拥有足够数量的“神经元”的时候,则相当于其“智力”水平可能已经赶上了一些动物。


所以当我们使用计算机模拟人脑,增加足够的模型参数量之后,机器也能够体现出智能的属性。这就类似于人教给机器逻辑后,机器可以不依赖于人规定规则,模型能够自己进行一些所谓的思考和判断,学习和探索深层规律,随着模型规模提升,就可能产生研究人员自己可能都预料不到的结果了,这样的结果就会让人们觉得机器拥有了智慧。


如何将深度学习的技术应用到股票市场?


深度学习领域本身是一个非常宽泛的研究领域,其在股票市场的应用只是其庞大分支中的一部分。股票价格数据具有低信噪比的特点,建模的过程不同于其他领域的建模方式。


在图像识别的领域,输入大量图片之后,图像上无论在哪里只要出现了需要识别的物体,机器就能够进行有效的识别,识别的成功率往往可以高达90%。而股票的数据则难以做到这么高的成功率,因为驱动股票价格变化的因素可能有很多,股票价格的变化也许是无效交易者产生的,也许是有信息的,在建模的过程中,如何将有效的信息从众多信息中筛选出来,关注更有效更重要的信息,是股票数据建模过程中最复杂的。


在股票数据建模的过程中,需要考虑用全方位的信息来识别股票的驱动。股票一个时刻会同时上涨,上涨行为可能难以知道是同一个原因驱动,还是巧合。深度学习的能力,可以更好地解决此问题。模型可以做到同时读取不同的数据,并寻找数据之间的关联关系,最终实现为更加准确地了解上涨的原因。如同生物的大脑存在功能分区,不同区域有不同的神经结构来负责不同的功能,最终以特定的方式整合在一起才形成完整的智能,深度学习模型中也需要针对数据形式和功能需求来设计特定的模型结构,并将其有效地组织成一个完整的模型。人在建模过程中扮演的角色,就在于基于对数据和任务的认识,利用各种技术完成这一过程,从而使模型能够更有效地从数据当中学习规律,完成我们需要的任务。


作为一家科技驱动的量化私募基金公司,托特的创始团队从2016年开始专注于量化投资领域的研究、创新与实践,是国内最早应用深度学习技术进行量化交易的团队之一。基于严谨的研究方法、先进的人工智能技术、强大的大数据平台和软件开发能力,托特构建了多周期多品种的策略体系,致力于为客户创造长期稳定的超额收益。


托特在获取超额上有何不同?


托特团队有深厚的深度学习学术背景,并且自2016年起就将深度学习技术应用于量化策略的研究与开发,积累了大量独有的技术和经验,形成了以深度学习/机器学习+量价为核心,不断扩充各种基本面和另类数据进行多模态建模的因子库,在深度学习/机器学习技术的应用上走在业内前沿。


在获取超额上,采用更多的信息来源是获取超额收益的重要方式。目前市场上各家量化管理人都在扩展自己的因子来源,托特也在这个方向上投入了大量精力和资源,在量价和基本面数据之外覆盖了如分析师、新闻舆情、专利、供应链等等多种另类数据。


另外,基于在深度学习等技术上的积累和对前沿技术的深入理解与掌握,托特在同时使用多类不同数据进行多模态建模方面进行了大量研究。通过合理设计的多模态模型,不仅可以挖掘出各类数据本身直接能够预测收益的信息,更能够挖掘到不同数据间相互作用产生的模式或是股票间或期货合约间深层的相关关系,从而获得更加丰富的收益来源。在这一方面托特仍将继续着力研发,不断充实策略。


模型过拟合问题如何解决?


此外,对于深度学习/机器学习技术来说,模型的鲁棒性(robustness)和过拟合问题非常容易影响到模型的稳定性和准确性。众所周知,由于金融数据存在信噪比低、样本分布可能变化等等问题,基于统计的模型往往容易出现过拟合现象,并且对于极端行情往往难以很好地应对。也就是说,并不是简单地将数据“喂到”模型中,模型的产出就能够简单地使用,这背后会有潜在的过拟合问题,可能数据的结果只能应用于过去,但对于未来并没有预测能力。


为尽量减少此问题,托特一方面借鉴学术界不同领域(如生物特征识别、自动驾驶等)的前沿研究成果,通过多种技术手段减轻这些问题。另一方面,托特遵循严格的逻辑驱动的研究范式,不仅仅以因子回测表现作为研究工作的评价标准,而是强调模型研发应该以一定的研究思想为起点,基于具体的因子设计逻辑进行建模,并通过实验验证模型实际工作方式和效果。通过这样的研究方法,可以最大程度地减少建模过程中对数据进行过拟合的可能性,从而得到更加多样、技术壁垒更高的alpha因子。


同时,单一的预测模型不一定能够每次都提供正确的预测,但组合不同频段,不同数据来源的多种模型,就相当于有上千个大脑做预测,胜率会比单个的高,如此就做到了不同收益来源结合。


托特:追求纯alpha,

不忘初心做稳健的风控


当问到该如何做好一家量化公司的时候,很多人的第一印象都是砸钱砸机器,或是人海战术扩大规模,很多量化管理人的答案也会是诸如希望扩大规模,或是赚到钱。


在这个问题上,托特给出了不同的答案。托特认为,做好一家量化公司,最重要的是对投资市场的敬畏,其次是对技术迭代孜孜不倦的追求和不忘初心的风控和稳健。托特不仅致力于持续不断地进行研发迭代,还同时深知投资中风险的重要性,将人工智能技术与严谨的金融模型深度整合,建立了完善的策略体系和风险控制体系。托特相比于收益更关注风险,在控制好风险的前提下,把剩下的交给了时间。


托特始终致力于为客户创造长期稳定的超额收益,重视收益的稳定性,对于风格、行业等各类风险因子采取了比较严格的控制,对于各类风险敞口都没有显著的暴露。对于指数增强策略和市场中性策略均采用较为严格的风险控制。


托特采用基于Barra多因子风险模型自研改进的风险因子模型对投资持仓风险进行评估和监控。模型中一方面针对中高频的风险估计做了一部分调整、并且增加了一些自研的风险因子;另一方面针对托特的alpha策略产生的资产组合对风险估计做了调整,减小了估计偏误。


对于常规Barra风险因子,托特根据策略实际情况将风险因子暴露限制在0.1到0.3个标准差不等。市值因子的敞口为0.3个标准差以内,行业+-2.5%,其它风格0.1-0.3标准差不等。托特的超额收益是在非常低的风险偏离的前提下做出来的,并不是靠暴露风格和行业的敞口,这样的超额收益来源更加稳定。


在融合多周期模型时,托特采用了 多周期规划路径的方式,得到未来股票的走势路径预测,而不是简单的涨跌方向预测,这样就可以更细致规划交易,优化交易成本。


关注公司治理,规模是结果不是目标


除了投资上的风险管理,托特还关注商业上的扩张和公司的治理。2015年之后,国内量化行业经历了高速发展期。时至今日,国内量化市场巨大,竞争日趋激烈。这种竞争也从因子、策略层面,发展为产品各个利润环节的比拼、最终是公司治理结构的合理稳定、以及正面持续的品牌价值输出。


量化本身兼具智力密集型和资本密集型特点,设备和人才投入一直是各公司成本的大头,托特也不例外。在设备和机房方面,公司初期投入数百万元建设数据和计算集群,并计划持续增加投入。同时,研发了自有的数据平台,可以更加高效的使用不同来源的数据。托特一直致力于将最先进的人工智能技术应用于量化策略的研发,基于其深厚的积累和对前沿技术的跟进,持续研究、迭代策略,提升公司的技术壁垒。


在人才方面,公司一方面提供有市场竞争力的薪酬待遇、建立完善透明的激励机制,并且对核心成员设计了合理的股权激励;另一方面不断完善人才培养体系和管理体制,努力帮助员工在公司获得更好的工作体验并能够更好地成长。


托特一直希望能够在量化的领域里稳健前行,不追求盲目的扩张,认为规模是结果而不能成为目标,托特的目标始终是提供行业中上水平并能够长期稳定的业绩。托特在商业扩张上始终坚持:一是公司管理规模要符合策略设计容量而不能盲目扩张;二是在规模上升的过程中把握节奏和进度,亦不可过快。


托特的投资理念一直不变,希望在风险控制较为精细的情况下,为客户创造长期、稳定的超额收益。在策略上,充分发挥团队在机器学习/深度学习技术经验丰富、技术积累雄厚的优势。商业上,不忘初心,不以规模为目标,稳健发展,用具有竞争力的薪酬和激励招募研究开发成员,加速策略迭代。


托特产品线涵盖了沪深300指数增强、中证500指数增强、中证1000指数增强、量化选股、市场中性,较为完备。指数增强类产品有明确对标宽基指数作为比较,在风格行业上保持较低的偏离。量化选股类产品适用于风险承受能力相对更好,更注重收益弹性的投资者。市场中性类产品适用于对收益预期相对较低,对风险控制较为看重,希望求取稳健收益的客户。


版权声明:部分文章推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。

格上财富:十五年深度研究,甄选阳光私募、PE/VC、海外基金等高端理财产品,为您的资产增值保驾护航!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153576
 
130 次点击