量化金融是什么?有哪些岗位?需要学习哪些课程?
量化金融算是一个比较宽泛的词,可以理解为 Data 金融工程量化研究 Science in Finance (金融里的数据科学). 国内其实开设这个专业的不太多,在海外院校一般也是开设在graduate school,对应的专业包括 financial engineering (金融工程), quantitative finance (量化金融) 或者是 master in finance 项目下面的一些 quantitative investment (量化投资), algorithmic trading(算法交易) 等具体的分支方向。
凡是和金融搭上边,也能和计算机搭上边,其实都算量化金融的范畴。因此,有时候也能听到一些比如 fintech (金融科技), DeFi (去中心化金融), high frequency trading (HFT, 高频交易) 等词,都是这个领域下面的子概念或者类似概念。
项目经验:量化研究(金融工程)私募理财项目
苏州夏老师 于 2019-03-31 18:30:11 发布 782 收藏 4
一、技术选型
笔者是程序员出身,之前有过六年的程序相关经验,之所以选择转型到金融行业,一个是因为兴趣,以前在MT4平台上开发过EA、指标等;一个是因为确实想做些事情,程序项目一般都比较大,自己能做的只是很小一个模块,另外,金融行业确实能赚到很多钱;基于上面两个不太成熟的目标,毅然决然的投入到金融行业中来了。
说到技术选型,最开始的思路还是跟MT4上一致,有没有类似提供代码实现的平台,既可以做回测(backtest)又可以做模拟实盘自动化交易,后来发现国内没有类似的平台,继而寻找像ricequant、joinquant等在线量化平台,刚开始的时候发现这些平台确实很厉害,数据、API、回测、模拟交易应有尽有,功能大而全,但随着研究的慢慢深入,发现问题越来越多,首先,数据的准确性无法保证,数据的种类也不是很丰富,特别是基于各大平台自己研发的数据更是参差不齐;其次,API功能的实现,因为整个量化研究体系都是基于量化平台的,很多复杂一点的功能是不好去验证实现逻辑是否正确,有的时候相同的策略逻辑在不同的平台上实现,测试的结果截然不同;最后,策略的保密是每家做私募讳莫如深的,如果盈利的策略放在量化平台上去,是不是意味着策略的公开,这个会不会影响到策略后续的稳定盈利性也就是个问题。
基于上面的种种思考和分析,后面我们选择在本地,采用最原始的方式去实现,数据通过购买Wind、恒生聚源数据库和数据API接口,策略逻辑通过Python实现,也就是Python+Anaconda+Wind(聚源数据库),最后根据回测的交易记录把收益率、最大回测、夏普比率等数据通过Python实现。
采用Python+Anaconda+Wind(聚源数据库)可以完美解决量化平台上提到的三个问题,但确定是运行效率很低,像股票多因子策略,市场上有三千多只股票,如果每个周期遍历一次,时间损耗可想而知。后面基于这个又研究拓展了采用R+Wind(聚源数据库)模式,只是采用R语言实现逻辑之前,需要对数据进行处理使其可以直接被R语言调用,简单的一个例子就是收益率,首先可以把所有股票的每天的收益率(涨跌幅)按时间顺序存储在一张收益率的表中,如下:
日期 | 股票1 | 股票2 | 股票n |
---|---|---|---|
20190325 | 0.022 | -0.012 | xxx |
20190326 | 0.033 | -0.034 | xxx |
20190327 | 0.044 | -0.056 | xxx |
二、金融逻辑
量化研究(金融工程)只是一个投资的工具,背后的逻辑是基于历史的数据,严格按照投资逻辑回测,通过历史的行情去验证金融模型的盈利逻辑是否成立,最终还是以金融逻辑为出发点和立足点,金融逻辑没有盈利逻辑再完美的量化技术也是于事无补。这个要从量化的历史发展上来研究了,国内一般做量化的有三个流派:海龟派(留美、留欧)、土族派(清北复交)、无门派。海龟很好理解,接受的是国外先进的培训和投资理论,大部分都是国内优秀学生出国留学,在国外接触过华尔街和量化技术,后来回国创建私募公司,是国内最早做量化的一拨人。土族派也是出身名门,一般都是在券商或者国内大型机构做过研究分析工作,实战经验丰富,同时又不断学习和接受新技术的精英,一般会在私募中承担投资总监或者合伙人角色,很少有自己出来创业的。无门派出身五花八门,共同点就是在投资行业沉浮多年,有自己清晰的交易逻辑,能在市场上生存下去,有些甚至生存的很滋润。
通过上面对量化流派的分析,就能清楚的知道量化的金融逻辑主要来源也是三方面:国外研报(学术论文、投资机构、金融研究者等)、国内研报(券商研报)、经典金融理论、交易员干货。像AQR网站就提供了很多研究报告,国内的研报大部分都可以在Wind研报平台(RPP)上可以搜寻到,交易员干货就看不同交易员的水平了。
笔者有幸全程参与了一个实盘从零做到二个亿规模的金融模型的研发工作,承担了80%以上的研发实现到实盘管理,量化具体的流程如下:
【广发金融工程】精选量化研究系列之二:高频价量数据的因子化方法
(1)因子拥挤度相对较低。高频价量数据的体量明显大于低频数据。以分钟行情为例,用压缩效果较好的mat格式存储2020年全市场股票的分钟行情数据(包括分钟频的开高低收价格数据、买卖盘挂单数据等),约为12GB。如果是快照行情(目前上交所和深交所都是3秒一笔)或者level 2行情,数据量要大很多。因此,高频数据因子挖掘对信息处理能力和处理效率的要求较高。而且,日内数据,尤其是level 2数据,一般要额外付费,甚至需要自行下载存储实时行情,在此基础上构建的因子拥挤度较低。
因子构建方法和主要性能指标
2.1 因子构建方法
2.2 因子分析指标
日内价格相关因子
3.1 因子计算方法
3.2 与风格因子相关性
3.3 金融工程量化研究 因子全市场选股IC
3.4 因子多空收益率
日内价量相关因子
4.1 因子计算方法 成交量也是日内行情信息的重要组成部分。一方面,成交量的分布可以反映投资者的行为特征,另一方面,成交量与价格或者价格走势的关系可以确认价格形态的信息。
4.2 与风格因子相关性
4.3 因子全市场选股IC
日内价量相关因子以及平滑后的因子的IC如下表所示。 按照5日窗口平滑的因子对未来5天的收益预测能力一般强于原始的因子。 从原因子和因子MA5的ICIR来看,预测能力较强的价量相关因子是ratio_volumeH4、corr_VP、corr_VRlag、Amihud_illiq。
4.4 因子多空收益率
盘前信息因子
5.1 因子计算方法 盘前信息主要包括隔夜收益率(开盘价相对前收盘的收益率)和开盘前集合竞价信息。目前,A股证券交易所在每个交易日的9:15至9:25为开盘集合竞价时间。开盘集合竞价又分为两个阶段,其中第一阶段是9:15至9:20,该阶段允许撤销已经提交的订单;第二阶段是9:20至9:25,该阶段不允许撤销已经提交的订单。集合竞价信息反映出资金的试盘行为和多空双方的博弈。本报告考察隔夜收益率和集合竞价的相关因子如下所示。
5.2 与风格因子相关性
5.3 金融工程量化研究 因子全市场选股IC
5.4 因子多空收益率
特定时段采样因子
6.1 因子计算方法 本报告将部分时段的数据进行重点分析,产生衍生因子。一般来说,开盘后半小时(9点半至10点)和收盘前半小时(14点半至收盘)的股票成交活跃,多空博弈激烈,蕴含的信息相对较多。本报告针对收盘前半小时的价量信息构建了如下因子。