从量化视角谈谈数学在投资中的作用

​​喜提第二个十四天宅家百无聊赖之际,忽然想起去年的某个时候时候说过抽空写篇文章谈谈数学在投资中的作用。之前工作都比较忙,这事也就一直搁置了,如今宅家抗疫,正好得空写上一篇。

对于量化投资我个人的理解就是通过对海量数据用科学的模型进行分析,把那些投资中绝对正确的最基本的方法论中的决策信号明确化的过程。解决的是诸如高抛低吸多少算高多少算低?跌了买一点涨了卖一点跌多少买涨多少卖?波段低位买波段高位卖何时算低位何时算高位?牛市持股熊市空仓何时算牛市何时算熊市?等等类似的问题。归根到底就是将投资中的哲学问题数理化。在这个过程中不可避免的就要用到数学这一最基础最实用对人类贡献最大的学科工具。提到数学很多人第一反应就是好像真的没啥用,会加减乘除就够了,大学研究生学的那些这辈子也用不到。的确,日常生活中高端数学用到的地方确实不多,然而一旦进了稍微专业一点的领域,无论任何学科数学都是不可或缺的工具。量化投资更是如此,可以毫不夸张的说玩量化就是玩数学。我个人也是这几年才开始涉足量化领域水平非常有限,而数学又是一门庞大的系统性的学科,由于篇幅和水平的限制这里也仅仅只能做一个简单的科普性质的介绍,想到哪说到哪意在提升大家对数学学科的兴趣。

好了,言归正传先来说说初高中数学。小学数学就不用说了加减乘除,每一个股民都用的上。到了初高中就开始涉及函数、几何这些日常生活基本用不到的内容了。在投资领域这些内容直接的应用好像也不多,能想到的最显性的应用也就是年金复利相关的问题,直接用到了等比函数相关的内容,除此之外直接的应用好像并不多。但如果你把市面流行的各个技术指标背后的算法拿出来看一下,就会发现里面充满了初高中数学。实际上各种诸如kdj、macd之类技术指标本身就是把各种投资思想抽象出来的量化模型,只是用到的数学工具相对简单罢了。所以你并不是没有用到数学,只是在使用技术指标分析的同时不知不觉中就踩在了初高中数学的肩膀上了。事实上各个学科都可以看做是建立在初高中数学的基础上的专业领域的提升包括数学学科本身。

最基础的说完了现在上升一个台阶高等数学。既然技术指标初高中数学就能搞定了那么那些令人费解的导数、微分、积分又有什么用呢?数学作为一门工具性的学科直接的显性的应用并不是多,越是高端的数学这种现象越明显。如果硬要往上靠的话,观察上涨或者下跌的力度算是导数对应的应用了。求每天涨跌值实际上就是求价格序列的一阶差分,对于时间序列来说就相当于是一阶导了。看到这你也许会说了,这不就是加减法吗?是的,但他也确确实实是离散时间序列的导数,把这个拿出来仅仅是为了举个例子。前面说过量化就是通过搭建模型将投资思想抽象化之后再利用模型的结论将决策信号明确化的过程。这里面将投资思想抽象成模型是一个过程,通过模型的输出找出最优的决策信号是另一个过程。而第二个过程不可避免的就要涉及到寻找收益极值,概率极值的问题,这里面往往就需要用到以高等数学中导数、级数为基础的一系列数学方法的帮助。现在再回到上面提到的最简单的量化模型技术指标,目前市面上大家常见技术分析方法都是从图形观察的角度给出的经验性的决策信号,而这些信号你真用起来的时候就会发现很多时候并不是那么理想,相信真正用过的人都应该明白我在说什么。这个时候很多人会想到把几个指标组合起来用,如果你有这样想法就要恭喜你了,你的量化思维上了一个台阶模型开始变复杂了。这个思路很好,但怎这么做的时候你会发现很多时候指标之间是打架的,这个时候就需要用一些方法来平衡这些指标了,最简单的平衡方法就是各加一个权重再结合历史数据找出收益最优的权重分配,这下子有回到了求最大最小值的问题上来了。事实上从量化的角度来看任何投资决策归根到底都是一个求极值的问题,在这一过程中只是简单模型用的数学工具简单一点,复杂模型用的数学工具高端一点而已。比如前面说的市面上的技术分析本质上也是在寻求一个不同周期上涨下跌概率的极值,而求极值的时候使用的数学工具是图形观察法。

接下来再来说说概率论,前面说过量化有两个过程搭建模型和求极值。求极值的问题交给以高等数学为基础的一系列数学方法解决了。而模型搭建的问题很多时候就需要用到概率的模型方法了。说到这不得不提到一个大家都熟悉的高等技术指标布林线,为什么说它是高等技术指标呢?因为它在普通技术指标的基础上用到了一个简单的概率思想正态分布的3sigma法则,尽管对于把价格序列简单的看做正态分布序列的做法并不是很符合实际。对于A股数据来说分布往往呈现尖峰肥尾的特征,这样的分布用简单的正态分布去假设效果并不是很好。但仅就方法论上来看,也算是概率论在投资分析的上的应用。实际上国内很多做量化的私募特别是做配对策略的机构模型基本都是通过构造一个符合正态分布的统计量利用3sigma法则的思想来实现的。而构造正态分布统计量的过程用到最多的就是概率统计的方法了。

下一个要说的就是线性代数和矩阵论了。相信百分之九十九的学过这两门课程的人包括我当初都会有这样的疑问,这他妈是哪个傻X想出来东西,到底有啥用?对于这个问题老师的答案永远都是以后工作了你就知道它的作用了。记得当时我还专门和讲师认真的请教了一下能不能举一个工作中具体的案例,最后得到的答案是其实我也不知道我的老师当时也只是告诉我以后工作了就知道了。于是这个疑问就这样一直深深的埋藏在了我的心里,而在之后的工作中也始终没有得到答案。直到接触了量化很多多元高维模型之后才逐步认识到了线性代数的作用。对于线性代数我的理解它本质就是一种用来和计算机交互的语言。只不过是站在计算机的角度把数学问题转化成方便计算机处理的数学语言,仅此而已。是一个纯纯粹粹的工具,而这个工具脱离了其他数学工具本身并没有太多的应用场景。当然这只是我个人的一点看法,由于水平的限制只能得出这么简单粗暴的理解。量化领域绝大多数的高维数据的统计模型都是应用线性代数的方法来实现求解的。而这一过程很多时候都是在背后实现的,我们基本上看不见。但是它确确实实解决了实际的问题,我们不能因为看不见就认为它没有用。

下面要谈的是优化理论,数学是一门低调的学科越高端的数学工具显性的应用越少,这也直接导致了很多人认为数学没什么用。前面说过量化的两大过程建模和求极值,优化理论就是一个用来求解极值的低调的数学工具集。投资领域优化理论最经典的应用场景莫过于投资组合最优组合边界的求解。对于几个确定风险的品种,如何得到一个仓位组合能在一个给定风险的前提下获取最的大收益,就是一个最典型的优化问题。对于高端量化模型,优化理论是一个不可或缺的工具集。区别只是符合凸函数能找到确定的最优解,其他的只能找到相对的最优解,当然后者是我们要尽量避免但又无法回避的情况。

接下来再来说说另一门扯淡的课程随机过程,有句俗话说得好随机过程随机过。作为通信信号处理的基础随机过程,绝对是一门比线代还扯淡的课程,扯淡的原因在于随机。理论上一个完全成熟的股票市场本身就是一个完美随机的过程,但现实中这样成熟的市场并不存在。事实上包括美国在内的所有市场或多或少都存在着一定的内在规律,只不过这个规律的影响有大有小。这里最常见的一种思想就是过去的信号会对未来的信号产生影响,对应的就是随机过程里的马尔科夫过程。不过在实际的应用过程中马尔科夫模型在股市中的应用并不太理想,但在自然语言分析领域却有不错的效果。如果换个角度通过舆情分析来为投资决策提供依据,那么这个模型就有了自己在投资中的应用场景。除此之外,如果把股价看做一个通信系统的信号,那么很多复杂信号的滤波技术就有了应用场景,而这些的基础就是随机过程。顺便说一句其实大家熟悉的均线就是一种最简单的滤波技术。事实上很多高大上的模型或多或少都利用了信号的滤波技术来去除所谓的市场噪声,只是这些滤波技术相对于均线要复杂的多,有些甚至还具备预测的能力,比如十年前风靡花街的卡尔曼滤波就是一种有预测未来信号能力的滤波技术,不过伴随着市场的不断自适应,单纯卡尔曼滤波的预测效果这几年的表现并不是很好。

不知不觉扯了有3000多字了,受限于个人的水平,也就只能科普到这个程度了,算是对之前许的愿有个交代了。如果大家看完之后能够产生对身边的数学工作者好一点的想法,也算我的这通辛苦没有白费。

原文地址:http://www.taolituan.com/2512.html

欢迎使用微博客户端扫码关注套利团微博(因昵称“套利团”不给认证故改名为“业余宽客”)

发表评论

电子邮件地址不会被公开。 必填项已用*标注