新宝6娱乐app下载-新宝6手机app下载-新宝6官网 > SEO算法 > 10大机器学习算法简介新宝6娱乐app下载-新宝6手机app下载-新宝6官网

10大机器学习算法简介新宝6娱乐app下载-新宝6手机app下载-新宝6官网

admin SEO算法 2020年04月11日

  随着机器学习和人工智能技术被越来越广泛地应用于各个行业(比如向来喜欢赶时髦的资产管理行业),作为量化交易者,我们有必要了解一下这些AI新来者的“想法”(也就是算法)。

  linear model,GLM)。逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y

  服从正态分布。逻辑回归适用的二分类问题(比如预测涨跌),其概率与自变量之间的关系图形往往是一个S型曲线,如图所示,采用的Sigmoid函数实现。

  最邻近规则分类(K nearest neighbors,KNN)算法通过将不同的数据点分到不同的类(事先定义好的类)中,来解决分类或回归问题。KNN算法的原理非常简单,我们可以认为同类的事物都是聚在一块儿的,比如在一个地洞里,我们找到的动物大概率是老鼠、兔子这些啮齿动物,而不是老鹰或者海豚。根据这个原理,我们可以通过计算一个数据点与其相近的其他数据点的距离来对该数据点进行归类。KNN的算法非常简单,所以经常被来拿测试一个问题的复杂程度,如果一个问题连KNN都能将其较好地解决(比如区分兔子和海豚),说明这个问题本身就比较简单。

  支持向量机(SupportVector Machine,SVM)也是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的“线性分类器”。其学习策略是找到一个分类的规则使分类的间隔最大化。间隔越大,说明我们分类的可信度就越高。比如,我们要区分应当做多品种和应当做空品种时,我们分类的可信度越高,使用这个策略就越安全。

  比如我们可以通过分析过去多年的大豆期货收割期价格与其播种期、生长期的气候条件来做出一个通过气候条件来预测大豆期货价格的决策树。

  随机森林算法在决策树基础上更进一步,顾名思义,新宝6娱乐app下载-新宝6手机app下载-新宝6官网其用随机的方式构建一个“事件森林”,“森林”里面有很多的决策树组成。随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(作为分类算法的情况),然后看看哪一类被选择最多,就预测这个样本为那一类。新宝6娱乐app下载-新宝6手机app下载-新宝6官网

  多个“逻辑回归”神经元的组合就可以处理很多复杂的非线性问题。神经网络算法可以用来寻找不同资产价格的相关性,也可以对资产价格进行预测。

  比如我们给聚类算法提供各种资产的历史价格数据,算法可能会根据历史涨跌幅、价格相关性、价格的波动率或者其他我们也许并未在意的特征(比如包含某类的K线形态的比例)来对这些资产进行分类。

  聚类算法可以帮助我们通过“不受人经验约束”的分类来寻找一些我们过去难以找到的资产价格运行规律。

  比如我们认为寒冷且下雨的日子大盘容易下跌。天气“寒冷”和“下雨”两个特征也许是彼此依赖或者还依赖其他特征,但为了简化问题(变得“朴素”),我们可以认为“大盘涨跌”、“寒冷”和“下雨”几个事件都是相互独立的。这时,在天气寒冷且下雨的条件下,大盘下跌的概率可以表示为大盘下跌时,天气同时是寒冷且下雨的概率乘以大盘下跌的概率再除以天气寒冷且下雨的概率。

  朴素贝叶斯算法虽然和线性回归一样也算是机器学习领域的古董,但该算法处理小规模数据、有缺失的数据分类更有优势,且不会产生过拟合。

  从Google Voice Search和苹果Siri等企业目前都在使用RNN来处理语音信息可以看出RNN算法在自然语言处理领域更有优势。新宝6娱乐app下载-新宝6手机app下载-新宝6官网

  根据对多家量化投资机构的调查,目前机器学习技术在资产价格预测方面并未显示出针对传统预测方法的压倒性优势。原因可能是机器学习算法本身就植根于传统的统计学原理以及金融市场本身的复杂度仍旧超出了现有模型的预测能力。但其在交易执行、数据处理和风险控制方面还是能给从业人员提供明显的帮助。

  虽然我们还没观察到机器学习技术给量化投资带来颠覆性的影响(比如“AI基金”还没能让传统的人类投资经理纷纷下岗,标榜使用“人工智能”或“机器学习”技术的基金目前表现并不明显好于同行),但投资者也不妨未雨绸缪,多了解一些新技术。这一来能做到在市场上知己知彼,二来当颠覆真正出现时,也不至于猝不及防。

标签: