这一期智能金融沙龙由本司的美女分析师——严泽徐主讲“中美智能金融行业现状分析”。火热的天气依然抵挡不住大家的参与热情,吸引了20多位来自人工智能和金融行业的人士报名参加。
Tips:下期的话题依旧很精彩,千万别忘点击阅读原文报名哦。
中美智能金融行业现状分析
首先说三个名词:
金融科技,这是一个大的概念,包括互联网金融和今天要说的智能金融都属于金融科技的范畴。
互联网金融是一个非常火热的名词,但其实是包含在金融科技之中的。前段时间很火的P2P就属于互联网金融。
智能金融则更强调人工智能与金融结合,让人工智能技术参与到金融工作的某个环节中,然后提高整体金融工作的效率。
以投资银行完整业务线来看,可以看到智能金融在并购、证券研究、投资银行比较重要的自营业务交易、投资银行面向私人做的投资服务比如投资管理上都有渗透。智能金融在其上应用的主流技术主要是机器学习(Machine Learning)、自然语言处理(NLP)、知识图谱(Knowledge Graph)、语义搜索(Semantic Search)。这四种技术的主要应用场景如下图:
自动报告生成
投资银行里撰写招股说明书是有固定格式要求的。我们对一些金融机构的研究员进行访问的时候,他们提到了这种固定格式,通常撰写一篇报告要在固定的格式下罗列数据,然后加上评论。其中包含长时间的复制粘贴,这种工作非常枯燥,会减少他们融入自己主观判断的时间。同时在研究员进行研究的时候,偶尔会融入一些人工的错误,需要人工反复检验数据的一致性和准确性,但无法完全避免。另外,股转系统数据不一致的一次反馈与反馈意见回复往往要花费半个月以上。基于以上这些原因就产生了自动报告生成。
自动报告生成主要涉及到的技术是自然语言处理。
第一步是文本分析,主要是对报告中的语言进行消化,对于文本中的图片和表格需要OCR(光学字符识别)等技术解析。
第二步是分析数据,用机器去理解业务逻辑,将其关键逻辑主干抽出,结合事件地点等因素,将关键信息嵌入预先设计好的报告模板中。
第三步是文章生成,也就是报告的生成。选择符合其需求的模板确定主题与关键信息,以及报告呈现形式,便可生成基本内容。
关于自动生成报告,这里介绍四个公司,分别为Narrative Science、Automated Insights、Dreamwriter(腾讯)、搜狐的智能报盘。
Narrative Science是四家公司里唯一一个面对金融领域的服务商。该公司的著名数据分析平台Quill可以分析结构化数据,将人工智能与大数据进行技术融合,理解这些数据的重要性,从而产生简短的文字表述或结构化的报告内容。它是由西北大学教授合办的。
Automated Insights 是一家美国的公司,被美联社投资,已为美联社自动生成出10多亿篇文章与报告,后被Vista Equity Partners收购。Vista Equity Partners是一家PE公司。
腾讯的Dreamwriter根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。腾讯称,写稿机器人不会抢走记者的饭碗,希望Dreamwriter能够解放记者,让记者从事更具挑战和智慧的工作。它在2015年已经上线使用了,现在用搜索引擎去搜索,可以看到很多新闻出自Dreamwriter。
搜狐的智能报盘,它由机器人自动跟踪、捕捉股票市场动态,并实时发布资讯的智能系统,通过搜狐新闻客户端“财经频道”同步推送给用户实时股票信息。2016年1月上线使用。它面对股票的散户,实时定制化推送。
人工智能辅助交易策略
人工智能技术贯穿辅助交易策略生产的三个阶段。
阶段1 从数字推测模型:机器学习
第一个阶段是数字推测模型。在交易策略发展的初步阶段,量化分析师主要根据财务和交易数据进行建模,然后分析其中的显著特征,再利用回归分析等传统机器学习算法预测交易策略。以上方法存在两个弊端:其一是数据问题,数据往往不够丰富,仅限于交易数据,同时数据中也存在许多噪声;其二是它受限于特征的选取与组合,模型的好坏取决于分析师对数据的敏感程度,模型选取受量化分析师的主观判断。运用机器学习的技术,模仿专家的行为,选择某一领域的特定专家,复制他们的决策过程,并导入可重复的计算框架。
全球最大的对冲基金桥水基金(Bridgewater Associates)早在2013年就开启了一个新的人工智能团队。该团队将设计交易算法,通过历史数据和统计概率预测未来。他们把Watson负责人David Ferrucci挖了过来。他们的核心数据根据市场变化而变化,其程序不断适应新的信息,而不是遵循静态指令。
第二个是Aidyia,它是一家香港的人工智能初创公司,致力于用人工智能分析美股市场。基于多种人工智能的混合,包括遗传算法(genetic algorithm),概率逻辑(probabilistic logic),系统会分析大盘行情以及宏观经济数据,之后会做出自己的市场预测,并对最好的行动进行表决。它推出第一天的封闭的基金池收益率达2%,收益率在所有对冲基金中排名前20%。
阶段2 把握市场动态:自然语言处理
在交易策略发展的中级阶段,量化交易分析师发现了数字推测模型的局限性。在此之后,他们开始引入政策、新闻以及社交网络中丰富的文本。运用自然语言处理技术分析,将非结构化数据结构化处理,并从中探寻影响市场变动的线索。
代表公司:
1.CommEq是一支率先使用自然语言处理技术的人工智能对冲基金。CommEq的投资方法结合了定量模型与自然语言处理(NLP),使计算机能够如人类一样通过推断和逻辑演绎理解不完整和非结构化的信息。
2.Sentient采用自然语言处理技术。它运用自然语言处理,深度学习(Deep Learning)等多种AI技术,进行量化交易模型的建立。它企图发现市场变化的线索,利用自然语言处理将非结构化的数据结构化,希望机器可以像人类一样开始进行智能交易。它是一家李嘉诚投资的美国人工智能系统研发公司。
3.Kensho是其中最为知名的,它是号称可以“取代投行分析师”的投资机器人。Kensho结合自然语言搜索、图形化用户界面和云计算,将发生事件关联金融市场,提供研究辅助,智能回答复杂金融投资问题,从而加速交易时间,减少成本,用动态数据与实时信息,及时反映市场动态。它也可以利用AI回答一些关于深度关系的问题。
阶段3 减少黑天鹅事件对预测的干扰:知识图谱
在交易策略发展的现阶段,机器学习与自然语言处理的技术经常会在一些意外(如“黑天鹅”事件)发生的时候预测失败,例如911、熔断机制和卖空禁令等等。这类事件发生的概率很小,但是一旦发生就会带来很大的影响。人工智能系统没有遇到过这些情况,无法从历史数据中学习到相关模式,这时候如果让人工智能管理资产,会出现模型失灵的情况,就会有很大的风险。在这种情况下,知识图谱技术被引入,知识图谱本质上是语义网络,是一种基于图的数据结构,根据专家设计的规则与不同种类的实体连接所组成的关系网络,它提供了从“关系”的角度去分析问题的能力。
Dataminr是一家基于Twitter及其他公开信息的实时风险情报分析公司。它致力于从数据爆炸的社交网络提取精简且价值的风险情报与挖掘关键信息,如舆情热点、金融相关的非交易信息、公共机构安全预警、企业安全等,并直接向客户推送。除此之外,Dataminr还加入早期预警系统,并实时推送警报。它目前是一家面对企业的公司。
Palantir Metropolis是一家基于知识图谱的金融数据分析平台。它可以整合多源的量化资料,并提供一套方便易用的分析工具来满足复杂的研究需求,其中的组件能够进行复杂搜索,可视化编辑与分析,有非常丰富的人机交互能力。将结构化客户内部数据,关联相关数据,让客户自己创立分析规则整合并优化模型,量化处理数据,解决特定需求。它最早提供反恐的信息,现在和摩根大通合作了一个用户识别的安全系统,目前主要做定制化的一些服务。
金融搜索引擎:证券研究
在传统证券研究工作中,研究员进行研究工作的时候需要搜集海量信息,再整理和分析其中内容。目前绝大多数证券分析师所运用的辅助研究软件,比如一些数据终端,它们只解决了基础数据问题,而没有考虑到信息过载的问题。在面对大量基础数据与爆炸的信息时无法寻找到最有准确有价值的信息,也无从提高其工作效率,这会浪费许多时间。
目前用在这上面的技术主要是知识图谱。高质量的知识图谱和大量的业务规则可以帮助实现联想、属性查找、短程关系发现。其中语义搜索可以提供不同类型的查询(比如企业、基金、事件等),如智利地震对铜期货的影响等。它将信息切片后再聚合,提供纵览的可视化元素以及便捷的交互界面,将复杂的查询与过滤交给用户完成。
这个做的比较好的是美国的Alphasense。它是一个在数据层面上轻量级,将复杂逻辑判断交给用户去完成,专注于解决专业信息获取和碎片问题的金融搜索引擎。面向金融投资领域,从文件、新闻和研究报告中集合投资信息并进行语义分析,在全球公司数据中进行趋势分析。其使命愿景是从大量噪音中寻找有价值的信息,专注信息丰富度和碎片化基本问题,从而大大提高金融人士的工作效率,节省工作时间。
智能投资顾问财富管理
传统财富投资顾问需要站在投资者的角度,帮助投资者进行符合其风险偏好特征、适应某一特定时期市场表现的投资组合管理。而这些工作都需要以大量昂贵的人工方式完成,所以财富管理服务也因此无形的提高了进入门槛,只面向高净值人士开设。并且无法实时根据市场动态调整给予调整投资组合的建议。
智能投顾主要用来进行财富管理,面对高净值人士,比如私人银行是有资产门槛的。它用最少的人工干涉进行资产组合管理。目前没有利用某一个特定技术,而是综合利用人工智能,模拟动态市场上的投资组合表现进行投后跟踪。它旨在用一些机器生成的策略战胜人性,避免投资人受市场变化而产生的不理性情绪的影响,使机器严格执行事先设定好的策略。它能够进行更为透明开放的信息披露,及时提供风险提示。
Wealthfront就是一家非常具有代表性的智能投顾平台,它借助于机器与量化技术,将现代投资组合理论(MPT)分散风险,旨在提供一个自动化的投资管理服务最大化投资回报。它已经在市场上得到很好的反应,其管理资金规模在2015年至2016年终增长将近64%,截至2016年2月底,Wealthfront的资产管理规模已达近30亿美元。
Schwab intelligent portfolios是嘉信理财旗下的智能投资产品,它能以蒙特卡洛模拟动态市场上的投资组合表现进行投后跟踪。同时在投资组合亏损的同时,机器会自动进行税收亏损收割,即将卖出亏损的证券递减一部分资本利得税。而当投资组合偏离预先设定的风险容忍度与资产配置建构时,机器会自动通过一系列买进与卖出的行为进行资产平衡的调整。
最后把一句麦肯锡全球董事的话放在这里:
“由于中国中产阶级热爱新技术,“机器人理财顾问”和基于大数据的顾问服务模式将迅速崛起。
企业如能同时实现快速规模化并运用计算机数据找到创新的解决方案,就有可能迅速实现行业整合。”、
在未来,金融和人工智能结合成为智能金融拥有无限可能。而智能金融正在以一种人机结合的方式去提供大量的辅助决策工具,让投资人在形成逻辑链条的过程中,更容易地获得数据和分析层面的支持,才能以更多的精力去发现机器不善于完成的工作,从而大大提高工作效率。
部分讨论片段:
嘉宾:国内有学Kensho的吗?你们觉得哪家做的还不错?
王丛:我个人认为它说的很多东西是现阶段技术做不到的,短期内实现不了Kensho的目标。曾经有一家模仿Google做知识图谱问答的创业公司,一直都没有看到什么成果。
嘉宾:有一家公司和阿里合作拿到了一些数据,输出的结果最高有56%的准确率。
王丛:国内数据不公开,数据不完备,去做这个事情很难。之前有个做量化的朋友,说各家的数据都有错误,要都买下来再互相校验。从数据这个基础层面就很难做这个事情。
嘉宾:智能报告归纳整理给投资人,其中利用的信息是公开信息,但他们的内部信息,比如董事长给的信息,你们不知道,你们怎么看待这个问题?
王丛:我们的一个使用场景是路演。路演上,企业有时候会吹牛,比如说自己在某行业是第一家,路演上经常能够听到类似的话。但投资人心里会有一些疑问,他说是第一家就真的是吗,那我们就可以提供一个工具去满足好奇心。但是到了DD这个环节我们很难帮上忙,我们帮助的是更前面的环节。DD的时候就是看投资人的自身水平了。另外,搜索引擎要解决的是信息的可发现性问题,特别是海量信息的过滤,还有快速的、随时随地的数据访问问题。它不是要解决传小道消息的问题。基础的数据的可获得性、可发现性本身已经有巨大意义了,解决起来也不容易。
嘉宾:关于分词词库,你们认为做的好的有哪些?
王丛:哈工大,中科院,清华也有个新的。我们用的是开源的,这几个用的比较好。其实工程中有很多Trick,比如可以用百度翻译,假设百度的分词好于开源的,翻译成英文就没分词问题了。真正用到工程中,主要还得靠领域词表的维护,开源的分词只是个基础过滤。我们在搜索中还用到了深度学习,word2vec,比如搜VR会知道它和AR是相关的。
自由讨论环节持续了一小时多,这里只节选了一小部分。想了解智能金融沙龙的全过程,欢迎到场参加我们的活动。
发表回复