2020-02-14
以下文章来源于传统借贷vs新型金融 ,作者中泰金融
核心观点
智能投研的产业链分析:1、智能投研的核心是提升金融数据的分析能力,提高人工的工作效率。2、智能投研的产业链涉及数据的获取、处理及应用。上游是数据源,包含传统金融数据、爬虫数据及另类数据等;中游是数据的采集和标准化;下游是数据的需求方和应用场景,包括投资机构、监管部门及非金融机构等。3、智能投研行业的参与者:传统的金融数据服务商、创业公司、互联网巨头及投资机构内部研发。
三种智能投研的商业模式:1、金融文本处理工具。针对特定场景的金融数据处理的工具,所处理的文本以标准化为主,功能是审核检查,交付方式是项目制。客户是金融监管职能部门,其次是金融机构审核部门。2、一级市场数据库。提供全方位了解一级市场公司的数据库和搜索工具。产品的核心是标签体系;一般采用数据终端或者数据接口的方式交付。3、二级市场数据库。提供颗粒度更高的金融数据产品,重点在非结构化数据的处理。客户主要是二级市场投资者,尤其是量化投资;国内的客户还包括券商和综合金融集团。
底层技术:在智能投研中主要应用的人工智能技术包括图像识别、自然语言处理、情感分析、知识图谱等。1、优势:人工智能拓展了数据来源,大幅提升了数据运算的能力。机器能分析多元、非线性关系,寻找相关性而非局限于因果关系。2、不足:就现阶段来看,人工智能在有明确边界、规则和目标的场景中,效果才会明显。3、技术运用的约束条件:数据质量影响智能投研的效果,底层数据质量不断提升,智能投研的效果才会增强。
市场空间及行业趋势:1、中长期来看,智能投研的潜在市场空间远大于现有金融数据行业规模。产业要从数据服务广义的角度看智能投研的市场空间:收入的增量空间还包括对数据量、数据维度、数据综合服务的需求提升,以及投资机构增长和其他机构对金融数据的需求。2、智能投研的发展趋势:资产管理机构在数据及技术方面的投入增速大于资产管理规模的增速;传统的金融数据公司通过并购整合保持持续的竞争优势;大量创业公司在努力拓展人工智能的边界;成功的智能投研公司在数据服务的广度或深度上超越对手。
风险提示:金融行业监管政策变化、人工智能技术发展不及预期
(报告有节选)
智能投研的产业链分析
广义:人工智能在资本市场相关领域的应用。从使用者的角度来看,智能投研的受众包括各种类型的投资者(买方)、券商(卖方)、监管机构、银行和财经媒体等。从投资的标的来看覆盖一级市场公司、股票、债券、外汇等。而人工智能的应用场景涉及业务的各种环节,与投研直接相关的就包括研究、投资、交易和风险管理。
商业模式
交付方式及收费模式。一般采用数据终端或者数据接口的方式交付。如果客户本身有系统基础,即可采用数据接口方式,将其接入业务系统。数据终端按照数量收取年费,数据接口按数据调用量收费。
交付方式及收费模式。比较成熟的数据库采用数据终端的销售模式,按数量收取年费。此外,也可以与系统开发相结合。
底层技术
情感分析是自然语言处理中的一个重要研究方面,主要是对带有感情色彩的主观性文本进行分析、处理、归纳和推理。情感分析的发展得益于社交媒体的兴起,产生了大量个体参与的、对于人物、事件和产品的评论信息,通过机器学习,得出可量化的数据结论。
自然语言处理的应用场景:大数据分析、日志挖掘及分析、自动摘要、文本分类、信息提取、文本朗读/语音合成、语音识别、信息检索、文字校对、机器翻译、问答系统等。在金融行业的应用包括舆情监测、智能风控、智能客服等。
知识图谱
知识图谱:将知识结构绘制成以各个知识单元概念为节点的地图。知识图谱的基础是自然语言处理,在计算机对文本中的知识点理解之后,再建立起各个知识单元之间的关系,形成知识网络,最后以可视化的形式展现出来,或者通过智能搜索引擎呈现。知识图谱的底层是文本、标签和表格,在此基础上构建图表、模式、本体和规则。
投研领域的知识图谱。在投研领域,知识单元包括公司、产品、股东、管理层等,知识单元之间的关系包括上下游、竞争对手、合作、股权、担保等。知识图谱可以知识单元之间的关系网络直观地显示出来,当其中某个节点发生变化时,能快速识别出这个变化在关系网络中的传导过程及对特定主体的具体影响。
市场空间及行业趋势
智能投研的市场空间
要从数据服务广义的角度看智能投研的市场空间。(1)如果仅从投资机构的付费能力看,智能投顾的市场空间有限。头部的券商和具有一定资产管理规模的投资机构是收入的主要来源,机构数量和资产规模成为主要的限制条件。目前国内传统的金融数据服务被万得基本垄断,市占率超过80%,万得2016年的营业收入为13.3亿元,整个市场规模在20-30亿元左右。(2)增量空间1:投资机构需求的多元化。从数据层面,从传统的结构化数据向非机构化数据拓展,而非结构化数据的规模占到80%。从服务层面,在数据功能上要不断完善,提高自动化程度,减少简单重复的人工作业;此外数据服务与软件服务相结合,形成综合性的投资管理平台。(3)增量空间2:目标客户的多元化。从金融行业领域来看,除了投研部门之外,金融数据服务的对象丰富,包括投行业务部门、银行信贷部门、监管审核部门等。其他潜在客户还有媒体、企业、政府、法律机构等。
从长期来看,智能投研的潜在市场空间远大于现有金融数据行业规模。根据第三方市场调研机构Burton-Taylor的数据,全球金融数据市场的规模达到260亿美元,全球的资产管理规模约为80万亿美元;由证券业协会统计的国内资产管理行业的约为50万亿元,而金融数据行业的规模仅为20-30亿,与海外市场相比,市场潜力巨大。
资产管理行业长期保持增长。资产管理行业是智能投研的主要客户来源,资产管理行业的机构数量、资产规模决定了智能投研行业的收入规模。根据证券业协会的统计,截止2018年末,资产管理业务总规模约为50万亿元,其中包含了公募基金、私募基金、基金子公司、证券公司及期货公司。从增速来看,由于近两年宏观经济增速下滑、资本市场波动及监管趋严等因素影响,资产管理规模增速放缓,其中2018年整体规模有所下滑,但从2014年以来,规模的复合增速达到了25%。随着资产管理行业成熟度提升,更多机构(保险机构、外资机构等)和资金(养老金、居民储蓄等)进入资本市场,资产管理行业规模长期将保持增长态势。
智能投研的发展趋势
顺应资产管理行业精细化的发展趋势,资产管理机构在数据及技术方面的投入增速大于资产管理规模的增速。一方面,投资机构通过自动化程序不断提升运营效率,包括投资研究和交易;另一方面,投资交易的风格越来越偏被动和量化,逐渐降低人为主观操作的比例,或者说通过技术手段更好的执行投资经理的投资策略,这些需求都要提升投资机构的科技投入。具体来说,β收益产品要求更低的管理成本和交易成本,提升跟踪标的的准确度,α收益产品的管理难度不断提升,需要持续发现新的、有效的投资策略才能获取超额收益。Smart β产品介于主动及被动管理之间,人工智能可以帮助该类产品进行动态的因子调整,进一步提升获取超额收益的可能性。
传统的金融数据公司通过并购整合保持持续的竞争优势。传统的金融数据服务公司在数据积累及客户资源上具备优势,通过外部并购优秀的创业公司可提升数据产品能力,利用最前沿的人工智能技术,赋能已有的数据业务,增强客户粘性、做大收入规模。例如标普全球公司最近两年连续收购了固定收益技术供应商Algomi、替代数据技术公司Ursa Space Systems和Kensho以及机器学习与分析公司Panjiva Inc。
大量创业公司在努力拓展人工智能的边界。尽管海外金融数据市场非常成熟,头部几家基本都有数十年的历史,但在一级市场上仍有大量的初创公司在细分领域进行探索,运用自然语言处理、知识图谱等人工智能技术开发差异化的数据产品。
智能投研公司成功路径:深度和广度必取其一。(1)所谓广度,是指智能投研产品定位的目标市场的大小。一是把握资本市场的变化趋势,瞄准资产规模占比提升的细分市场,例如前几年的债券市场、近期快速拓展的ETF市场。由于这些市场处于扩张期,参与机构数量会增加,相应的智能投顾市场也会扩容,把握机会就能快速做大客户规模。二是关注非投资机构的需求,自然语言处理是相对底层的技术,从金融本文中训练出来的算法也可以向其他行业的标准化文本进行复制,从而扩大受众范围。(2)所谓深度,是指智能投研产品的数据挖掘能力及智能化水平。根据现有公开数据构建更加细化的产业链知识图谱,发现潜在的相关性,并持续将更多维度的数据纳入。另一种路径是做出有市场影响力的数据产品,如行业指数等,这也是成为头部数据公司的标志。
海外案例分析
数据分析公司Kensho
阿拉丁是贝莱德科技服务的主要收入来源。阿拉丁的收费模式是在平台上管理的资产规模乘以固定的费率。阿拉丁的数据中心有六千台服务器,为全球170多家金融机构、1.7万名交易员提供服务,这些客户管理的资产规模达到11万亿美元,贝莱德本身也在阿拉丁平台上管理资产。阿拉丁的营业收入呈现出持续上升态势,2018年贝莱德的科技收入达到7.87亿美元,其中主要是来自于阿拉丁的收入贡献。
国内公司案例分析
文因互联
公司2015年11月成立,2017年初将发展方向确定为监管科技,目前主要服务监管部门和银行,提供自动化和智能化方向的解决方案,目前收入占比约为2:1,未来预计银行业务的占比会提升。服务上交所、全国股转公司等核心监管机构接近两年半,期间完成多个核心监管系统开发项目。银行客户包括平安银行、招商银行、南京银行、江南农商行等。公司团队具有海外研究及工作经验,创始人是国内仅有的参与过知识图谱领域创建的从业者(W3C知识图谱标准OWL作者之一,W3C顾问委员会委员,XBRL语义建模作者)。公司目前超过65%为技术开发人员,硕士和博士占比超50%。
产品定位:一是金融文本自动解析平台,运用自然语言处理和知识图谱技术解析100多类金融文档,包括招股书、产品说明书、监管函、研报、公告等,实现搜索、问答、自动生成报告、财务审核等,从非结构化文本中提取结构化数据;二是金融行业标准化流程的自动化应用,包括财务分析、会计勾稽关系验证、公告合规性检查、信贷业务合规性审核等。
技术能力达到工业级可用,近乎实时。(1)质量方面,表格准确率99%,文本95%以上。准确率是指目标信息点的准确率(例如招股书大约有300-400个信息点),具体由客户来定义。审计客户的准确率要求更高(原则上要求100%,能达到99.8%)。(2)速度:200页的文档处理时间为30秒,行业平均水平为10分钟。
拥有完整知识图谱能力。知识图谱包括四个层级,图、模式、本体和规则,实现在文本中提取出实体以及关系的效果,并做进一步逻辑推演。基于语言解析和知识的整体抽取,运用先验知识和常识知识,训练了100多个模型,综合运用多种模型,实现小时级迭代,提高整体的准确率,而不是单个指标的提升。
(报告内容有节选)
发表回复