文/鲍捷,段清华
2015年在新三板上市的企业超过3500家,比整个主板的上市公司数量都要多。在新三板高速发展的同时,文因互联(Memect,2013年成立于美国硅谷)也随着它的创始团队回到了中国,希望用他们从美国学术界带回来的顶尖人工智能技术,帮助中国的投资人更好地做价值判断。
人工智能辅助价值判断的四个层次
与之相比,中国已于2008年11月12日成立了XBRL中国地区组织,也建立了上市公司的XBRL申报制度,但还在非常初级的水平。在中国,一般人难以接触到XBRL,它还停留在大公司与政府部门手中。
而这部分应该公开的数据,没有真正地开放出来,这极大阻碍了中国金融服务业的自由发展。在大部分投资机构中,很多金融实习生,还必须把非格式化的PDF文档包括公司报表、研报等等,整理为Excel、PPT等其他格式,这种机械的“脑力体力劳动”在当前时代是必须革除的。
在美国有家名为Kensho的公司,在2014年拿到了1000万美元的种子轮投资,Kensho的目标之一就是回答类似 “当油价高于100美元一桶时,中东政局动荡会对能源公司的股价产生怎样的影响?”,“朝鲜核试验后 48 小时内韩国公司三星的股价变化”这样的问题,这就属于情报分析,信息预警的智能应用。Kensho这种预警只是智能助手的一种可能性。在知识图谱的基础上,我们可以开发出更多的智能助手在金融领域的应用。
机器如何扩展我们的智力?
人工智能解放人类的第一点,就是解放“脑力体力劳动”,这方面包括但不局限于那些金融领域初级员工的工作。其中是包括大量Copy & Paste(复制和粘贴)工作的。新三板企业上市所需要的公开转让说明书平均超过250页,而这样的文件超过7000份,人类几乎不可能大海捞针的从中简单获取到我们想要的信息。而这还不包括其他信息,例如研报,新闻,公告等等。现在从事基础研究的金融从业员工,每天面对大量这样的文件。人工智能可以自动地将文本信息抽取、结构化,甚至进行分析,从而大大节省金融研究人员的时间成本。
人类的能力是有限的,据我们在业内的调查,一个复杂的金融关系图表,一个实习生平均一天可以做两张,一个熟练的研究员一天只能收集30条数据。而人工智能的目标是,在洞察力上达到人的水平,却能成百上千倍的并行工作,达到人远远达不到的超人规模。大家可以想象,如果我们能以更低的成本和更高的速度完成这些基本的工作,那将会带来多大的价值。
人和人之间的信息交流速度是极其缓慢的,如果我们将人与人之间的对话、文字的阅读,这些数据量化,那么实际上只能达到每秒几比特的信息量(bits/sec)。而我们知道就算是放在20年前,电话拨号上网的时代,电脑也能以每秒几千、几万比特的速度进行通信。
在金融领域中,往往一个研究员在一个很长的时间里都在进行仅仅针对某个特定领域的研究,为什么会有这种局限性?很简单,是因为人类的记忆力和信息处理能力是有限的。我们无法处理太多的信息,我们接收、处理信息的速度远远比机器慢。机器的教育成本很低,复制成本很低,机器将辅助人构成社会,帮助我们扩展进化中获得的有限的认知能力。这种人和机器混合构成的社会,被成为Social Machine。这并不是科幻,是已经发生的事情——想想人们多么依赖手机。
挑战与机遇
人工智能是一个很大的门类,包含很多不同的子科学与学派,现在众所周知的深度学习技术,实际上就是人工智能中的统计与机器学习学派在近些年兴起的一种新算法。
语义与知识:
技术阶跃面临的困难
阶跃发生所需的背景
中国背景:
► 投资供需失配
► 直接投资比例应提高
► 人民币基金兴起
► 注册制,新三板
► 大量新行业缺少分析
► 后期融资和上市公司投资服务不足
人工智能要在中国金融领域扎根,离不开中国的背景。中国的大背景就是金融业的不断发展与改革,投资供给增加,投资市场化。上面提到的一些是现在正在不断演进的过程,一些是正在面临的问题。这些问题也同时带来了巨大的机会,很多在美国上世纪70年代就已经没有的机会,现在在中国则出现了。
但是这些问题的解决,仅仅用旧的方法是不行的。问题的规模远远大于过去我们熟悉的问题。传统的投行体制、传统的工作流程都很难应对新的挑战。过去几年,我们已经看到大量的模式创新,在早期股权投资、新三板投资上迅速成长起新的投资机构。今后,我们预期不仅需要模式创新,也需要技术创新来解决这些问题。如果没有新技术的介入,没有生产力的提高,这些问题是不会自我解决的。只有用人工智能真正的解放金融业的生产力,才能改善生产关系,才能更好、更快地解决这些问题。
可能的趋势
互联网投行的兴起
从机器辅助价值判断走向规模交易
新三板上成长起中国的“高盛”
首先我们获取到一些非格式化的公开数据,这些往往都是文本数据。然后我们对这些数据进行格式化,编码化、数据清晰。对文本结构、文章和页面进行分析。在这个过程中,会有中文分词、句子标注、词汇分类,最终提取出不同的实体。这些实体包括人、组织、机构、时间、金额等等信息。最终这些信息经过校验、异常处理、数据标准化等等步骤,合并成为知识图谱。
通过知识图谱,我们可以发现很多深度的投资关系。例如:
这些问题都可以通过知识图谱在实体间进行推理、语义搜索得到。而通过语义技术,我们可以做到:
现在流行“互联网+”的概念,也有人提到“人工智能+”,然而当它们再次与金融投资携手,能迸发出什么样的火花?让我们一起期待吧。
发表回复