2016年3月12日,由文因互联组织的“语义对话金融——人工智能与价值判断”研讨会在北京举行。我们邀请了众多金融界和技术界的知名人士参加,同时也吸引了一批资深的业内及跨领域从业者的参与和关注。
会议主要针对“人工智能”以及“金融投资”两方面内容及其结合领域的现状、方法和前景进行了深入而广泛的讨论。期间既从学术界的分享中了解到目前学术界发展的前沿信息,也从金融领域的诸多一线投资人的发言中,获知了对合作的渴望和对未来广阔前景的肯定。文因互联的CEO 鲍捷主持了这次研讨会。
会议的前半部分由六位嘉宾对知识图谱与金融领域的结合进行了解析,我们会在随后的推送中逐条发布详细内容。本文针对对话环节提出的问题及其讨论进行回放。
国信投资 张飞
短期交易可以被机器取代,但长期交易短期内很难被取代,在做合规的paper work上,对人工智能有很大的需求。
鲍捷提出的问题:现在金融领域对哪方面的数据有尚未满足的需求?
国信投资高级经理张飞回答了此问题。国信证券直投最早做Pre-IPO,现在仍然是主要投成熟期企业的PE机构,主要投资方向是制造业等。
他提出了两个主要观点:
1.短期交易可以被机器取代,但是长期交易中,机器难以完成人所做的工作。在前一阵子在清华大学金融学院的讲座里央行金融研究所姚余栋所长也提到了这一点。短期交易像高频量化交易,机器一定会替代人,但中长期的交易却要考虑到宏观上的许多要素,太过复杂。一笔投资,从进入到成长到退出往往会间隔数年。这些在短期内,是人工智能不能取代的。
2.PE股权投资虽然无法被AI替代,但着实需要AI的帮助。目前金融机构越来越多了,我们面对的客户大多不缺钱,2010年左右我们投资一家企业PE倍数大概5-8倍,今天给有的企业20倍它还是不满意。因为现在的PE越来越多了,传统PE机构议价能力在下降。谈项目就像谈恋爱,好项目就像是美女,是稀缺资源。判断一个项目是不是好项目,主要看两方面:价值和价格(财务数据和给出的价格)。看数据的工具大家用的都一样,万德(wind)和东方财富(choice)是重要数据来源,但它们仅仅能提供一个数据。我们面临的paperwork很多,就是写报告,现在很需要人工智能形成报告,立项、尽调、研究分析,这些方面都有很大的需求。一线业务人员、投资经理很希望能从这种工作中解放出来。其实PE做的是熟人生意,除了PE相关的,我一些投行的朋友也是对自家IT部门不太满意。做合规的paperwork这一块,有很大的需求。
极客帮创投合伙人 车东
在未来,处理能力是不必担心的,最缺的是数据。
鲍捷问极客帮创投的合伙人车东:为什么会投IT桔子以及这个行业后期缺乏的是什么?
车东作答:在投资时IT桔子有一些竞品,但IT桔子还是有它的价值的,相信在座的各位也在用,这个需求是存在的。刚刚各位提到的几个公司,我还在用IT桔子去查,可是没有查到。所以基础数据还是最大的问题。那些企业的数据做工商查询的话,批量购买1块钱一条,还是很贵的,几千万个数据买起来,成本很高。我们和IT桔子同时投的还有聚合数据,从天气等基本的数据开始提供,现在还有7000万个车牌号的信息。未来和现在缺的都是数据。处理能力是不用担心的。(备注:车东会后还是在IT桔子上找到了被提到的公司)
清华大学教授 李涓子
根据历史信息去预测接下来的事情是可能的,但历史信息的积累在现今还是一个问题。
弘毅金融的行业研究员曹辉提出问题:可否实现,从大量已知信息中推测出接下来会发生什么?比如说,如果地球上某个位置地震了,根据这个地方有没有铜矿和其产能,判断地震对铜市场有多大的影响,依此决定是否买铜。又比如产业链上下游关系很多,二级市场在很多时候需要针对他们的变化作出反应,如果给出很清楚的产业链逻辑,能够做到多精确的预测?就像AlphaGo这个东西,对于一定数量的实体,我们也许不清楚其中之间的关系,但所有的关系组合一定是有限的,能不能根据一些预先从外部设定的规则对它们自动组合?
李涓子:从各种地震方面的历史信息来看,比如说位置,地震的位置离核电站很近,环保部门就可以给出可能核泄漏的信息。这其中还有很多可挖掘的信息,如地震后的海啸,就是从许多地震中呈现出来的。事实上有足够多的历史信息后,从过去对新的东西做预测是可行的。比如黄岩岛事件,香蕉的价格从新闻中就可以挖掘。这些事情对经济的影响,技术不是不能做,只是需要很多历史数据把它们关联起来。搜索引擎得到的数据只是当前的,这些数据的积累仍是不够的。学术(指技术)界和金融界现在有很大的gap。比如说,在2000年初的时候我们给上海证券交易所做的年报分析,大家找数据的时候都是去年报里找,当时就有人提出这个需求,我们就把年报中大家关心的问题结构化了。
曹辉追问:有些信息无法在研报中体现,可以用互联网上的信息,我自己试着搞过一些关键字搜索。利用知识图谱挖掘他们的信息,其实效果很好,这个事情是不是有投入去做的意义?
林昕泉:美国有一个文艺复兴基金(Renaissance Fund),这几年他们可能不那么强了,前几年是非常厉害的。他雇了一帮专业做物理和数学模型的人组了一个团队。个人收益能够排在美国前几名,在十亿美元以上。因为对冲基金赚的钱都是自己的,所以很注重客观规律,很有意义。所以我认为做这个事情是很有价值的。利用人工智能去辅助搜集信息,挖掘联系,所以鲍捷你知道你现在做的事情能创造多大的财富啊。
鲍捷追问:那么关于规则的提取这一块要怎么做呢?
李文哲:关于规则提取这一块,我们也是在不断完善的。比如一个借款人进来,我们会在6、70个网站同时爬取,但是从这些信息中搜索出关联规则很难。尤其是推理规则,更是需要大量数据支持推理,变成完备的信息。同时去做量化的数据也是一个难点,比如要去量化A事件对B事件的影响大小,这是很难的。
陈利人:这个规则的提取,从建立到检验,首先是需要大量的数据去支撑。
基础文本结构化,能做到什么程度?针对这个问题,专家们展开了讨论。
李理:在小领域里,现在的技术实现这个不是问题。
李涓子:单个关系可以做到。国外的相关代码都是公布的。
李文哲:没有那么多有关的数据,要想推知a事件对b事件的影响大小,要获得量化信息是很难的。
陈利人:在这方面,我们不必关注大而全,FBI只做恐怖分子相关的信息搜集。多余的信息反而会干扰系统,不如只关注一个领域。越模糊越难做。
金融领域对价值判断的需求有多强烈?
技术界的董明锴向金融界提出疑问:在热点爆发前,提前发现值得投资的企业,也就是及时发现处于波形图中波峰前的企业,投资人对这个的需求强烈吗?
淡马锡投资总监林昕泉回答了这个问题:从低级分析员走到现在,投一级市场和二级市场的投资人都差不多,用的是同样的模式。投资是要靠数据说话的。我们要看公司的基本面,要看行业的基本面,也有价值投资的估值模型。现在是数据信息爆炸的年代,在对于信息和数据的处理中,其实许多事情都是简单重复的。我收获最大的还是能够和足够多的人去聊,不仅限于创业者,也包括同行,就是投资人。这一系列复杂的处理过程,有一些过程可以用机器来提高效率,就像刚刚有一位朋友提到的建立一些规则,我觉得可以建立一些规则来提高效率。现在做金融的很少有人想到这个。我现在也在看一些人工智能的公司,基于深度学习和语义都是在大量数据积累的情况下才能发挥出能量。而其实金融是数据积累最多的,而且结构化数据也比较多,我觉得今天在座的各位都是把握了正确的方向。我和明明主要是做一级市场的,但我觉得在股票市场上也是一样,还有债券市场等其他各种各样的金融领域,比如小额贷款、商业保理的风控,都需要人工智能。人工智能对他们来讲都是很powerful的,我相信技术一定能够做到,但什么时候能做到,这是未知的。
发表回复