嘉宾观点:关于金融知识图谱的若干思考

人工智能的复兴

640

我其实是搞技术的,对金融倒也不是特别懂。但是通过刚刚的交流后发现知识图谱对金融有很大的价值。我其实有一个疑问,AlphaGo背后的科学真的是人工智能吗。真正做AI的人会懂,人工智能其实还是未来科学。人的智能是基于逻辑的,数理逻辑如何用符号表示,如何用符号去模拟大脑的逻辑推理模式,这个就是人工智能的符号主义。后来又诞生了连接主义,神经网络边缘化知识表示,我觉得最后还是要靠业界。还有一个是行为主义,也就是控制论。它强调的是人和环境的交互,强调的是一个反馈的过程。

知识图谱:链接碎片化的大数据

640

现在有几个热词,一个是深度学习,另一个就是知识图谱。知识图谱是谷歌搞出来的,十几年前就试了许多方法还是搞不出来,后来是谷歌推动的。其实有时候是业界在引领学科的发展,有时候又是反过来的。知识图谱的内在价值在于:怎么通过语义把碎片化的数据用规范化的方式关联起来。现在互联网上数据很多却各自分离,知识图谱用尽可能统一的方式把数据关联起来。知识图谱涉及的技术比较多,比如传统的知识表示等等。

640

知识图谱认为人真正的智能推理最后也是转变为一种向量去计算。我们现在也要把逻辑弱化,一种soft rule,不能做很强的推理。神经网络更多偏重计算,知识图谱更多偏重记忆,而真正的人工智能还得是二者结合起来才有更大的应用。

金融与语义

640

金融与语义是今天的一个主题。我看到鲍捷也写过许多文章。金融数据的结构化也是很多年前就做了,从08、09年就开始做了。这些年很多人都在考虑一个问题:怎么才能把金融的数据更好地结构化、语义化。我觉得要做知识图谱,还是要从基本的金融数据开始,刚开始可能不能完全靠机器,还是要靠手工。我们要充分利用结构化的数据,实质性更好的其实还是来源于文本也就是研报,其中有很多有价值的数据。

640

最基本的是要有实体,其次要有更高级的知识结构。接下来我们来看知识图谱能不能够做到量化金融。现在有许多学者,很确信在量化金融领域机器可以打败人。现在百度在做概念选股,主题选股,语义就可以帮助做这个事情,辅助我们更好地进行选股。毕竟现在信息太离散。人和人之间的关系更加不用说了,涉及的数据会更多。

640

最后说一下为什么知识图谱还是能在金融领域发挥很大的作用。首先,金融领域的数据是开放性不错的,比如医疗领域很多病例的数据是拿不出来的。其次,数据端很基本,文本、数据的时间特征很强。现在关联数据的诉求是确实存在的。

640

其实我是带着问题来的——拿金融知识图谱具体做些什么。我对于金融领域也不是很懂,现在有一个钉子你去设计锤子会比较容易,那么没有钉子去设计锤子非常困难。我也希望能够用技术解决金融领域的问题。

陈华钧
浙江大学计算机科学与技术学院教授,浙江大学计算机博士。曾赴耶鲁大学、卡耐基梅隆大学做访问助理教授和访问学者。先后担任国际万维网会议、国际人工智能会议、亚洲语义Web国际会议的会议主席和协作主席,欧洲语义Web国际会议、第十二届国际商业信息系统会议的国际会议程序委员会委员,国际万维网联盟W3C邀请专家, 中国电子学会云计算专委会委员 。

 

发表评论