从金融文本数据到金融知识图谱
-
- 报告人:鲍捷(文因互联 CEO )
- 报告主旨:2017 年 3 月金融知识图谱论坛以来,金融知识图谱无论是从数据内容丰富度还是应用领域都获得了重大的进展。早期的金融知识图谱,主要聚焦在二级市场股票投资和一级市场创投数据。近一年来,数据维度得到了很大的扩展,公告、研报、新闻、法规的结构化均取得重大进展,财报提取自动化已接近人类水准,多种类实体库建设得到落实。在应用层面,快速兴起了多个落地场景,如小微企业贷款流程自动化、银行内工作流程自动化、银行客户关系管理和获客、自动化审计、自动化监管、自动化资管等。本报告以翔实的案例汇报知识图谱技术在金融领域落地的具体实践。
- 技术突破:在推进金融数据图谱化的过程中,传统的、基于通用领域研发的图谱化算法和系统很难直接复用,主要有以下两个问题:
- 由于金融领域和通用领域的需求不同和文本特性不同,预训练的命名实体识别、知识提取等知识图谱化技术无法达到预期效果
- 由于缺少标注数据,重新标注数据训练模型的成本极大
为解决以上的问题,文因互联提出了一种基于知识规则系统、机器学习模型的交互渐进式的系统架构以及图谱化模型。其中规则系统有效地解决了缺少标注数据样例下机器学习无法冷启动的问题,而机器学习的应用有效降低了规则输入的成本,以及解决了规则无法快速泛化的问题。
- 报告人简介:鲍捷博士,文因互联 CEO。研究领域涉及人工智能多个方向,如自然语言处理、语义网、逻辑与推理、神经网络、图像识别等。在 International Joint Conferences on Artificial Intelligence (IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC), 和 Asian Semantic Web Conference (ASWC) 等期刊和会议上发表 70 多篇论文。曾任 W3C OWL ( Web 本体语言)工作组成员,在此期间,合作撰写了 OWL2 的 W3C 规范文档。先后参与组织 50 多场国际学术会议和学术研讨会,并任中国中文信息学会语言与知识计算专业委员会委员、W3C 顾问委员会委员、中国计算机协会会刊编委,中文开放知识图谱联盟( OpenKG )发起人之一。
相关阅读:
- 从 Kensho 看大工业金融的发展路径(上)
- 从 Kensho 看大工业金融的发展路径(下)
- 智能金融的破局(上):智能金融的本质是标准件化
- 智能金融的破局(中):想要颠覆式创新?先从小事做起!
- 智能金融的破局(下):完成旅程的关键是路径
- 智能金融系统的构建
- 文因互联:从「金融数据」到「金融知识」
了解更多,可点击【阅读原文】查看 2018 全国知识图谱与语义计算大会官网。
发表回复