语义 – 文因互联

从语义网到知识图谱——语义技术工程化的回顾与反思

本文根据鲍捷在云知声的演讲稿整理

感谢Leona对演讲录音的记录和整理

 

知识图谱的皮相

031101

知识管理这个领域,有个分支叫语义网,这两年就改了名字叫知识图谱。知识图谱其实有狭义的和广义的区别。这里讲的是狭义的知识图谱。我觉得华东理工大学的王昊奋教授定义得挺好,抄在这里:知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。每个属性-值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。

继续阅读 “从语义网到知识图谱——语义技术工程化的回顾与反思”

金融报表数据的语义化

导言:这篇文章是以前笔者的两篇博客的汇总。因为是两篇论文的介绍,概念比较多,不是很好懂。过几天会再写一篇通俗版的,敬请关注。

XRBL是金融数据结构化,继而语义化的基础。这两篇博客反映的是2010年的工作,当时XBRL刚刚在中国成为标准。目前,在A股和新三板上XBRL都成为了财务报告规范的结构化形式。不过现在看来,XBRL本身作为近二十年前的技术,本身也有一些局限性。此外企业的信息披露材料有大量的内容无法被XBRL承载,不仅依然需要大量的人力去阅读原始材料,披露材料和XBRL报告之间的不一致性也是常见问题。解决这些问题,需要更灵活的金融数据结构化和语义化方法,也需要依赖人工智能技术做好数据的自动提取、交叉验证、信息搜索、价值判断。

就新三板而言,投资的核心是价值判断和规模交易。这是挂牌企业、做市商、风险投资机构和证券基金的根本需求。

人工智能领域的深度学习、自然语言理解、语义搜索技术的应用,会为新三板投资的行业研究和对标分析中提供全面、详实和高效的数据服务。尤其是在科技、互联网和TMT行业,这些国内券商普遍普遍缺乏研究人员,研究能力较弱的现实情况下。没有研究人员提供的报告,无法完成价值判断,大量的高科技领域的公司发展无人知晓、无法了解,证券基金入市规模和交易量受到制约。企业融资遥遥无期。

文因互联提供的大数据服务,能把科技领域的全球领先公司的信息应用到新三板挂牌企业的价值判断上,这门功夫是人工智能技术给予金融行业发展带来的实质帮助。

基于语义网的证券分析

 

022701

2011-04-19  Li(李娴)和我, Jim Hendler合作的一篇文章 “Fundamental Analysis Powered by Semantic Web” [1] (基于语义网的基本分析)获得了2011 IEEE Symposium on Computational Intelligence for Financial Engineering and Economics 最佳论文。

继续阅读 “金融报表数据的语义化”