2017年4月 – 第2页 – 文因互联

NLP 与知识图谱的对接

 

 白硕 2017.3 于杭州

两个问题

第一个问题是,为什么有人说“中文知识图谱”,难道知识图谱是有国籍的吗?它是有母语的吗?知识是无国界的,这个当然是理论上的说法。具体到一个国度,一个语言文化的大环境,我们就会发现,事实上知识是有母语的。理论依据就是所谓的语言相对论。可能大家最近都看了《降临》,《降临》讲的就是语言相对论。一种思维方式、一种文化是被它的语言,它所操的母语所塑造。这是一个很重要的论断,也正因为这个,在英语世界里搞得非常好的一些技术,到汉语的世界来,就有可能水土不服。这给我们提出的任务,就不止是一个移植、汉化的问题。实际上与 NLP 的对接,就是知识处理。与 NLP 对接的这一块,任务比我们想象中重。语言的差距越大,亲疏关系离得越远,这个任务就越重。因为英语和德语之间不会那么费劲,法语跟意大利语之间也没有那么费劲,但是英语跟汉语之间,可能就是要费劲的。这与语言相对论是同样的道理。

第二个问题,知识图谱与 NLP 对接是一个新问题吗?这需要看我们从什么意义上讲。

继续阅读 “NLP 与知识图谱的对接”

Web的50年——从Tim Berners-Lee的图灵奖说起

作者:鲍捷,文因互联CEO

Tim Berners-Lee昨天拿到了2016年度的计算机科学最高奖:图灵奖。他获得这个奖,实至名归。领域中人一直都认为他得奖只是时间问题。

Tim 的一生有两个伟大的贡献(当然,他还有很多其他的贡献):一、互联世界的文档,即万维网(Web)的发明及其规模化的努力,包括 W3C 的工作;二、互联人类知识的努力,包括语义网(Semantic Web)、互联数据(Linked Data)、开放数据(Open Data)、知识图谱(Knowledge Graph)等。第一个贡献已经广为人知,第二个贡献还在发展中,知道的人不多。但是我以为,第二个贡献将会是比第一个贡献更大的贡献。

继续阅读 “Web的50年——从Tim Berners-Lee的图灵奖说起”

Web的诞生与Tim Berners-Lee

2012的几篇文章,现在贴在一起 。原文

Web的诞生与TBL(1)

什么样的发明是人类最伟大的发明?那些能对存在的三种基本形式:物质、能量和信息的传输和转化做可扩展到为每一个人服务的发明。

对于信息,这意味着那些使信息可以更有效的转化和传输的方法:语言、图画、文字、纸、印刷术、电报、电话、电视、…、Internet、Web。

想改变人类历史吗?做一件能促进人与人的信息交换的事吧!

Tim Berners-Lee (TBL)就做了一件这样的事。他发明了Web。

继续阅读 “Web的诞生与Tim Berners-Lee”

知识管理和语义搜索的哲学思考

(整理自鲍捷20161026于将门的报告

(未经作者审阅,一些听写错误没有纠正。请勿转发)

事先请大家原谅,今天这个分享会比较干,所以我在思考前面加了哲学两个字。我以前做语义,现在做知识图谱,今天分享的这些东西是基于这十几年实践中的很多失败经验。这其中有一些经验、教训反反复复的出现,我就在思考如何避免这些问题。所以今天这个分享的目标听众实际上是架构师,也许现在这些抽象的东西还不能够很容易去理解,不过我希望大家以后再回过头来看的话,可能会对整个系统的架构设计有一些指导意义。

继续阅读 “知识管理和语义搜索的哲学思考”