学习小组 – 第2页 – 文因互联

北京知识图谱学习小组学习参考,第一期第一周:知识提取

Github版在这里

知识提取是要解决结构化数据生成的问题。但是广义上讲,知识提取是数据质量提升中的一环,各种提升数据质量的方法,都可以视为某种知识提取。学术上一般是用自然语言处理的方法,但在实践中通常是利用规则。

我们要熟悉的概念和工具有 (假设大家已经熟悉了Python)

继续阅读 “北京知识图谱学习小组学习参考,第一期第一周:知识提取”

知识图谱学习小组学习大纲

本文的官方版本在 小组的Wiki上 https://github.com/memect/kg-beijing/wiki/知识图谱学习小组学习大纲

2016年6月3日

鲍捷

 

这个学习小组的目的,不是按教科书的定义去学习“知识图谱”,更不是做研究。我们更多是要去解决问题,而不是研究方法。传统的“知识图谱”(Knowledge Graph),“链接数据”(Linked Data),“语义网”(Semantic Web),”知识提取”(Knowledge Extraction),等等技术,到底在实战中要解决的是什么问题?要解决这些问题是不是可以用相对简单的方法?能不能用廉价的方法尽可能快地解决有代表性的问题?这是这个学习小组的目的。

继续阅读 “知识图谱学习小组学习大纲”

北京知识图谱学习小组

我们准备组织一个北京地区的知识图谱学习小组

目标人群:对知识图谱感兴趣的学生和工程师

加入小组的条件

× 要有Github帐号
× 要参加文因互联组织的公开课(免费)和相关的网络公开课,按时做作业
× 每周末参加一次小组的线下活动(在北京东三环)

小组的学习内容:知识图谱的工程实战,每次大约10周

× Python基础(已有基础的可以跳过)
× 知识提取入门(NLTK,中文NLP基础,正则表达式)
× 知识表示入门(JSON,RDF,OWL)
× 知识存储入门(图数据库,JSON数据库)
× 知识检索入门(主题模型,词向量,Lucene/ElasticSearch)

小组的 Github https://github.com/memect/kg-beijing/

报名表在这里 https://www.wenjuan.com/s/euAfUj/