雷锋网 AI 科技评论消息:日前,清华大学副教授、Arnetminer创始人唐杰在微博公开表示AMiner将发布计算机领域的专业知识图谱Science Knowledge Graph (SciKG)。
据其介绍,
这个计算机领域的知识图谱包含1万个知识概念、概念关系以及概念定义,20万专家信息(专家和知识概念对应)以及50万相关论文。这个数据可以用来做一些领域信息理解,信息推荐和检索。
雷锋网 AI 科技评论了解到,AMiner官网目前已经更新了该数据集的下载通道。
从官网可以看到相关介绍,
SciKG是一个丰富的知识图谱,用于科学领域(目前包括计算机科学(CS)),由概念、专家和论文组成。概念和概念之间的关系是从ACM计算分类系统中提取出来的,每个概念的定义都从维基等数据集中进行了补充。
数据集中包括每个专家的职位、隶属机构、研究兴趣,以及与AMiner的链接(如果有必要,还可以获得更多信息),每一篇论文包括标题、作者、摘要、出版机构和年份等元数据信息。
数据集的统计结果如下图,包括908个概念,20多万条专家信息,50多万篇出版论文,9668个关键词。
此外,在数据集中,每个对象都是JSON格式 。关键词的数据结构如下表:
示例如下:
另外,官网上同时也强调,该数据集能助于更好地理解计算机科学领域的动态和发展,帮助搜索和推荐CS领域的专家和论文。
详细信息可在https://aminer.org/scikg查看。
雷锋网 AI 科技评论