曹燕

gStore

互联网 2024-10-08 09:09:39

gStore是北京大学王选所数据管理实验室历经十余年研发的面向RDF知识图谱的原生图数据库系统,实现知识图谱数据的高效存储与管理。gStore将面向RDF的SPARQL查询,转换为面向RDF图的子图匹配查询,利用所提出的基于图结构的索引(VS-tree)来加速查询性能,在多跳关联关系处理上gStore同传统关系型数据库有超过千倍性能提升。

gStore系统提供了一键安装的可下载版本、拆箱即用的云端系统和与多个国产自主可控的计算平台(鲲鹏、飞腾、海光、兆芯)兼容。gStore系统已经应用到了包括金融、公安、医疗、政府大数据和智能语音问答等多个领域。gStore在推动国产开源图数据库系统发展和持续进行学术创新的同时,愿与志同道合的产业界同仁一起从事gStore系统科研成果的应用与转换。

产品功能

  • 图存储
    原生基于图数据模型(Native Graph Model),维持了原始RDF知识图谱的图结构

  • 图查询
    支持SPARQL1.1标准查询语言,将面向RDF的SPARQL查询,转换为面向RDF图的子图匹配查询

  • 图分析
    支持路径查询、环路检测、PageRank等多种图分析算法,并对外开放图接口,用户可自定义编写图分析算法

  • 完整事务
    完整支持事务操作的原子性、一致性、隔离性和持久性

产品特征

  • 性能卓越

    • 单机支持50亿RDF三元组数据

    • 百亿规模(包含六跳查询)秒级响应

    • 国外同行性能测评gStore性能优于其他开源图数据库

    • 国际通用图数据测评数据集测评性能超越国际主流产品

    • 墨天轮排行中位于国产图数据库第一梯队

  • 源头创新

    • 首次提出以子图匹配方法构建知识图谱存储查询引擎

    • 十余年潜心研发,系统十余万行代码均为自主编写

    • 系统内核开源,已应用到金融、公安、纪检、医疗、交通、运营商等多个领域

    • 在多个企事业和互联网大厂中进行了部署并取得良好效益

  • 功能完备

    • 支持SPARQL1.1标准查询语言

    • 支持图数据批量增、删、改、查

    • 支持图数据库新建、删除、备份、还原

    • 完整支持图数据库事务操作

    • 提供C++/Java/Python/NodeJS/PHP等多种语言的API接口

    • 提供HTTP、RPC、Socket接口模式

  • 安全可控

    • 拥有从“论文-专利-软件著作权”整体知识产权体系

    • 首批通过中国信通院图数据库能力测评

    • 全面适配国产海光/兆芯/飞腾/鲲鹏/申威等国产CPU

    • 全面适配银河麒麟、中标麒麟、统信UOS、欧拉等国产操作系统

应用场景

金融、政务、公安、医疗、教育

发展历史

2011年

国际数据库顶级会议(VLDB)发表论文:Lei Zou, Jinghui Mo*, Lei Chen,M. Tamer Özsu, Dongyan Zhao. gStore: Answering SPARQL Queries Via Subgraph Matching, International Conference on Very Large Data Bases, VLDB, 2011.

2013年

gStore V.1.0 开发完成

2014年

6月 gStore获得软件著作权
10月 “海量图结构数据存储和查询优化理论研究”获得中国计算机学会自然科学二等奖
6月 国际数据库顶级会议(VLDB)发表论文:Lei Zou, Ruizhe Huang*, Haixun Wang, Jeffery Xu Yu, Wenqiang He, Dongyan Zhao. Natural Language Question Answering over RDF-A Graph Data Driven Approach , ACM SIGMOD International Conference on Management of Data, SIGMOD, 2014.

2017年

gStore在github开源

2018年

2月 大规模图结构数据管理 获得中国教育部自然科学二等奖
10月 gStore分布式原型系统开发完成

2019年

9月 gStore与国产 飞腾CPU、麒麟操作系统适配成功
10月北京大学图数据库系统gStore云平台部署上线
11月 中国软件测评中心对gStore分布式系统进行性能测试,测试结果标明gStore在106亿规模数据存储条件下平均查询响应时间1.79秒
12月 北京大学图数据库系统gStore上线中国科技云2.0

2020年

7月 与统信UOS操作系统、鲲鹏、海光、兆芯适配成功
10月 gStore分布式版本gMaster在中科院计算所相关项目中进行应用示范
11月 知识图谱自动化构建系统gBuilder V.1.0上线
12月 新增高级查询功能

2021年

2月 gStore产品完成了中国信息通信研究院“图数据库基础能力测试”
3月 新版官网上线

2022年

8月 发布知识图谱一体化平台系统,提供知识图谱全生命周期一站式服务。
10月 gStore V1.0版本正式发布

2023年

通过北京大学科技成果转化成立的面向图数据库系统研发和知识图谱应用的创业公司

相关资料

gStore官网:http://www.gstore.cn/
GitHub:https://github.com/pkumod/gStore
Gitee:https://gitee.com/PKUMOD/gStore