
数据库
文章平均质量分 63
BrotherDongDong
这个作者很懒,什么都没留下…
展开
-
图数据库查询语言Cypher、Gremlin和SPARQL
写在前面:第一部分仍然是心得和胡扯相关的内容,可以直接跳过。维基上面是这么介绍图数据库的:A graph database is a database that uses graph structures for semantic queries with nodes, edges and properties to represent and store data.这里有个关键词”semanti...原创 2018-06-23 15:12:21 · 14671 阅读 · 8 评论 -
微软第37天· RDF(N-Triples/.ttl) TO Neo4j-CSV
问题源数据文件F中k千万条记录,可以分为n类,每个类可以映射为一种类,最后要它们写入n个对应的文件。F的数据相对于用户是黑盒,只知道F的schema。所以,用户不能提前知道n个文件的名字,但是程序可以自己去解析F。巧妙的解法是,构造一个Baseclass存储所有n个类对应的k千万个对象,BaseClass有一个Map来序列化对象的所有属性名和属性值。然后利用排序接口将所有对象存入有序列表,...原创 2018-07-19 19:00:41 · 1983 阅读 · 1 评论 -
Neo4j存储RDF方案调研2
[use problem]JESÚS BARRASA开发的Neo4j的RDF导入插件.https://github.com/jbarrasa/neosemantics 仍在更新 issue较为活跃 障碍:该项目按照指南build成plugin放入Neo4j后Neo4j后无法启动 以下几篇文章均为介绍该插件: JESÚS BARRASA个人关于Neo4j和RDF的专题博客. ht...原创 2018-07-20 00:31:51 · 1878 阅读 · 2 评论 -
Neo4j·数据导入需要注意的坑·方案对比
如果觉得写的好或对您有帮助,麻烦右边点个赞哦~~ 数据导入方案对比 neo4j-admin import 最快的方案 10s导入15w节点 Spark(同事) 0.5h, 50w节点 apoc导入hdfs里的csv文件 100w个节点数据0.5h导不完 CSV处理经验 源数据到CSV,注意将源数据中的英文,进行提前处理...原创 2018-07-27 10:23:42 · 13594 阅读 · 8 评论 -
基于curl和容器的数据库LoadTest方案·2018
基于curl和容器的数据库LoadTest方案·2018Trinity和Neo4j支持Restful HTTP API脚本中使用curl访问HTTP API,并解析Response请求中的query time;将脚本部署到1个K8S的docker容器中,定时启动;复制成n个K8S容器; 将脚本部署到n个K8S的docker容器中,;...原创 2018-08-06 08:25:20 · 231 阅读 · 0 评论 -
数据库索引实践经验·关于数据库建索引和插数据两者先后顺序对效率的影响
数据库索引实践经验·关于数据库建索引和插数据两者先后顺序对效率的影响 案例2·新数据库建索引和导数据 (1) 先定义索引 (schema) 再 (2) load 数据 比 (2)(1)快的理论分析(前提是实践下来确实是这样吗? 你们谁实践了之后可以说一声) 【(1)(2)】的话是边写入数据边建立索引将索引写数据库;【(2)(1)】 的话先把数据全部写入, (...原创 2018-08-07 14:52:36 · 2508 阅读 · 0 评论 -
JanusGraph数据备份与恢复
JanusGraph官方文档并没有他提供数据备份与恢复的相关说明,所以我们是使用的Tinkerpop的备份与恢复命令。Tinkerpop数据备份方式有三种:1)GraphML备份:graph.io(IoCore.graphml()).writeGraph("/usr/local/janusgraph-0.2.0-hadoop2/bakup/graph.graphml");恢复:gr...原创 2018-08-24 20:07:01 · 537 阅读 · 0 评论