
知识图谱
世界而世界
这个作者很懒,什么都没留下…
展开
-
【JanusGraph入门】6-TinkerPop之Traversal简介
6-TinkerPop之Traversal简介网址官网文档一、Traversal简介遍历器Traversal<S,E>继承了迭代器的接口S stands for start 代表了开始对象的类型E stands for end 代表了结束对象的类型4大组件Step<S,E>一步an individual function applied to S to yield E. Steps are chained within a traversa原创 2020-09-10 13:58:07 · 373 阅读 · 0 评论 -
【JanusGraph入门】5-TinkerPop-家族
5-TinkerPop-家族目标家族成员全貌每个成员都是做什么家族故事和背景家族全貌Blueprints, Pipes, Gremelin, Frames, Furnace, Rexster.家族成员1. 家族标志TinkerPop2. 绿色小精灵GremlinTraversalThe Graph Process图遍历处理小精灵带着口袋的小精灵可复制的小精灵控制台里面的小精灵$ bin/gremlin.sh \,,,原创 2020-08-21 13:29:38 · 289 阅读 · 0 评论 -
【JanusGraph入门】4-TinkerPop简介
TinkerPop简介简介TinkerPop什么是 TinkerPopApache TinkerPop™ is a graph computing framework for both graph databases (OLTP) and graph analytic systems (OLAP).他是 Apache 顶级项目他是图计算框架, 支撑图数据库(OLTP)、图分析系统(OLAP)有哪些项目在用 TinkerPopTinkerPop 成员网址官网官网文档原创 2020-08-20 13:52:57 · 978 阅读 · 0 评论 -
【AntV-图分析可视化】Graphin安装及介绍
1-AntV安装及介绍简介官网G6Graphin安装快速上手该演示版本比较低, 需要去 github 上安装最新的 @antv/graphin当前安装版本“@antv/graphin”: “^1.4.0”“@antv/graphin-components”: “^1.4.0”“antd”: “^4.5.4”,“react”: “^16.11.0”,“react-dom”: “^16.11.0”,“react-scripts”: “^3.4.3”建议使用 cnp原创 2020-08-16 21:13:10 · 3740 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task5-基于深度学习的文本分类2-1Word2Vec
赛题1-新闻文本分类-Task5-基于深度学习的文本分类2-1Word2Vec本次任务四天完成赛题赛题讲解赛题数据讲解机器学习讲解深度学习-fastText深度学习-word2vec安装 pyTorch官网下载地址及安装说明跑程序先导入包import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asct原创 2020-07-31 13:33:13 · 654 阅读 · 0 评论 -
【JanusGraph入门】两点最短路径,基于OLTP,单源广度优先遍历
两点间最大路径实现,基于OLTP,单源1 函数介绍repeat 循环执行括号里面的遍历器,每个遍历分支都会有一个小精灵去跑sideEffect 额外处理内容,不会影响上个函数的返回值aggregate 聚合函数,基于sideEffect实现,可以通过 cap/select 取出emit 针对repeat的收集器,判断哪些路径需要收集,这个有待研究,和unitl/times 有很大的区别until 循环终止条件,与times不可同时使用times 循环终止条件,与until不可同时使用,只能传原创 2020-07-27 22:28:30 · 643 阅读 · 2 评论 -
【NLP入门】赛题1-新闻文本分类-Task04-基于深度学习的文本分类1-fastText
赛题1-新闻文本分类-Task04-基于深度学习的文本分类1-fastText本次任务两天完成赛题赛题讲解赛题数据讲解机器学习讲解深度学习-fastText目标学习FastText的使用和基础原理学会使用验证集进行调参跑fasttext模型代码数据预处理# 引入 Pandasimport pandas as pd# 读取数据train_set = pd.read_csv('./data/1/train_set.csv', sep='\t', nrows=15000原创 2020-07-27 21:58:25 · 344 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task03-基于机器学习的文本分类
赛题1-新闻文本分类-Task03-基于机器学习的文本分类本次任务三天完成赛题赛题讲解赛题数据讲解机器学习讲解使用机器学习跑模型试试读取数据# 引入 Pandasimport pandas as pd# 读取数据train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')# 看一下数据的前几行train_set.head()基于机器学习的文本分类# Count Vectors + RidgeClassi原创 2020-07-25 21:58:05 · 272 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task02-数据读取及初步分析
赛题1-新闻文本分类-Task02-数据读取及初步分析今天主要是代码向# 引入 Pandasimport pandas as pd# 读取数据train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')# 看一下数据的前几行train_set.head()# 数据分析# 1 赛题数据中,新闻文本的长度是多少?# 2 赛题数据的类别分布是怎么样的,哪些类别比较多?# 3 赛题数据中,字符分布是怎么样的?# 句子长度分析t原创 2020-07-22 23:39:51 · 238 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task01-赛题理解
赛题1-新闻文本分类-Task01-赛题理解赛题赛题讲解赛题环境安装下载 anaconda 地址现在官网就可以直接下载了目前我装的是 py3.7装好之后可以使用 jupyter 进行可视化开发1 读取数据# 引入 Pandasimport pandas as pd# 读取数据# 数据分隔符 \t# \t 水平制表(HT) (跳到下一个TAB位置)train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')原创 2020-07-21 23:22:52 · 305 阅读 · 0 评论 -
【JanusGraph入门】(第三天,先从Core包开始)
20200709 第三天 先从Core包开始JanusGraph Core|_ example/ 示例,演示诸神图谱|_ core/ 核心包, 例如:继承TinkerPop图结构的 JanusGraph,JanusVertex等 还有自己的类 SchemaManager JanusGraphQuery 等|_ diskstorage/ 磁盘存储相关 Backend 这个类感觉满关键的 Orchestrates and configures all backend原创 2020-07-10 00:00:44 · 371 阅读 · 2 评论 -
【JanusGraph入门】(第一天,下载项目)
20200707 第一天 下载项目fork 了一下仓库https://github.com/guangyuzhihun/janusgraph/tree/v0.3阅读目的实际项目中用到了,希望通过源码解决十亿级别快速入数问题,项目是 3.1 的所以看一下最近的源码 3.4 的JanusGraph 作为分布式图数据库,而且是开源的,那么作为以后想搞好图数据库这块,还是需要看一下该类型数据库的设计及源码(Neo4j作为原生图存储的开源的社区版也要看)今天收获clone 项目和下载 pom原创 2020-07-08 00:46:48 · 310 阅读 · 0 评论 -
【JanusGraph入门】(第二天,了解概况)
20200708 第二天 JanusGraph了解概况上手开始一步步看源码时,第一块先了解一下软件背景、软件结构、软件功能、软件工具、设计思路,第二块对源码结构进行拆分,可以参考他人的源码分析。JanusGraph 官网1 看看有哪些特点scalable 可伸缩transactional 支持事务 ACIDOpen source 开源,这就不多说了Data Storage 支持的存储库Apache CassandraApache HBaseGoogle Cloud Bigtable原创 2020-07-09 01:35:10 · 350 阅读 · 0 评论