- 博客(281)
- 资源 (17)
- 问答 (6)
- 收藏
- 关注

原创 一种针对图数据超级节点的数据建模优化解决方案
一种针对图数据超级节点的数据建模优化解决方案一种针对图数据超级节点的数据建模优化解决方案一、超级节点1.1 超级节点概念1.2 从图数据网络中寻找超级节点二、与超级节点相关的关键问题案例三、模拟超级节点3.1 服务器资源3.2 构建模拟数据的图数据模型3.3 模拟超级节点的数据规模四、超级节点建模优化4.1 关系结构优化方案4.2 标签细分遍历图可减少节点规模五、增删改操作优化5.1 服务器优化5.2 图库配置优化5.3 JVM调优5.4 批量操作5.5 服务器端操作文件六、检索效率提升6.1 查询优化6.
2021-06-13 22:48:11
876
1

原创 基于图数据的研报词关联之聚合分析
基于图数据的研报词关联之聚合分析基于图数据的研报关键词聚合分析一、算法介绍二、数据模型三、计算关键词上下文聚合相似性四、关键词上下文聚合性能测试五、计算聚合相似性【CYPHER优化】六、词对计算聚合相似性七、并发计算聚合相似性【CYPHER优化二】八、词对计算CYPHER脚本生成为过程8.1 进一步优化查询8.2 将查询安装为过程8.2.1 上下文Jaccard系数相加8.2.1 上下文Jaccard系数求平均8.2.2 过程使用以及返回值说明九、分析研报关键词列表的聚合相关性9.1 词列表分析9.2 词列
2021-06-11 23:34:21
546

原创 吃瓜?Neo4j与ONgDB打官司是怎么回事?
吃瓜!Neo4j与ONgDB打官司是怎么回事?吃瓜!Neo4j与ONgDB打官司是怎么回事?一、2020年3月30日与iGov公司技术专家交流1.1 ONgDB能否商用是否有法律风险?1.2 ONgDB项目在GitHub上是否会一直稳定维护迭代?二、2021年5月30日与Neo4j公司技术专家交流三、判决书部分截图四、判决书下载五、了解更多信息可以加入slack交流六、其他参考链接七、总结Here’s the table of contents:吃瓜!Neo4j与ONgDB打官司是怎么回事?&nbs
2021-05-30 16:25:46
840

原创 【图数据】股权网络穿透一千层需要多久?
【图数据】股权网络穿透一千层需要多久?图数据关系路径穿透测试图数据库选型图数据模型说明股权网络穿透一百层穿透一百层查询语句穿透一百层10次测试执行结果股权网络穿透一千层穿透一千层查询语句穿透一千层10次测试执行结果测试结果统计Here’s the table of contents:图数据关系路径穿透测试本次测试运行在总体规模在11亿的数据集上,股权网络数据量超千万,测试方式为从某公司出发股权网络向上穿透100层和1000层,返回一条路径结果【LIMIT 1】。图数据库选型图数据库为ONgD
2021-05-27 22:58:24
1562
3

原创 基于图数据库的复杂网络分析能力
基于图数据库的复杂网络分析能力概览一、社交网络与图数据库技术二、搜索排名与图数据库技术三、评分系统与图数据库技术四、自然语言处理与图数据库技术五、推荐引擎与图数据库技术六、知识推理与图数据库技术七、知识图谱与图数据库技术八、智能问答与图数据库技术九、高密子图挖掘与图数据库技术十、媒体转引转载与图数据库技术十一、实体相似性聚类分析与图数据库技术十二、风险控制之关联识别与图数据库技术十三、风险控制之聚类识别与图数据库技术十四、风险控制之推导识别与图数据库技术十五、风险控制之异构识别与图数据库技术十六、风险控制之
2020-05-17 15:57:34
1963

转载 史上最全ONgDB与Neo4j资源传送门
Neo4jNeo4j 中文社区Neo4j 官网地址Neo4j 中文版下载地址BasicsOfficial documentationCypher RefcardDeveloper resourcesGists - 使用 Neo4j GraphGists,您可以在简单的文本文件中描述和建模您的域,并在任何浏览器中将其呈现为丰富的交互式页面. 完美记录特定域,用例,问题或图形问...
2020-04-03 15:08:41
2126

翻译 Elasticsearch负载均衡策略发生死锁解决方案
Elasticsearch负载均衡策略发生死锁解决方案一、问题描述与解决方案1、问题产生的背景2、解决方案二、集群分片分配时的相关设置(译文)集群分片分配分片分配设置分片重新平衡分配设置启发式分片平衡分配一、问题描述与解决方案1、问题产生的背景es集群版本:elasticsearch-5.5.3HEAD插件索引集群显示(red/yellow)。四个节点的集群,索引有大量写入,同时有大量删除...
2019-06-13 21:19:16
6607
原创 Model Context Protocol 精选资源列表
MCP是一种开放协议,通过标准化的服务器实现,使 AI 模型能够安全地与本地和远程资源进行交互。此列表重点关注可用于生产和实验性的 MCP 服务器,这些服务器通过文件访问、数据库连接、API 集成和其他上下文服务来扩展 AI 功能。
2024-12-11 21:32:24
3072
原创 释放大模型潜力:Model Context Protocol 引领 API 开发新纪元
Model Context Protocol(简称MCP)是由人工智能公司Anthropic提出的一种API开发标准,旨在实现AI助手与数据源的无缝连接。MCP的核心价值在于统一数据访问、多功能支持和提升大型语言模型(LLM)的实用性。它允许AI模型从各种数据源(如本地内容存储库、业务工具、开发环境)中提取信息以完成任务,从而生成更相关、更准确的响应。MCP协议的核心是将一般的AI AGENT函数调用的工程架构抽象为了客户端、服务器结构,可以理解为是对函数调用AGENT在工程层面实现了一个更好的抽象。
2024-11-26 20:54:41
4829
原创 LLMCompiler应用案例
(AI总结)LLMCompiler技术在对话系统、搜索系统、数据处理和智能投研等领域的实际应用。通过智能搜索和数据查询,提升用户体验和数据处理效率;在指标提取和选股中,支持精准数据分析和投资决策。这些应用展示了LLMCompiler的技术优势和实际价值。智能搜索场景中规划器运行后,通过DAG调用各个接口结果后马上返回给用户,整个过程只调用一次大模型接口;整体的响应时间取决于一次LLM调用的响应时间和各个接口最大并发执行响应时间。本文仅提供LLMCompiler技术的实现效果展示,以及部分实现代码可供参考。
2024-11-11 21:22:48
1051
原创 开源:LLMCompiler高性能工具调用框架
LLMCompiler 是一种 Agent 架构,旨在通过在DAG中快速执行任务来加快 Agent 任务的执行速度。它还通过减少对 LLM 的调用次数来节省 Tokens 使用的成本。实现 灵感来自《An LLM Compiler for Parallel Function Calling》。
2024-08-03 21:08:25
717
原创 GraphRAG深入解析
GraphRAG 建立在微软之前使用图机器学习的研究和工具的基础上。GraphRAG 流程的基本步骤包含索引和查询两部分。此时,我们有一个实体和关系的图、实体的社区层次结构以及 node2vec 嵌入。现在,我们希望基于社区数据并为每个社区生成报告。这让我们可以从多个粒度点对图表有一个高层次的了解。例如,如果社区 A 是顶级社区,我们将获得有关整个图表的报告。如果社区是较低级别的,我们将获得有关本地集群的报告。生成社区报告在此步骤中,我们使用 LLM 生成每个社区的摘要。
2024-07-25 20:48:32
1655
原创 使用Neo4j和LangChain实现“Local to Global”的GraphRAG
在这篇博文中,我们将深入探讨微软的“From Local to Global GraphRAG[6]”的文章以及具体实现。我们将主要介绍知识图谱的构建和摘要部分,基于 GraphRAG 的检索应用在下一篇博客文章会具体介绍。微软的研究人员同时提供了Microsoft GraphRAG[7]的项目页面。
2024-07-13 17:52:20
2115
2
原创 向量数据库:使用Elasticsearch实现向量数据存储与搜索
Elasticsearch在7.x的版本中支持向量检索。在向量函数的计算过程中,会对所有匹配的文档进行线性扫描。因此,查询预计时间会随着匹配文档的数量线性增长。出于这个原因,建议使用查询参数来限制匹配文档的数量(类似二次查找的逻辑,先使用检索到相关文档,然后使用向量函数计算文档相关度)。访问的推荐方法是通过cosinessimilarity, dotProduct, 1norm或l2norm函数。但是需要注意,每个DSL脚本只能调用这些函数一次。
2023-06-01 21:19:47
10443
2
原创 LangChain实现自主代理(Autonomous Agents)
自主代理(Autonomous Agents)是由人工智能驱动的程序,当给定目标时,它们能够为自己创建任务,完成任务,创建新任务,重新确定任务列表的优先级,完成新的顶级任务,循环(递归的思想)直到达到目标。可以给自主代理(Autonomous Agents)一个任务,比如发一个关于自主代理(Autonomous Agents)研究最新进展的邮件。
2023-05-16 21:48:37
1254
2
原创 LangChain-Agents 入门指南
其中 Agents 使用 LLMs 来确定采取哪些行动以及以何种顺序采取行动。操作可以是使用工具并观察其输出,也可以是返回给用户。如果使用得当,代理可以非常强大。本文章的目的是向您展示如何通过最简单、最高级别的 API 轻松使用 Agents 。
2023-05-10 22:41:13
2849
1
原创 Neo4j/ONgDB 图数据库快速处理 Excel 文件
使用过 Neo4j/ONgDB 图数据库的朋友应该对 CSV 文件的处理很熟悉,但是对于 Excel 文件的处理可能并不是很清楚,经常会编写一大堆 Excel 解析的代码去操作。在 3.x 版本的 APOC 组件中其实很早就开始支持对 Excel 的读取了,但是文档直到 Neo4j 4.x 版本以后才开始完善。
2023-05-10 21:14:46
1112
原创 生成 Cypher 能力:MOSS VS ChatGLM
下面测试结果为MOSS和ChatGLM两个大语言模型生成Cypher的展示,总体效果MOSS要好于ChatGLM。 在六次测试中,只有MOSS在5和6案例中生成了完全正确可执行的Cypher(但是都多了一行注释),其它结果都不太好。 从目前测试过的结果来看,正确生成Cypher的能力GPT4 > GPT3.5 > MOSS > ChatGLM。
2023-05-09 20:51:41
1751
原创 LangChain 2 ONgDB:大模型+知识图谱实现领域知识问答
然后,代理向 LLM 模型发送请求,其中包括用户问题和代理提示,代理提示是代理应该遵循的一组自然语言指令。对于工具的使用大多数情况下,我们的第一反应是使用可用的工具从外部来源获取更多信息。使用 LangChain 构建应用程序后,当有用户提问时,系统会先通过代理找到合适的工具(知识图谱),然后通过工具获取数据,最后由 LLM + 私域数据生成一个流畅表达并回复用户。整个过程代理的调用会更复杂一些,当生成回复后系统会自动判断该LLM回复是否需要继续执行其它任务,是一个完全自主的递归调用流程。
2023-04-29 11:58:28
4903
原创 生成 Cypher 能力:GPT3.5 VS ChatGLM
也是回复了一个看似正确的Cypher但是语法有错误,单独复制粘贴后Cypher无法运行,另外结果中仍然多了一些废话。也是回复了一个看似正确的Cypher但是语法有错误,单独复制粘贴后Cypher无法运行,另外结果中还多了一些废话。回复了一个看似正确的Cypher但是语法有错误,单独复制粘贴后Cypher无法运行,另外结果中还多了一些废话。回复了一个看似正确的Cypher但是语法有错误,单独复制粘贴后Cypher无法运行,但这次好一些废话没有了。都无法生成正确的Cypher,是正确的。
2023-04-28 21:44:46
1587
原创 GPT-3.5 生成 Fabric Cypher
使用 GPT-3.5 生成 Fabric Cypher 时,需要注意 Fabric Cypher 样例不要使用转义符,GPT 生成转义符不太友好(会丢弃转义符,添加任何其它Prompt都没有用)。的能力,为了让生成Cypher的能力应用在更大规模的图数据查询,本次测试使用图数据库的Fabric架构。除了转义符需要注意外,其它样例覆盖的情况,Fabric Cypher 生成效果都比较好。红色部分表示股票图谱,蓝色部分表示高管图谱,股票图谱中同时存储高管。启动节点后,分别在节点上创建以下用户账号。
2023-04-26 20:21:58
819
原创 大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher
通过测试发现,设计合适的Prompt工程以后,GPT3.5可以基于样例准确生成Cypher,但是对于样例没有覆盖的问句,Cypher经常会错误生成。进行排序(评估样例问题和当前提问的相似程度),然后拼接为长度小于2048的字符串传入GPT3.5的接口(GPT-3.5 的上下文最多支持 2k 汉字或 8k 英文字符 的内容);配置时,GPT4不会生成Cypher,GPT3.5会使用网络资料生成Cypher,脱离当前Prompt的要求。的能力,GPT3.5对于自然语言任务指令的理解稍差一些。
2023-04-24 20:29:15
1912
原创 大语言模型Prompt工程之使用GPT4生成图数据库Cypher
当一个提问不存在类似的Example时,模型不会生成Cypher或生成一个不存在的Cypher(图数据库中模式不存在不会影响最终结果,因为结果为空),这类可以视为图谱回答不了的问题。Prompt中会传入一些样例问题和Cypher,模型通过样例问题和Cypher就能学会该类的问题和Cypher模式,并应用在同类不同参数的查询上(其中一些参数模型也能。通过测试发现,设计合适的Prompt工程以后,GPT4生成Cypher非常棒,简单查询和复杂查询都可以自动生成且不存在语法错误(没有发现)。中定义了样例问答对,
2023-04-21 22:29:56
3019
原创 关于ONgDB我问了ChatGPT这些问题!
然而,在实际应用中可能会遇到一些版本兼容性问题,建议查阅ONgDB 的文档以获取最新的兼容版本信息。要实现ONgDB 和Fabric 的结合,需要首先搭建并配置好ONgDB 数据库集群,然后在该集群上部署Fabric 节点。完成这些配置后,即可通过Fabric 提供的统一接口,访问并处理分布在多个ONgDB 数据库的图数据。ONgDB 是一个开源的图数据库项目,它起源于Neo4j 但已演变成一个独立的项目。ONgDB 是一个面向图数据库的开源解决方案,它基于Neo4j 图数据库构建,具有较高性能。
2023-04-20 20:45:18
700
原创 基于RDF本体模型和图数据库实现知识查询与推理
Neosemantics以无损方式将RDF数据存储在ONgDB中(导入的RDF随后可以导出,而不会在此过程中丢失单个三元组)。本次案例本体分为三个部分,自定义本体层【Custom Ontology】、领域本体层【Domain Ontology】、实例数据层【Instance Data】,数据是按照三层设计来构建的。其中自定义本体层是领域本体的自定义扩展。中的设计,现在可以进行数据的构建了,关于如何运行数据采集、数据构建、数据查询,可以参考。组件,展示了一个快速接入RDF数据的案例,关于组件的使用可以查看。
2023-04-18 21:30:03
777
原创 图谱问答:自定义组装问答系统进阶指南
本文内容比较长且稍显复杂,比较详细的说明了如何自定义组装一个问答系统,该问答系统框架核心是配置模块(即规则引擎)和图算法(最优子图匹配/连通子图分析),每个步骤都可以进行拆解实现灵活组装。另外本文所有的Cypher脚本作者都做了梳理,准备好环境后可以直接下载运行。
2023-04-07 23:42:02
1122
原创 使用Graphene构建知识图谱本体模型
图片展示了一个知识图谱本体模型设计案例,灰色虚线分隔了该知识图谱的概念层和实体层,黄色节点部分表示概念层,淡蓝色部分表示实体层。是一个可视化WEB端工具,可以用来做知识图谱本体模型设计、图数据建模、图结构设计等工作!表示概念层节点之间的连接,灰色虚线表示概念内分层关系,深棕色虚线表示概念间连接。表示实体层与概念层的连接,使用点虚线连接;表示实体层节点之间的关系,使用实线连接;使用Graphene构建知识图谱本体模型。
2023-04-04 22:10:12
922
原创 重磅上市《精通Neo4j》
图数据库是NoSQL类数据库的又一大典型代表,在国内图数据库属于新兴事物,其优异的复杂关系解决方案引起了国内众多大型互联网公司及IT开发者的关注,而Neo4j是目前图形化数据库中最为出色、最为成熟的产品。本书的第一版书名是《Neo4j权威指南》,发行量超过13000册,本书在第一版的基础上补充完善了Neo4j的新特性、新功能,总页数超过700页。本书的编写从2021年筹划到2022年11月出版,历时将近一年的时间,倾注了编委团队大量心血,最终在编委团队的齐心协力下定稿出版。Tushare。
2022-11-21 20:43:22
837
转载 行业速递:押中“大牛股”?“药神”基金猛涨超35%!基金经理成选股神手?
近日,一只医药基金惊喜频出,被基民冠上了“神基” “药基扛把子”的称号。数据显示,一个多月以来,中银证券健康产业混合基金貌似押中了“大牛股”,净值上涨超35%,而与之相对应的行业指数同期仅上涨了6.31%。...
2022-06-15 00:04:01
148
HC_DOCS-Final_Proposed_Stipulated_Judgment_and_Injunction.docx.pdf
2021-05-30
针对图谱超级节点的优化方案v1.3.pptx
2020-05-16
Neo4j-ai-graph-technology-white-paper-EN-A4-CN_135.pdf
2020-05-16
ongdb-3.5.16集群配置.zip
2020-04-06
附件二+Neptune_vs_Neo4j-2020.pptx
2020-04-03
附件三+CASE+NO.+5-19-CV-06226-EJD+OPPOSITION+AND+RESPONSE+TO+MOTION+TO+STRIKE.pdf
2020-04-03
windows文本转换为linux文本
2017-12-05
linux 安装oracle rpm包
2016-11-03
BCP文件的解析可以用mapreduce程序实现分布式解析吗?提供一下思路?
2017-08-13
tensorflow实现多层感知机,出现内存泄漏!
2017-03-17
这段代码如何修改正确呢?可以返回正确的值?
2016-10-12
我在做jsp+dao+hibernate实现登录功能时出现一个报错
2016-10-06
JavaWeb项目,连接mysql数据库之后报出这个错误
2016-09-29
二叉树的创建和遍历,编译成功了不知道在运行窗口输入什么。大神帮我看看
2015-01-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人