SubgraphMatching项目使用教程

SubgraphMatching项目使用教程

SubgraphMatching In-Memory Subgraph Matching: An In-depth Study by Dr. Shixuan Sun and Prof. Qiong Luo SubgraphMatching 项目地址: https://gitcode.com/gh_mirrors/su/SubgraphMatching

1. 项目介绍

SubgraphMatching是一个开源项目,致力于研究内存中的子图匹配性能。该项目对比了八种代表性的内存子图匹配算法,包括QuickSI、GraphQL、CFL、CECI、DP-iso、RI和VF2++,并在过滤候选顶点、查询顶点排序、部分结果枚举以及其他优化技术四个方面进行了详细分析。项目基于SIGMOD'2020论文《In-Memory Subgraph Matching: an In-depth Study》。

2. 项目快速启动

环境准备

确保已经安装了CMake和相应的编译环境。

编译项目

在项目根目录下执行以下命令来编译源代码:

mkdir build
cd build
cmake ..
make

测试

编译成功后,执行以下命令来测试可执行文件的正确性:

cd test
python test.py ../build/matching/SubgraphMatching.out

运行

编译后,你可以在build/matching目录下找到名为SubgraphMatching.out的二进制文件。使用以下命令执行该文件:

./SubgraphMatching.out -d data_graphs -q query_graphs -filter method_of_filtering_candidate_vertices -order method_of_ordering_query_vertices -engine method_of_enumerating_partial_results -num number_of_embeddings

其中:

  • -d 指定数据图输入
  • -q 指定查询图输入
  • -filter 设置候选顶点过滤方法
  • -order 设置查询顶点排序方法
  • -engine 设置部分结果枚举方法
  • -num 设置要找到的最大匹配数

如果要找到所有结果,可以将-num设置为MAX

3. 应用案例和最佳实践

应用案例

使用GraphQL算法对样本数据集进行子图匹配:

./SubgraphMatching.out -d ../../test/sample_dataset/test_case_1.graph -q ../../test/sample_dataset/query1_positive.graph -filter GQL -order GQL -engine GQL -num MAX

最佳实践

根据数据图密度和查询大小,选择特定的技术。例如,对于密集图和大型查询,使用DP-iso算法的失效集剪枝技术可以显著提高性能。

4. 典型生态项目

SubgraphMatching项目可以与其他图处理项目结合使用,例如:

  • 用于图存储和查询的JanusGraph
  • 用于大规模图计算的Apache Giraph

这些项目共同构成了一个丰富的图计算生态系统,可以用于各种图数据处理和分析场景。

SubgraphMatching In-Memory Subgraph Matching: An In-depth Study by Dr. Shixuan Sun and Prof. Qiong Luo SubgraphMatching 项目地址: https://gitcode.com/gh_mirrors/su/SubgraphMatching

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

该数据集涵盖了1998年至2023年中国上市公司在产学研合作领域的核心信息,包含14284条面板数据,主要指标包括上市公司股票代码、企业名称、专利申请主体、专利申请号、申请次数、申请日期、年份、产学研合作专利数量、是否存在产学研合作等。此外,数据集还整合了企业所属地级市的地理信息,如地级市名称、与省会城市的距离(公里)、地级市经纬度坐标等,为研究地理分布对合作模式的影响提供了数据支持[citation:1][citation:3][citation:5]。 通过专利数量变化可评估企业创新能力及技术进步速度,而产学研合作的地理分布数据则揭示了区域经济发展与创新活动的关联性。例如,结合地级市经济水平、交通便利性、人才聚集度等维度,可分析区域要素对企业创新的影响机制[citation:3][citation:5]。数据集的应用场景包括:投资者评估企业增长潜力,政策制定者优化创新政策,学者研究产学研合作对经济高质量发展的作用,以及企业战略规划者优化创新资源配置[citation:1][citation:3]。 数据文件包含原始数据、参考文献及分析代码,格式涵盖Excel(.xls)、Stata(.dta)及文本文件,支持多维度时序分析。配套文献如《产学研合作如何影响企业市场绩效》《产学研合作对企业创新质的影响研究》等,提供了理论框架与实证方法参考[citation:1][citation:5]。该数据集为分析中国上市公司创新能力的区域差异、产学研合作的演化路径及其对产业升级的贡献提供了基础数据支撑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洪显彦Lawyer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值