自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 图神经网络可以计算子结构吗?

近年来,图神经网络(GNN)在处理来自各个领域的数据方面取得了经验性的成功,例如社交网络,量子化学,粒子物理学,知识图和组合优化[4,5,9,10,12,13,29,31,47,55,58,66,67,69,70,71,73,74]。由于这些进展,人们对研究GNN的表达能力越来越感兴趣。其中一项工作是研究它们区分非同构图的能力。在这方面,Xu等人。[64]和Morris等人。

2025-04-13 11:51:37 275

原创 知识图引导的检索增强生成

近来,大型语言模型(LLM)(Li等人,2024年;Ren等人,2024年;Touvron等人,2023;Brown等人,2020)已经在包括问题回答在内的广泛的现实世界任务中取得了显著的成功(Sen等人,2023),辅助书写(Calamo等人,2023)、代码生成(Cheng等人,2024),以及许多其他人(Kaddour等人,2023年;Wu等人,2023年)的报告。然而,幻觉(Xu等人,2024 b;Liu等人,2024 a)成为关键的挑战,这通常是由于包含过时的信息或缺乏特定于域的知识而导致的。

2025-03-29 17:29:24 695

原创 生成信息提取的大型语言模型综述

信息提取(IE)是自然语言处理(NLP)中的一个关键领域,它将纯文本转换为结构化知识(例如,实体,关系和事件),并作为广泛的下游任务的基本要求,如知识图构建[1],知识推理[2]和问题回答[3]。典型的IE任务包括命名实体识别(NER),关系提取(RE)和事件提取(EE)[4,5,6,7]。然而,执行IE任务本身就是一项挑战。这是因为IE涉及从各种来源提取信息,并处理复杂和不断变化的领域需求[8]。与传统的NLP任务不同,IE包含广泛的目标,如实体提取,关系提取等。

2025-03-28 18:13:19 967

原创 leetcode hot100(五)

这个只要读懂了就很好理解,首先定义两个指针作为边界,因为装雨水的话就像木桶效应一样,关键是看短的那一条,能装下的就是两个边界之间的距离乘以两个边界中的最小值,接下来就是一个移动指针的思考,因为主要是看短边,所以移动长边事没意义的,因此选择移动短边并重新计算对应的雨水,迭代的过程不断更新ans取最大值,最后当两个指针相遇时结束。轴共同构成的容器可以容纳最多的水。今天是2025年3月17日星期一。找出其中的两条线,使得它们与。返回容器可以储存的最大水量。

2025-03-19 22:10:34 227

原创 leetcode hot100(四)

这个逻辑真的很巧妙,我也说不清楚为什么可以这样,自己用demo 手动模拟了一遍,感觉就是每次当right 所指的数不是0 的时候,交换了与left 的数值,如果换了之后还不是0 ,因为left 右移了,所指的数也更新了,然后就会继续交换,left 继续后指直到 right 所指的数变为0,right 后移。循环结束的条件是right 等于vector 的size,因为正常index 从0开始,当right = n 的时候说明已经指到了数组的最后一个位置的后面一个地方,表示已经处理完毕了。

2025-03-17 10:34:14 239

原创 leetcode hot 100(三)

生成长度的首先判断哈希表中是否有该元素的前一个值,如果有就跳过不执行,如果没有,初始化一个当前数值的记录以及长度为1,接下来进入while循环,如果哈希表中存在当前数值的后一个值,则更新当前数值为下一个数,长度也相应增加。初始化一个返回的答案长度为0,之后遍历每一个哈希表中的数的时候都会生成一个新的长度,在每一个数的时候都进行迭代更新取两者之间的最大值。,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。创建了一个哈希表,可以去掉重复的元素。今天是2025年3月14日。最后返回最终答案即可。

2025-03-14 16:53:38 250

原创 代码小白勇闯leetcode100(二)

今天是2025年3月13日给你一个字符串数组,请你将组合在一起。可以按任意顺序返回结果列表。是由重新排列源单词的所有字母得到的一个新单词。感觉自己水平只能把题解看懂。

2025-03-13 14:54:30 286

原创 代码小白勇闯leetcode hot100

重生之我要成为算法大佬!今天是2025年3月12日,我下定决心从今天开始每天做一道算法题!给定一个整数数组nums和一个整数目标值target,请你在该数组中找出target的那整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案,并且你不能使用两次相同的元素。你可以按任意顺序返回答案。好吧,我承认自己没做出来,照着题解敲了一遍,但是我只要慢慢学,以后一定可以做出来的!

2025-03-12 21:15:14 182

原创 CODE-ACCORD 标注策略

为句子级标注选择以下标签。

2025-03-12 16:31:06 361

原创 CODE-ACCORD:一个为自动合规检查生成规则而构建监管数据的语料库

建筑规范制定了规定建筑物和构筑物最低安全和福利要求的法规和标准。在建筑的整个生命周期内,包括设计、施工和翻新/拆除,遵守这些规范对于保证建筑设计的稳定性、安全性、可用性和可靠性至关重要。尽管合规检查传统上是手动进行的,但由于手动方法需要大量的时间和人力资源,现在越来越多的人希望自动化这一过程1、2。语义更丰富的建筑信息模型(BIM)的进步进一步鼓励了这一趋势,使自动合规性检查(ACC)成为可能3。

2025-03-12 15:01:10 588

原创 利用图神经网络学习计算同构-技术附录

我们在Alg.1中展示了训练CountGNN的算法。在第1行中,我们初始化所有参数以及目标L。在第3-13行中,我们累加给定训练元组的损失。具体地说,在第4-8行中,我们进行了递归的以边为中心的聚合。在第5-7行中,我们计算每条边的边中心表示。然后,在第9行和第10行中,我们通过分别聚合查询图和输入图的所有包含边中心表示来形成图表示。在行11中,采用计数器模块来预测Gi的同构于Qi的子图的数目.在第12行中,我们累计损失。在第14行中,我们形成了总体目标。最后,在第15行中,我们通过最小化目标L来优化模型。

2025-03-11 14:02:31 404

原创 DeepSeek-R1:通过强化学习激励LLM的推理能力

近年来,大型语言模型(LLM)一直在经历快速的迭代和演变(Anthropic,2024;OpenAI,2024 a),逐渐缩小了与人工通用智能(AGI)的差距。最近,后训练已成为整个训练流水线的一个重要组成部分。它可以提高推理任务的准确性,与社会价值观保持一致,并适应用户的偏好,同时相对于预训练,它只需要相对最少的计算资源。在推理能力方面,OpenAI的o 1(OpenAI,2024 b)系列模型是第一个通过增加思维链推理过程的长度来引入推理时间缩放的模型。

2025-03-10 13:08:46 704

原创 管理和挖掘图形数据(二)

图挖掘与管理近年来已成为一个热门的研究领域,因为它在计算生物学、软件缺陷定位和计算机网络等广泛的实际领域得到了广泛的应用。不同的应用程序会产生不同大小和复杂性的图形。相应的,不同的应用对底层挖掘算法有不同的要求。在本章中,我们将提供不同类型的图挖掘和管理算法的调查。我们还将讨论一些依赖于图表示的应用程序。我们将讨论不同的图挖掘算法如何适应不同的应用程序。最后,我们将讨论该领域未来研究的重要途径。图挖掘近年来在计算生物学、软件缺陷定位和计算机网络等领域得到了广泛的应用,已成为一个热门的研究领域。

2025-02-27 23:14:27 1024

原创 基于图神经网络的图摘要研究综述

随着大规模图的日益普及,在提取、处理和解释大型图数据方面出现了越来越多的计算挑战。因此,寻找方法来总结这些扩展图,同时保留它们的关键特征是很自然的。在过去,大多数图形摘要技术都试图从统计上捕捉图形中最重要的部分。然而,今天,现代图数据的高维和复杂性使得深度学习技术更加流行。因此,本文对基于图神经网络(gnn)的深度学习总结技术的进展进行了全面的综述。我们的研究包括对当前最先进的方法的回顾,包括循环gnn,卷积gnn,图自编码器和图注意力网络。

2025-02-27 23:14:08 623

原创 回答子图查询的为什么问题

子图查询已被应用于搜索富属性图中的实体,例如知识库[1]和社交网络[2]。子图查询Q是具有指定“焦点”实体uo的图模式,用于指定感兴趣的实体。给定一个图G,它返回G (w.r.t)中的(top k)个实体Q(G)。一种排序函数,它与理想的属性值相匹配,并满足拓扑约束。对子图查询的查询处理进行了广泛的研究[3]。然而,对于最终用户来说,编写这样的查询是一项重要的任务。由于对数据的先验知识很少,用户通常必须多次修改查询才能找到理想的答案。因此,查询重写所支持的解释功能有助于他们将查询调优到理想的答案。

2025-02-27 23:13:17 416

原创 图数据的管理与挖掘

Web看起来怎么样?我们如何区分一个“不正常的”社交网络和一个“正常的”社交网络?这些和类似的问题在许多领域都很重要,因为这些领域的数据可以直观地转换为图表;例子包括计算机网络、社会学、生物学等等。实际上,数据库术语M:N关系都可以表示为图。许多问题可以归结为以下内容:“我们如何生成合成但真实的图形?”为了回答这个问题,我们必须首先了解现实世界图表中常见的模式,从而可以将其视为常态/现实主义的标志。本调查概述了在这些问题上所做的令人难以置信的各种工作。

2025-02-27 23:12:44 856

原创 子图匹配的综合调查和实验研究:趋势、无偏性和相互作用

在大型图中搜索特定结构是图挖掘的基本操作,正式定义为子图匹配。如图1所示,给定一个大型数据图𝐺和一个查询图𝑄,子图匹配枚举所有嵌入𝑓,这些嵌入将𝑄中的每个顶点映射到𝐺中同态子图的相应顶点。在本文中,我们主要研究无向图和有标记顶点的连通图。注意,带有标记边的图也将在4.3节中讨论。一般来说,我们认为查询图𝑄=(𝑉𝑄,𝐸𝑄,Σ,𝐿𝑄)和数据图𝐺=(𝑉𝐺,𝐸𝐺,Σ,𝐿𝐺),在𝑉𝑄和𝑉𝐺顶点集,𝐸𝑄和𝐸𝐺套边,Σ是一组标签,和𝐿𝑄:𝑉𝑄→Σ和𝐿𝐺:?

2025-02-27 23:12:23 587

原创 机器视觉论文阅读(四)

在过去的十年中,计算机图形学在基于图像的渲染领域经历了一波活动,因为研究人员探索了捕捉真实世界的样本作为图像并使用它们合成新视图的想法,而不是从头开始重建整个物理世界。这反过来又激发了人们对基于图像的纹理合成算法的兴趣。这样的算法应该能够获取纹理样本并生成无限数量的图像数据,这些图像数据虽然与原始图像不完全相同,但会被人类感知为相同的纹理。此外,能够将纹理从一个对象转移到另一个对象将是有用的。剪切和粘贴任意对象上的材料属性的能力)。在本文中,我们提出了一个非常简单的算法来解决纹理合成问题。

2024-12-12 12:53:11 684 1

原创 机器视觉论文阅读(三)

纹理合成一直是计算机视觉中一个活跃的研究课题,无论是作为验证纹理分析方法的一种方式,还是作为其本身的一种方式。一个成功的纹理合成算法的潜在应用是广泛的,包括遮挡填充、有损图像和视频压缩、前景去除等。纹理合成的问题可以表述如下:让我们将纹理定义为无限二维平面上的某种视觉图案,在某种尺度上具有固定分布。给定来自某些纹理(图像)的有限样本,目标是合成来自相同纹理的其他样本。如果没有额外的假设,这个问题显然是病态的,因为给定的纹理样本可能是从无数不同的纹理中提取的。

2024-12-11 22:58:45 1019 1

原创 机器视觉论文阅读(二)

当今显示设备的多样性和多功能性对数字媒体提出了新的要求。例如,设计师必须为网页内容创建不同的替代方案,并为不同的设备设计不同的布局。此外,HTML以及其他标准可以支持页面布局和文本的动态更改。然而,到目前为止,图像虽然是数字媒体中的关键元素之一,但通常在大小上保持刚性,不能自动变形以适应不同的布局。在其他情况下,图像的大小或宽高比必须改变,以适应不同的显示器,如手机或pda,或在给定的纸张尺寸或分辨率上打印。标准的图像缩放是不够的,因为它与图像内容无关,通常只能均匀地应用。

2024-12-11 16:13:35 1023 1

翻译 机器视觉作业(一)阅读论文Hybrid images

在这里,我们利用人类视觉的多尺度感知机制来创造视觉错觉(混合图像),其中可以通过改变观看距离或呈现时间来感知图像的两种不同解释。我们使用并扩展了Schyns和Oliva [1994;1997;1999]。图1示出由两个图像组装的混合图像的示例这些面孔表现出不同的情绪。高空间频率对应于带有“悲伤”表情的脸。低空间频率对应于具有“高兴”和“惊讶”情绪的同一张脸(即,情绪从左到右依次为:高兴、惊讶、高兴和高兴)。要从一种解释转换到另一种解释,可以离图片几米远。

2024-11-22 17:51:44 76

原创 图数据管理与挖掘(十二)图模式挖掘

图的顶点集用表示,边集用表示。标签函数,将顶点或边映射到标签。图是另一个图的子图,如果存在从到的子图同构,用表示。被称为的超图。对于两个有标签的图和.子图同构是一个映射函数使得其中和分别是图和的标签函数,被称为在中的嵌入。给定一个带标签的图数据集和子图的支持图组。푔的支持。频繁图是指其支持度不小于最小支持阈值的图。一个重要的性质,称为反单调性,是限制频繁子图挖掘的搜索空间的关键。反单调性意味着一个大小为。

2024-10-30 20:24:12 943

原创 图管理与挖掘(七)精确和不精确图匹配:方法和应用

经过多年的研究,模式识别、机器学习和数据挖掘等领域已经达到了很高的成熟度[4]。用于分类、聚类、信息检索和其他任务的强大方法已经出现。然而,这些方法中的绝大多数依赖于以特征向量的形式给出的对象表示。这样的对象表示有许多有用的属性。例如,用欧几里得距离可以很容易地计算出两个物体的不相似度或距离。此外,对于智能信息处理中的数据挖掘、信息检索和相关任务,已经有了大量完善的方法。然而,最近人们对基于图的对象表示越来越感兴趣[16]。图是功能强大且通用的数据结构,能够显式地为给定对象的子结构之间的关系网络建模。

2024-10-24 12:31:42 1102

原创 学习用图神经网络计算同构

网络科学和图挖掘的研究经常发现和利用输入图上的重复子图模式。例如,在蛋白质网络中,我们可以查询由一个氧原子与一个氢原子共价键组成的羟基;在社交网络上,我们可以查询几个用户组成小团体的潜在家庭,其中两个在工作,其余的在学习。这些查询本质上描述了在输入图的不同部分重复出现的子图模式,表示某些语义,如羟基基团或族。这些子图模式也被称为同质图上的网络基序(Milo et al . 2002)或异质图上的元结构(Sun et al . 2011;

2024-10-21 13:40:59 855

原创 图形摘要方法及应用综述

随着技术的进步,我们产生的数据量以及我们收集和存档这些数据的能力都在不断增加。社交媒体互动、网页浏览、产品和服务购买、行程和健康传感器等日常活动会产生大量数据,对这些数据的分析会立即影响我们的生活。生成的大量数据及其速度要求进行数据汇总,这是数据挖掘的主要任务之一。由于摘要有助于识别数据中的结构和含义,数据挖掘社区对这项任务产生了浓厚的兴趣。方法,用于各种数据类型已经提出:序列数据和事件(Casas-Garriga 2005),项目集和关联规则(Liu et al 1999;Yan等人2005;

2024-10-18 13:52:08 433

原创 利用图摘要改进知识图的问题回答

问答(QA)是自然语言处理(NLP)中的一个传统任务。为了使QA系统有效地工作,有必要准确理解自然语言问题的含义,从各种背景信息中选择最合适的答案。在QA系统中有两个主要分支:知识图上的QA (KGQA)和文档上的QA。与基于文档的QA相比,KGQA可以提供更全面的答案:对于给定的问题,答案可能来自KGQA中的各种资源[5]。因此,KGQA成为近年来备受关注的重要话题[4,7,17,19,20,24]。KG是一个有向图,真实世界的实体作为节点,它们之间的关系作为边[7]。

2024-10-11 19:58:03 678

原创 管理和挖掘图形数据阅读(一)

近年来,由于在计算生物学、软件缺陷定位以及社交和通信网络方面的新应用,图挖掘领域得到了迅速的发展。本书是为研究管理和挖掘图的各种应用程序而设计的。图挖掘在图划分、节点聚类、匹配和连通性分析等众多问题中。图划分、匹配和降维等问题的定义过于“清晰”,无法在实际应用中使用。在实际应用程序中,问题可能有不同的变体,例如磁盘驻留情况、多图情况或与图相关的其他约束。在许多情况下,诸如频繁子图挖掘和密集图挖掘之类的问题对于不同的场景可能有各种不同的风格得到了理论界的广泛研究实际场景中应用程序的大小通常非常大。

2024-06-03 22:20:53 749

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除