自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 LLM-Supported Manufacturing Mapping Generation

本文提出一种利用大型语言模型(LLM)自动生成制造业知识图谱映射的方法,旨在解决制造业数据分散异构的整合难题。针对制造业本体庞大和LLM提示词限制的挑战,作者设计了MYAM+R架构,结合检索增强生成(RAG)和三种本体缩减策略(朴素法、相似度法、LLM法)。实验基于博世真实数据,评估了RML和YARRRML两种映射格式的生成效果,并与专家手动创建的黄金标准进行定量对比。结果显示,合理的配置下LLM可有效辅助映射生成,减少专家工作量。该方法为制造业知识图谱构建提供了新思路。

2025-12-17 15:10:26 416

原创 Guiding LLM Generated Mappings with Lifecycle-Based Metadata: An Early Evaluation

背景: 大型语言模型(LLMs)正越来越多地用于自动化知识工程任务,例如生成 RDF 映射。尽管前景广阔,但 LLM 生成的输出往往缺乏语义精度、句法正确性和上下文元数据。方案概述: 本文研究了与映射生命周期对齐的结构化元数据是否能提高 LLM 生成映射的质量和可重用性。作者提出了一个覆盖映射过程关键阶段的元数据模型,并将其集成到 MetaSEMAP 工具中以支持上下文感知的提示(prompting)。主要结果。

2025-12-17 14:08:34 747

原创 RODI: Benchmarking Relational-to-Ontology Mapping Generation Quality

本文提出了RODI基准测试框架,用于评估关系数据库到本体映射生成系统的质量。该框架通过查询回答任务间接评估映射质量,克服了直接比较映射文件的局限性。RODI设计了多领域测试场景(会议、地理、油气勘探数据),系统化分类了映射挑战(命名冲突、结构异构、语义异构等),并支持多种系统架构。实验评估了7个主流系统,揭示了它们在处理复杂映射时的优缺点。该研究为RDB2RDF映射生成领域提供了首个系统性评估基准,对推动本体数据集成技术发展具有重要意义。

2025-12-16 16:58:34 917

原创 2020 WWW Open Knowledge Enrichment for Long-tail Entities

本文提出了一种面向长尾实体的开放知识丰富化方法OKELE。针对现有知识库中长尾实体信息稀疏的问题,该方法创新性地利用相似流行实体作为先验知识,构建了端到端的知识丰富化框架。通过基于图注意力网络的属性预测模型,结合多源异构数据提取策略和专门设计的概率图验证模型,有效解决了长尾实体知识补全的三大挑战:属性预测、值提取和事实验证。实验结果表明,该方法在合成和真实数据集上均显著优于基线方法,为完善知识库的长尾覆盖提供了系统解决方案。

2025-12-03 11:00:02 601

原创 2025 AAAI Knowledge Editing with Dynamic Knowledge Graphs for Multi-Hop Question Answering

本文提出KEDKG方法,利用动态知识图谱解决多跳问答中的知识编辑问题。针对现有方法在二次编辑和知识冲突上的不足,KEDKG通过自动构建动态知识图谱存储修订信息,并引入细粒度检索机制提高准确性。核心创新包括:1)动态知识图谱的冲突消解机制;2)解耦式问题分解策略;3)基于实体和关系检测器的精准检索。实验表明该方法优于现有技术,能有效处理知识更新和多跳推理任务。研究为LLMs的知识更新提供了结构化解决方案,在多跳问答场景展现出显著优势。

2025-11-19 13:42:55 939

原创 TeCre: A Novel Temporal Conflict Resolution Method Based on Temporal Knowledge Graph Embedding

背景: 知识图谱 (KG) 中的事实往往不会随时间自动更新,导致部分事实存在时序冲突(例如,同一个人在同一时间段担任不同全职职务)。为了发现并消除这些冲突,本文提出了一种基于时序知识图谱嵌入 (TKGE) 的新型时序冲突消解方法TeCre。方案概述嵌入表示: 首先,利用 TKGE 方法将谓词关系和时间序列的时间戳信息融入到实体-关系的嵌入表示中。约束定义: 考虑到实体-关系表示随时间的演变顺序,TeCre 根据时间不相交 (time disjoint)时间优先 (time precedence)和。

2025-11-19 10:34:30 743

原创 2025 Elsevier Conflict Detection for Temporal Knowledge Graphs

本文提出了一种时序知识图谱冲突检测的新方法PaTeCon,通过自动挖掘时序约束解决传统手工定义方法的局限性。核心创新包括:1)提出实体级置信度指标,更准确反映普遍规律;2)设计两阶段剪枝策略PaTeCon+,显著提升计算效率;3)构建基于真实数据的评估基准。实验表明该方法能高效检测知识图谱中的时间不一致性,为质量保障提供了实用工具。

2025-11-19 10:14:13 859

原创 2025 AAAI TruthfulRAG Resolving Factual-level Conflicts

本文提出TruthfulRAG框架,通过知识图谱解决检索增强生成(RAG)中的事实级知识冲突问题。该方法首先从检索内容构建知识图谱,然后基于查询提取相关推理路径,并创新性地利用熵变化检测模型内部知识与外部知识的冲突。实验表明,该框架能有效提高RAG系统的准确性和可信度,优于现有方法。研究为处理大语言模型与外部知识库间的细粒度冲突提供了结构化解决方案。

2025-11-19 09:24:26 847

原创 2025 IJCAI LLM4VKG: Leveraging Large Language Models for Virtual Knowledge Graph Construction

摘要:本文提出LLM4VKG框架,利用大型语言模型自动化构建虚拟知识图谱(VKG)。针对传统方法依赖专家知识、难以处理命名模糊性等问题,该框架通过Retriever、Matcher、Namer三级模块实现数据库与本体元素的对齐,结合四种映射模式(SH/SR/SRm/SE)生成VKG规范。在RODI基准测试中,LLM4VKG平均F1分数比现有最优方法提升17%,最高提升39%,且对不完整本体具有鲁棒性。实验表明,该方法有效解决了复杂映射任务,为关系数据库与知识图谱的集成提供了新思路。 (字数:149)

2025-11-17 17:42:31 722

原创 2025 Large language models for intelligent RDF knowledge graph construction

本文探讨利用大型语言模型(LLMs)实现医疗本体自动映射,构建RDF知识图谱的创新方法。研究团队对GPT-4o、Claude 3.5等6个先进系统进行对比实验,提出融合BioBERT嵌入和ChromaDB向量检索的混合式语义映射引擎。实验结果表明,该方案在108个医疗术语数据集上表现优异,其中GPT-4o精确率达93.75%,F1分数达96.26%,显著优于传统方法。研究验证了LLMs在医疗知识图谱构建中的巨大潜力,为提升医疗数据互操作性提供了新思路。

2025-11-17 15:03:12 1099

原创 Automated Validation of Textual Constraints Against AutomationML via LLMs and SHACL

本文提出了一种利用大型语言模型(LLMs)和SHACL实现AutomationML(AML)文本约束自动化验证的创新方法。针对AML建模中非形式化文本约束难以自动验证的问题,研究者设计了一个三阶段的验证管道:首先将AML模型映射为OWL本体,然后通过LLM将自然语言约束转换为SHACL验证规则,最后自动执行验证并生成自然语言解释报告。实验表明,该方法能有效检查复杂建模规则,且无需用户掌握形式化方法知识。该研究通过结合语义网技术和LLMs,为工程数据验证提供了高效实用的自动化解决方案。

2025-11-17 11:56:31 627

原创 2025 Utilizing large language models for semantic enrichment of infrastructure condition data

本研究探讨了大型语言模型(LLMs)在建筑、工程和施工(AEC)领域将关系型数据库转换为RDF知识图谱的潜力。通过比较GPT和Llama系列模型在语义丰富任务中的表现,提出了一种模块化四阶段流程:SQL查询生成、SQL-本体映射、R2RML映射生成和RDF转换。结果表明,LLMs能显著降低RDF转换的技术门槛,但其在大规模数据集处理上仍存在挑战。该研究为AEC行业的数据互操作性和知识图谱构建提供了新的自动化思路。

2025-11-17 10:17:26 908

原创 2024 MathMatics Detect-Then-Resolve: Enhancing Knowledge Graph Conflict Resolution withLLM

摘要 知识图谱冲突消解是知识融合中的关键挑战,传统方法在处理未见实体时往往因知识有限而受限。本文提出CRDL方法,创新性地采用“先检测后解决”范式:首先通过冲突检测区分1-to-1和non-1-to-1关系,然后结合知识图谱嵌入评分和大型语言模型推理能力进行冲突消解。实验表明,CRDL的召回率和F1分数分别提升了56.4%和68.2%,显著优于基线方法。该研究首次将冲突检测与LLM能力相结合,为解决知识图谱融合中的冲突问题提供了新思路。

2025-11-14 10:54:47 744

原创 Dealing with Inconsistency for Reasoning over Knowledge Graphs: A Survey

本文综述了知识图谱(KGs)推理中的不一致性问题,系统梳理了检测、修复和容忍不一致性的三类方法。知识图谱常因自动化抽取和多源数据集成而存在逻辑矛盾,传统推理因此失效。作者首先分析不一致性检测技术,包括精确计算冲突集的模块化方法及基于机器学习的近似方案;其次探讨修复策略,如删除冲突断言或基于Chase算法更新;最后介绍容忍不一致推理的语义优化方法,使系统能在矛盾存在时继续有效推理。论文整合了语义网、数据质量等领域的相关工作,特别关注ABox层面的修复挑战,并指出未来研究方向。该综述为处理知识图谱不一致性提供了

2025-11-13 10:23:43 442

原创 KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation

KAG框架通过深度融合知识图谱与传统RAG技术,提出专业领域知识服务解决方案。其核心创新包括LLM友好的知识表示方法、逻辑形式引导的混合推理引擎、基于语义推理的知识对齐机制,以及针对KAG的模型能力增强策略。在多跳问答任务中,KAG较SOTA方法取得显著提升(HotpotQA F1提升19.6%,2WikiMultiHopQA提升33.5%),并已成功应用于电子政务和电子健康领域。该框架将集成到开源知识图谱引擎OpenSPG中,推动专业领域知识服务的本地化开发。

2025-11-11 17:29:01 730

原创 LightRAG: Simple and Fast Retrieval-Augmented Generation (LightRAG: 简单且快速的检索增强生成)

本文提出LightRAG框架,通过引入图结构改进传统RAG系统。LightRAG构建知识图谱索引并采用双层检索策略:低层匹配实体细节,高层匹配抽象主题。实验表明,该方法在检索准确性和效率上优于现有技术,尤其适合需要理解复杂关系的场景。框架已开源,支持增量更新,能快速适应动态数据环境。

2025-11-11 17:13:24 883

原创 AutoSchemaKG: Autonomous Knowledge Graph Construction through Dynamic Schema Induction from Web-Scal

AutoSchemaKG提出了一种自主构建知识图谱的新方法,通过动态模式归纳从大规模语料库中自动生成知识图谱。该方法利用大型语言模型同时抽取知识三元组(实体间关系、实体-事件关系、事件间因果关系)并动态归纳抽象概念模式,无需人工预定义模式。实验表明,该方法在5000万份文档上构建了包含9亿节点和59亿边的知识图谱ATLAS,实现与专家构建模式95%的语义对齐,并在多跳问答任务上超越现有方法。这一突破实现了知识图谱从依赖预定义模式到完全自主构建的范式转变。

2025-11-11 15:51:55 1185

原创 Utilizing large language models for semantic enrichment of infrastructure condition data: a comparat

摘要(≤150字) 本研究探讨利用大型语言模型(LLMs)将建筑行业关系型数据库自动转换为RDF知识图谱,比较了GPT和Llama系列模型的性能。通过四阶段流程(SQL生成、本体映射、R2RML生成、RDF转换)和自纠错机制,验证了LLMs在语义丰富任务中的潜力。实验表明,LLMs能有效减少人工干预,但在处理复杂逻辑和大规模数据时仍需优化。该研究为AEC领域知识图谱构建提供了自动化新思路。

2025-10-30 19:38:02 657

原创 Conformance Test Cases for the RDF Mapping Language (RML)

摘要 本文针对RDF映射语言(RML)缺乏标准化测试用例的问题,提出了一套基于R2RML测试用例扩展的一致性测试框架。研究团队系统性地将62个R2RML测试用例适配为支持CSV、XML和JSON等异构数据源的RML测试用例,最终构建了包含297个测试用例的标准集。通过语义化描述模型(利用EARL、DCAT等词汇)对测试用例进行规范化组织。实验评估了两个主流RML处理器(RMLMapper和CARML)的合规性,发现RMLMapper表现更优。该测试套件填补了RML生态系统的关键空白,为工具评估和用户选型提供

2025-10-28 13:47:07 706

原创 2025 KGCW Mapping by Example: Towards an RML Mapping Reverse Engineering Pipeline

本文提出了一种逆向工程方法ReMap,用于自动生成RML映射文档,从而简化非RDF数据到RDF的转换过程。该方法采用"通过实例映射"的范式,用户只需提供输入数据(如CSV)和期望的RDF输出样例,系统即可自动分析转换关系并生成标准RML映射。实验表明,ReMap在一致性评估中表现优异,成功率比基于大型语言模型的方法高出31%。该方案通过确定性管道实现映射逆向工程,为不熟悉RML的用户降低了知识图谱构建门槛,同时支持将旧版RML映射升级到最新标准。

2025-10-28 10:40:40 698

原创 2021 KGWC@ESWC Embedding-Assisted Entity Resolution for Knowledge Graphs

摘要 本文提出了一种嵌入辅助的知识图谱实体解析方法EAGER,通过监督学习框架将图嵌入相似性与传统属性相似性相结合。实验表明,在19个不同规模的基准数据集上,EAGER在关系丰富的"深层"知识图谱中表现显著优于现有方法,验证了融合图结构与属性信息的有效性。该方法为复杂知识图谱的实体解析提供了通用且高效的解决方案。

2025-10-18 10:26:07 1066

原创 2025 Knowledge graph-based entity alignment with unified representation for auditing

本文提出了一种名为KG-Marfia的知识图谱实体对齐方法,用于解决审计场景下异构数据融合的挑战。该方法通过多属性和加权关系融合机制,将实体的属性信息和结构关系统一表示。具体包括:1)使用BERT、Bi-LSTM和自注意力机制处理属性序列,消除属性顺序影响;2)基于跨图谱语义相似度构建加权邻接矩阵,突出重要关系;3)采用SVM分类器学习最优对齐决策边界。实验表明,该方法在公共数据集和真实审计数据上均优于现有方法,为构建审计知识图谱提供了有效技术支持。

2025-10-09 10:46:00 391

原创 2025 AAAI HLMEA: Unsupervised Entity Alignment Based on Hybrid Language Models

本文提出了一种基于混合语言模型的无监督实体对齐方法HLMEA,通过创新的"过滤-选择"两阶段框架解决知识图谱融合中的关键问题。该方法首先利用小型语言模型(SLM)进行高效候选实体筛选,再通过大型语言模型(LLM)进行精确匹配决策,并设计了迭代自训练机制实现SLM和LLM的协同优化。实验表明,HLMEA在多个基准数据集上显著优于现有监督和无监督方法,为知识图谱对齐提供了新的有效解决方案。

2025-10-09 09:50:36 428

原创 2025 ICLR KNOWLEDGE GRAPH FINETUNING ENHANCES KNOWLEDGE MANIPULATION IN LARGE LANGUAGE MODELS

本文提出了一种知识图谱驱动的监督微调框架(KG-SFT),旨在通过提升训练数据质量而非数量来增强大型语言模型(LLMs)的知识处理能力。该框架创新性地利用结构化知识图谱为每个问答对生成高质量解释,包含三个核心模块:知识提取器从外部知识图谱中抽取相关推理子图,生成器将其转化为流畅文本,检测器通过事实验证确保解释可靠性。实验表明,在15个领域和6种语言的低数据场景下,KG-SFT平均提升模型性能8.7%,最高可达18.1%。该方法的优势在于:1)从数量增强转向质量增强的范式创新;2)构建了完整可靠的知识解释生成

2025-10-08 14:57:53 800

原创 An Overview of Query Optimization in Relational Systems(关系系统中的查询优化概述)

本文介绍了关系数据库查询优化的核心问题与经典方法。查询优化器将声明式SQL查询转换为高效执行计划,其本质是一个搜索问题:在逻辑等价但成本不同的执行计划空间中,找到成本最低的方案。关键内容包括Join操作的交换律和结合律变换、System-R优化器的动态规划算法、成本模型与选择率估计,以及嵌套子查询的"解嵌套"技术。这些方法共同解决了多表连接顺序优化、执行成本估算等关键问题,奠定了现代数据库查询优化的理论基础。

2025-10-08 11:00:30 1178

原创 2025 ACL Rethinking Smoothness for Fast and Adaptable Entity Alignment Decoding

背景: 实体对齐 (EA) 对于整合多源知识图谱至关重要,其目标是识别不同图谱中的等价实体。现有的大多数 EA 解码方法依赖于实体和关系两种嵌入,这限制了它们在 GNN-based 模型中的通用性和效率。方案概述: 为解决这些挑战,论文提出了 Triple Feature Propagation (TFP) 框架。这是一个自适应且快速的 EA 解码方法,它创新地只使用实体嵌入。TFP 的核心思想是通过最大化实体嵌入的平滑性来重构 KG 的表示。

2025-10-08 09:37:13 937

原创 2025 Neurocomputing 用于弱监督实体对齐的全局注意力位置编码

本文提出了一种名为PEGAE的弱监督实体对齐框架,通过全局位置编码和注意力机制解决现有方法在远距离实体对齐中的性能下降问题。PEGAE首先利用结构化注意力的重启随机游走计算实体位置特征,并通过奇异值分解实现跨图谱位置编码的一致性。实验表明,该方法在弱监督场景下显著优于现有技术,降低了模型对大量对齐种子的依赖。该研究为知识图谱融合提供了新的解决方案。

2025-09-29 10:13:23 667

原创 2025 Arxiv Memento: Fine-tuning LLM Agents without Fine-tuning LLMs (Memento: 在不微调大语言模型的情况下微调其智能体)

背景: 现有的大语言模型(LLM)智能体要么依赖于固定的、手工制作的反射工作流,要么需要对LLM参数进行梯度更新,这两种方式都限制了其灵活性和适应性。前者僵化,后者计算成本高昂,不适用于在线持续学习。方案概述: 论文提出了一种名为Memento的新型学习范式,旨在实现自适应LLM智能体,且无需微调底层LLM。该方法通过基于记忆的在线强化学习实现低成本的持续适应。作者将此过程形式化为记忆增强马尔可夫决策过程(M-MDP),并配备了一个神经案例选择策略来指导行动决策。

2025-09-28 09:55:13 787

原创 2026 SIGMOD ST-Raptor: LLM-Powered Semi-Structured Table Question Answering

ST-Raptor提出了一种基于大语言模型(LLM)的半结构化表格问答框架,通过创新的层次正交树(HO-Tree)表示法解决复杂表格布局处理难题。该框架将表格构建为元数据树和主体数据树,设计了流水线式问答机制,将复杂问题分解为原子操作步骤,并引入两阶段验证确保可靠性。实验在新构建的SSTQA数据集上进行,结果显示ST-Raptor比现有方法最高提升20%的准确率。该研究为金融、医疗等领域的半结构化表格自动化处理提供了有效解决方案。

2025-09-28 09:05:40 896

原创 2024 Mathematics Detect-Then-Resolve: Enhancing Knowledge Graph Conflict Resolution with LLM

本文提出了一种名为CRDL的创新方法,通过结合冲突检测和大语言模型(LLM)来提升知识图谱冲突解决的性能。该方法首先针对不同关系类型实施精准过滤策略,然后利用精心设计的Prompt工程,使LLM能够有效识别包含未见实体的三元组。实验结果显示,CRDL在召回率和F1分数上分别比现有方法提升了56.4%和68.2%。该研究为知识融合过程中的冲突解决提供了更鲁棒的解决方案,显著提高了知识图谱的数据质量。

2025-09-18 11:09:03 1064

原创 Optimizing Polynomial Expressions by Algebraic Factorization and Common Subexpression Elimination

论文摘要 本文提出了一种基于代数分解和公共子表达式消除的多项式表达式优化方法,旨在减少计算复杂度。通过将多项式表示为矩阵形式,系统性地提取核心(kernels)和公共子表达式(co-kernels),构建Kernel Cube Matrix(KCM)和Cube Incidence Matrix(CIM)分别处理多项式级和单项式级的公共子表达式。核心贡献包括:(1) 设计价值函数量化子表达式提取的收益,综合考虑乘法/加法操作节省;(2) 提出贪心算法迭代选择最优子表达式进行重写。实验表明该方法能有效减少操作数

2025-09-18 10:17:21 678

原创 2021 Knowledge graph quality control: A survey

知识图谱质量控制综述摘要 本文系统梳理了知识图谱(KG)质量控制的研究进展,提出六维评估框架(准确性、一致性、完整性、时效性、可信性、可用性),并分析其相互关系。从KG构建全流程(知识源选择、抽取、融合)探讨各环节的质量控制方法,构建后提出基于多维度的质量增强策略。通过整合分散的研究成果,为KG质量控制提供系统性指导,推动高质量KG在语义搜索、智能问答等领域的应用。该综述填补了领域内缺乏全局视角的空白,为后续研究提供方法论框架。

2025-09-16 10:02:35 753

原创 2024 ESWC Towards self-configuring Knowledge Graph Construction Pipelines using LLMs - A Case Study

本文提出利用LLMs自动生成RML映射文件来配置知识图谱构建管道的方法。通过实验评估五种商业LLM(Claude2.1、Claude3 Opus、GPT3.5 Turbo、GPT4 Turbo、Gemini Pro)在IMDB JSON子集和DBpedia电影本体上的表现。结果显示,Claude3 Opus在语法有效性(75%无需修复)和映射质量(26/40次运行生成有效三元组)上显著优于其他模型。研究发现LLMs能有效理解本体结构并生成正确映射,其中Claude3在字面值精确匹配(F1≈0.9)和数据类型

2025-09-05 10:21:18 967

原创 2025 ESWC An Algebraic Foundation for Knowledge Graph

本文提出了一种用于知识图谱构建的形式化代数框架,通过定义映射关系和代数运算符,为RML等映射语言提供了理论基础。该代数包含源运算符(从数据源提取数据)、扩展运算符(计算新属性)和关系代数运算符(投影、连接等),并给出了将RML转换为代数表达式的算法。基于代数等价规则,可实现优化映射计划的正确性证明。该工作填补了知识图谱映射语言缺乏形式化语义的空白,为后续优化和验证奠定了基础。

2025-09-04 10:13:22 1116

原创 2023 arXiv MapperGPT: Large Language Models for Linking and Mapping Entities

本文介绍了一种基于大语言模型(LLMs)的实体映射方法MapperGPT,用于改进生物医学领域本体对齐的准确率。传统词汇匹配方法召回率高但精确度低,而MapperGPT创新性地将LLMs(如GPT-4)作为后处理步骤,对高召回方法生成的候选映射进行语义审查和细化。实验表明,该方法在解剖学、发育生物学等领域的F1分数达到0.672,比现有最佳方法提升24%。研究通过标准化SSSOM格式和挑战性测试集构建,为生物医学数据整合提供了可复用的解决方案,尽管当前准确率仍低于人工专家,但展现了LLMs在语义映射领域的潜

2025-09-04 09:03:32 710

原创 2024 arXiv Cost-Efficient Prompt Engineering for Unsupervised Entity Resolution

本文探讨了使用大型语言模型(LLM)进行无监督实体解析(ER)的提示工程方法。研究比较了六种不同的提示策略在电商数据集上的表现,发现GPT-3.5在无监督ER任务中表现良好(F1>80%),但更复杂的提示方法未必优于简单方法。例如,单属性提示在成本降低37%的情况下性能与多属性方法相当。研究还发现,结构化JSON格式会降低性能,而相似度评分提示在不同数据集上表现不稳定。这些结果表明LLM为ER提供了领域无关的解决方案,但提示设计需要权衡成本与性能,简单方法在特定场景下可能更高效。

2025-09-03 10:52:42 1259

原创 2024 ESWC KGValidator: A Framework for Automatic Validation of Knowledge Graph Construction

背景:知识图谱(KG)的验证传统上依赖大规模人工标注,成本高昂且不可扩展。方案概述:本文提出 KGValidator,一个利用大语言模型(LLM)自动验证知识图谱构建的框架,支持通过模型内部知识、用户提供的上下文或外部知识检索来验证图谱三元组。主要结果/提升:在多个基准数据集(如 FB15K-237N、Wiki27K)上,结合外部上下文(如 Wikidata 或网络搜索)的 GPT-4 验证器达到最高准确率(FB15K-237N-150: 0.83, Wiki27K-150: 0.89)。

2025-09-03 10:51:06 895

原创 2022 ACM A Comprehensive Survey on Automatic Knowledge Graph Construction

本文系统综述了知识图谱(KG)自动构建方法,将其分为知识获取、精炼和演化三个阶段。研究分析了300多种方法,比较了不同数据环境下的技术差异,并提供了实用资源。结果表明,深度学习方法在性能上优于传统技术,但仍面临数据噪声和低资源场景的挑战。文章最后讨论了未来研究方向,如多模态KG和端到端框架开发,为领域研究提供了全面参考。关键词:知识图谱、深度学习、信息提取、知识补全。

2025-09-02 10:01:05 1250

原创 2025 ACL Can LLMs be Knowledge Graph Curators for Validating Triple Insertions?

本研究提出使用大型语言模型(LLMs)自动验证RDF三元组插入知识图谱的方法,针对类别/属性对齐、URI标准化、语义一致性和句法正确性四个关键任务。通过分步提示的系统化验证框架,在电商领域真实数据上评估了四种LLM模型,其中Llama-3-70B表现最优(句法验证准确率0.99)。研究创新性地结合人工审查机制,在保持自动化优势的同时确保领域知识正确性,为知识图谱维护提供了可扩展的解决方案。结果表明LLMs在RDF验证中具有潜力,但实际部署仍需解决领域泛化等挑战。

2025-09-02 09:28:32 763

原创 2017 ijcai Multilingual Knowledge Graph Embeddings for Cross-lingual Knowledge Alignment

本文提出MTransE模型,通过多语言知识图嵌入实现跨语言知识对齐。针对现有跨语言对齐覆盖不足的问题,该模型为每种语言分配独立嵌入空间,并学习跨语言转换函数,同时保留单语嵌入功能。实验表明,线性变换变体在实体匹配(Hits@10达68.53%)和三重对齐验证(准确率94.90%)任务上表现最优,显著优于基线方法。该研究为知识库补全和跨语言应用提供了自动化的解决方案。

2025-09-01 20:09:25 1043

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除