- 博客(837)
- 资源 (5)
- 收藏
- 关注
原创 AI学习指南RAG篇(24)-RAGFlow的社区与开源贡献
RAGFlow的开源社区为开发者提供了一个交流和合作的平台,通过参与社区,读者不仅可以提升自己的技术水平,还可以为项目的发展做出贡献。希望本文的介绍能鼓励更多的读者参与到RAGFlow的开源社区中,共同推动技术的发展和创新。
2025-03-20 07:00:00
115
原创 AI学习指南RAG篇(22)-RAGFlow系统架构解析
RAGFlow通过文档解析器、查询分析器、检索、重排和LLM等核心组件,实现了高效、智能的信息处理。文档解析器负责将各种格式的文档进行解析,提取关键内容;查询分析器对用户的查询进行深入分析,提取关键信息;检索模块使用关键信息从海量文档中快速检索出相关的信息;重排模块对检索到的信息进行排序和过滤;LLM负责将排序后的信息整合并生成最终的答案或输出。希望本文的介绍能帮助您更好地理解和使用RAGFlow的系统架构。
2025-03-19 06:30:00
436
原创 AI学习指南RAG篇(23)-RAGFlow的DeepDoc模块
DeepDoc作为RAGFlow的核心组件,通过利用OCR、布局识别、表格结构识别等技术,实现了对文档的深度理解和信息提取。这些技术不仅能够处理多种文档格式,还能智能地识别文档中的各种元素,为后续的检索和生成提供支持。希望本文的介绍能帮助您更好地理解和使用DeepDoc。
2025-03-19 06:30:00
134
原创 AI学习指南RAG篇(20)-RAGFlow核心技术
RAGFlow通过多重召回、查询分析、任务调度和LLM等核心技术,实现了高效、准确的信息检索和生成。多重召回机制通过多个召回通道并行运行,提升了信息检索的多样性和精准度。查询分析模块理解用户意图,提取关键信息,为后续的检索和生成提供指导。任务调度模块动态调用不同的任务执行模块,确保生成的内容具有高质量和相关性。LLM作为核心组件,负责对输入问题进行深度处理,并返回相应的答案。希望本文的介绍能帮助您更好地理解和使用RAGFlow的核心技术。
2025-03-18 06:30:00
291
原创 AI学习指南RAG篇(21)-RAGFlow深度文档理解
RAGFlow通过利用OCR、布局识别、表格结构识别等技术,实现了对文档的深度理解。这些技术不仅能够处理多种文档格式,还能智能地识别文档中的各种元素,为后续的检索和生成提供支持。希望本文的介绍能帮助您更好地理解和使用RAGFlow的深度文档理解技术。
2025-03-18 06:30:00
197
原创 AI学习指南RAG篇(18)-模型训练与优化
通过上述步骤,您可以使用RAGFlow进行模型训练和优化,提高检索和生成的准确性。希望本文的介绍和示例能帮助您更好地理解和使用RAGFlow。
2025-03-17 06:30:00
351
原创 AI学习指南RAG篇(19)-API调用与集成
通过上述API调用示例,您可以方便地将RAGFlow与其他系统集成,实现数据集管理、文档处理、会话管理等功能。希望本文的介绍能帮助您更好地理解和使用RAGFlow的API。
2025-03-17 06:30:00
593
原创 AI学习指南RAG篇(16)-RAGFlow简介
RAGFlow是一种融合了数据检索与生成式模型的新型系统架构,其核心思想在于将大规模检索系统与先进的生成式模型(如Transformer、GPT系列)相结合,从而在回答查询时既能利用海量数据的知识库,又能生成符合上下文语义的自然语言回复。该系统主要包含两个关键模块:数据检索模块和生成模块。数据检索模块负责在海量数据中快速定位相关信息,而生成模块则基于检索结果生成高质量的回答或文本内容。RAGFlow作为一种新型的RAG引擎,通过其独特的架构和功能,为处理复杂格式的非结构化数据提供了强大的支持。
2025-03-16 06:30:00
44
原创 AI学习指南RAG篇(17)-RAGFlow环境搭建与配置
通过以上步骤,您应该能够成功安装和配置RAGFlow项目。如果在安装过程中遇到任何问题,请参考项目的官方文档或社区支持。希望本文能帮助您更好地理解和使用RAGFlow。
2025-03-16 06:30:00
147
原创 AI学习指南RAG篇(14)-RAG企业级应用案例
RAG技术在企业级应用中展现出巨大的潜力,通过智能客服系统、知识管理平台等应用案例,企业能够提升客户服务体验、优化内部文档管理和提高工作效率。希望本文的介绍和示例能帮助你在实际应用中更好地利用RAG技术。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-15 06:30:00
190
原创 AI学习指南RAG篇(15)-技术发展趋势
多模态RAG是指将RAG技术从传统的文本检索扩展到包括图像、视频、音频等多种模态的数据。这种技术通过融合不同模态的信息,为用户提供更全面、更丰富的交互体验。96实时RAG是指AI系统能够通过将实时数据馈送集成到RAG模型中来动态检索最新信息。这将使RAG系统能够对快速变化的信息做出更及时的响应,例如新闻事件、市场动态和突发事件。由于微调方法(如少样本提示和低秩适应LoRA)的进步,AI模型将能够检索和生成高度个性化的内容。
2025-03-15 06:30:00
30
原创 AI学习指南RAG篇(12)-性能调优技巧
RAG系统的性能调优是提升系统效果的关键步骤。通过检索结果的重排序、上下文压缩、提示工程、多查询重写策略和混合检索策略等方法,可以显著提高RAG系统的性能。希望本文的介绍和示例能帮助你在实际应用中更好地优化RAG系统。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-14 06:30:00
108
原创 AI学习指南RAG篇(13)-领域定制化方法
领域定制化是提升RAG系统在特定场景下性能的关键。通过构建领域知识库和对模型进行微调,可以显著提高RAG系统在特定领域的表现。希望本文的介绍和示例能帮助你在实际应用中更好地进行RAG系统的领域定制化。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-14 06:30:00
19
原创 AI学习指南RAG篇(10)-RAG性能评估指标
精度是指检索结果中相关文档的比例。它反映了检索结果的质量,即检索到的文档中有多少是与用户查询相关的。召回率是指检索结果中相关文档占所有相关文档的比例。它反映了检索结果的完整性,即所有相关文档中有多少被检索到。平均倒数排名(Mean Reciprocal Rank,MRR)是一种评估检索系统效果的度量指标,它考虑了第一个相关文档的排名位置。MRR的值越高,表示检索系统越快地检索到相关文档。平均准确率(Mean Average Precision,MAP)是一种评估多个查询的检索精确度的度量指标。
2025-03-13 06:30:00
36
原创 AI学习指南RAG篇(11)-评估工具与框架
RAGAS(Retrieval-Augmented Generation Assessment)是一个专为评估RAG系统设计的框架。它通过一系列定制的评估指标,帮助开发者全面了解RAG系统的性能。RAGAS支持本地和分布式评估,可以无缝集成到流行的LLM框架中[59ARES是一个用于评估RAG系统的框架,特别关注于利用合成数据和LLM评委来评估系统的性能。
2025-03-13 06:30:00
40
原创 AI学习指南RAG篇(8)-RAG检索模块设计
RAG检索模块的设计是RAG系统的核心,通过文本嵌入、向量搜索和双塔模型等技术,可以实现高效、准确的检索。文本嵌入将文本转换为向量表示,向量搜索利用向量相似度进行检索,双塔模型通过独立的查询塔和文档塔提高检索效率和灵活性。希望本文能帮助你更好地理解RAG检索模块的设计和实现。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-12 06:30:00
26
原创 AI学习指南RAG篇(9)-RAG生成模块设计
RAG生成模块的设计是RAG系统的核心,通过上下文融合和大语言模型生成,可以实现高质量、事实准确的回答。上下文融合将检索到的文档片段与用户查询结合,形成完整的上下文;大语言模型生成基于上下文和查询,生成连贯、准确的回答。生成模块的关键技术包括提示工程、多文档生成策略和优化算法,这些技术进一步提升了生成模块的性能和效果。希望本文能帮助你更好地理解RAG生成模块的设计和实现。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-12 06:30:00
369
原创 AI学习指南RAG篇(6)-RAG的技术路线
RAG技术通过不同的实现方法,如基于向量检索的RAG和基于图谱的RAG,有效地结合了信息检索与生成模型的优势,解决了大语言模型在知识更新、幻觉问题和上下文理解等方面的局限性。基于向量检索的RAG具有高效和准确的特点,适用于大规模文本数据的检索;基于图谱的RAG则通过结构化信息增强了模型的语义理解和逻辑推理能力,适用于需要高可解释性的场景。希望本文能帮助你更好地理解RAG技术的不同实现方法及其应用场景。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-11 06:30:00
225
原创 AI学习指南RAG篇(7)-RAG知识库构建
RAG知识库的构建过程包括数据收集、预处理、分块和向量化四个关键步骤。每个步骤都至关重要,直接影响到RAG系统的性能和效果。通过本文的详细讲解和示例代码,希望你能更好地理解RAG知识库的构建过程,并在实际应用中加以运用。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-11 06:30:00
448
原创 AI学习指南RAG篇(4)-RAG的工作流程
检索(Retrieval)增强(Augmentation)和生成(Generation)。通过这三个步骤,RAG 有效地结合了信息检索与生成模型的优势,解决了大语言模型在知识更新、幻觉问题和上下文理解等方面的局限性。本文通过实际示例展示了 RAG 的工作流程,希望对你理解 RAG 技术有所帮助。如果你对 RAG 技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨 RAG 技术的实现细节和实践应用。
2025-03-10 06:30:00
297
原创 AI学习指南RAG篇(5)-RAG的系统架构
知识库处理模块向量化模块检索引擎和生成模块。这些组件通过紧密协作,实现了从用户查询到生成回答的完整流程。知识库处理模块负责文档的收集和预处理,向量化模块将文本转换为向量表示,检索引擎从向量数据库中检索相关文档,生成模块基于检索结果生成最终回答。希望本文能帮助你更好地理解RAG系统的架构和工作原理。如果你对RAG技术感兴趣,欢迎继续关注本系列的后续文章,我们将深入探讨RAG技术的实现细节和实践应用。
2025-03-10 06:30:00
364
原创 AI学习指南RAG篇(2)-RAG的发展历程
RAG 可以从长文本中提取关键信息,生成简洁、准确的摘要。例如,新闻机构可以利用 RAG 模型自动生成新闻文章或总结冗长的报告。RAG 技术自 2020 年提出以来,经历了从 Naive RAG 到 Advanced RAG、Modular RAG、Graph RAG 和 Agentic RAG 的多个发展阶段。每个阶段都在前一阶段的基础上进行了改进和扩展,使得 RAG 技术在知识密集型任务中的表现不断提升。
2025-03-09 06:30:00
27
原创 AI学习指南RAG篇(3)-RAG的核心思想
假设用户请求:“生成一篇关于人工智能发展的新闻摘要。问题理解与检索:RAG模型从知识库中检索与“人工智能发展”相关的内容。信息融合与生成:检索到的内容(如“2023年AI技术取得了重大突破”)与用户请求结合,生成新闻摘要。输出优化:通过上下文压缩,确保摘要的简洁性和准确性。RAG技术通过结合信息检索与生成模型的优势,有效解决了大语言模型在知识更新、幻觉问题和上下文理解等方面的局限性。RAG的核心思想是通过“检索-生成”双重机制,确保生成内容的准确性、时效性和可靠性。
2025-03-09 06:30:00
24
原创 AI学习指南OmniParser篇(11)-模型微调
OmniParser 的强大功能离不开其背后的模型支持。通过模型微调,OmniParser 能够更好地适应特定任务和数据集,提高解析性能。本文将详细介绍 OmniParser 中使用的 YOLOv8 模型进行可交互图标检测的方法,以及 BLIP-v2 模型在图标描述数据集上的微调方法。
2025-03-08 06:30:00
65
原创 AI学习指南RAG篇(1)-RAG是什么
RAG 是一种结合了检索(Retrieval)和生成(Generation)的架构。其核心思想是通过从外部知识库中检索相关信息,并将其融入到生成模型中,从而提升生成内容的准确性和相关性。RAG(Retrieval-Augmented Generation)是一种结合了检索和生成的架构,通过从外部知识库中检索相关信息并将其融入生成模型,显著提升了模型在知识密集型任务中的表现。RAG 的提出解决了传统生成模型的知识盲点和幻觉问题,同时提高了模型的实时性、适应性和可解释性。
2025-03-08 06:30:00
25
原创 AI学习指南OmniParser篇(9)-使用OmniParser 自动化办公
OmniParser 在自动化办公领域具有广泛的应用前景。通过其强大的 GUI 元素解析能力和多模态协同技术,OmniParser 能够显著提升办公效率和准确性。无论是非结构化文档的智能处理、日志文件的异常检测,还是自动化操作电脑,OmniParser 都展现出了强大的功能和灵活性。希望这篇博客能够帮助你更好地理解 OmniParser 在自动化办公中的应用。如果你在使用 OmniParser 的过程中遇到任何问题,欢迎在评论区留言,我们会尽力为你解答。
2025-03-07 06:30:00
77
原创 AI学习指南OmniParser篇(10)-OmniParser性能优化
通过缓存预处理、批量处理优化和结果验证机制等性能优化技巧,OmniParser 能够显著提高数据解析和处理的效率和准确性。缓存预处理通过预编译解析模板,减少了重复编译的时间;批量处理优化利用 GPU 加速,大幅缩短了大规模数据处理的时间;结果验证机制通过置信度校验,确保了解析结果的准确性。这些优化技巧使得 OmniParser 在实际应用中能够更好地满足高效、准确的需求。希望这篇博客能够帮助你更好地理解和应用 OmniParser 的性能优化技巧。
2025-03-07 06:30:00
66
原创 window下的docker内使用gpu
Windows 上使用 Docker GPU需要进行一系列的配置和步骤。这是因为 Docker 在 Windows 上的运行环境与 Linux 有所不同,需要借助 WSL 2(Windows Subsystem for Linux 2)和 NVIDIA Container Toolkit 来实现 GPU 的支持。
2025-03-06 16:38:16
930
原创 Docker中GPU的使用指南
在Docker中使用GPU可以大大提升计算密集型任务的性能,特别是在深度学习和高性能计算领域。通过正确安装NVIDIA Container Toolkit并合理配置Docker容器,你可以充分利用GPU的计算能力。希望本文能够帮助你更好地在Docker中使用GPU,加速你的开发和部署过程!
2025-03-06 16:35:05
827
原创 安装HeyGem客户端报错 ERROR: Cannot create symbolic link
所以需要管理员权限,试用管理员权限打开命令行就行。
2025-03-06 16:11:28
245
原创 AI学习指南OmniParser篇(7)-使用方法之运行解析命令
通过使用命令行工具运行 OmniParser,你可以轻松地对各种 UI 元素进行解析,并获取详细的解析结果。解析结果以 JSON 格式输出,包含了元素的类型、文本内容、位置信息、功能描述以及元素之间的关系和可执行的操作。这些信息为 AI 智能体提供了丰富的数据支持,使其能够在复杂的用户界面中准确执行各种任务。希望这篇博客能够帮助你掌握 OmniParser 的使用方法,特别是如何运行解析命令和理解解析结果。如果你在使用过程中遇到任何问题,欢迎在评论区留言,我们会尽力为你解答。
2025-03-06 06:30:00
229
原创 AI学习指南OmniParser篇(8)-使用方法之GUI 元素解析
OmniParser 通过其先进的可交互区域检测模型、图标描述模型和光学字符识别(OCR)模块,实现了对屏幕上的可交互元素的高效、准确解析。多模态协同技术的应用使得 OmniParser 能够结合视觉和语言信息,提供更准确的操作指引。无论是解析 PDF 文件还是将截图转换为 Excel 表格,OmniParser 都展现出了强大的功能和灵活性。希望这篇博客能够帮助你更好地理解 OmniParser 的 GUI 元素解析过程及其多模态协同技术的应用。
2025-03-06 06:30:00
71
原创 AI学习指南OmniParser篇(5)-OmniParser技术优势
OmniParser 的技术优势使其在 AI 与 GUI 交互领域具有显著的竞争力。纯视觉驱动模式使其不依赖于 HTML 标签或视图层次结构,通过屏幕截图即可解析 UI 元素;跨平台兼容性支持多平台无缝适配,实现统一的视觉解析能力;高精度解析能力使其对小尺寸图标、复选框等识别准确率显著提升;实时响应能力通过模型轻量化技术和差异比对算法,实现低延迟推理和动态界面状态追踪。这些技术优势使得 OmniParser 成为 AI 智能体在 GUI 交互中的强大工具,推动 AI 技术在更多领域的应用和发展。
2025-03-05 06:30:00
74
原创 AI学习指南OmniParser篇(6)-使用方法之输入数据准备
获取和准备高质量的 UI 截图是使用 OmniParser 的关键步骤。通过选择合适的截图工具,确保截图的清晰度和完整性,你可以为 OmniParser 提供准确的输入数据,从而获得高效的解析结果。无论你是使用系统自带的截图工具,还是专业的截图软件,都可以根据实际需求选择最适合的工具来获取 UI 截图。希望这篇博客能够帮助你更好地使用 OmniParser,提高你的工作效率。如果你在获取和准备截图数据的过程中遇到任何问题,欢迎在评论区留言,我们会尽力为你解答。
2025-03-05 06:30:00
545
原创 AI学习指南OmniParser篇(3)-技术原理之核心模块解析
OmniParser 的核心模块——可交互区域检测模型、图标描述模型和光学字符识别(OCR)模块——共同构成了其强大的技术基础。可交互区域检测模型基于 YOLOv8 深度学习模型,能够精准检测屏幕上的可点击或可操作区域;图标描述模型利用 BLIP-v2 模型生成图标的功能描述,为每个检测到的图标提供自然语言标签;OCR 模块则用于识别屏幕上的文本内容,并与图标边界框融合,构建完整的界面元素布局。
2025-03-04 06:30:00
185
原创 AI学习指南OmniParser篇(4)-OmniParser工作流程
OmniParser 的工作流程通过结构化点检测和多边形与内容识别两个核心阶段,实现了对用户界面的高效、准确解析。结构化点检测阶段通过标记关键元素的位置,为 AI 提供了屏幕上元素位置的整体感知;多边形与内容识别阶段则通过绘制多边形并读取内容,创建了详细的、结构化的屏幕表示。这两个阶段的协同工作使得 OmniParser 能够为 AI 智能体提供强大的支持,推动 AI 技术在更多领域的应用和发展。希望这篇博客能够帮助你深入了解 OmniParser 的工作流程。
2025-03-04 06:30:00
418
原创 AI学习指南OmniParser篇(1)-OmniParser简介
在人工智能技术飞速发展的今天,微软推出的 OmniParser V2.0 无疑为 AI 领域带来了新的突破。OmniParser V2.0 是一款基于纯视觉的 GUI 智能体解析工具,它能够将用户界面的屏幕截图转换为结构化数据,从而提升基于大型语言模型(如 GPT-4V)的 UI 代理系统的性能。本文将详细介绍 OmniParser 是什么、它的核心功能和特点,以及它在各个领域的应用场景。
2025-03-03 06:30:00
252
原创 AI学习指南OmniParser篇(2)-OmniParser环境搭建
通过以上步骤,我们已经成功地搭建起了 OmniParser 的运行环境,包括安装 Python 3.12、Anaconda,克隆 OmniParser 仓库并安装依赖,以及下载并配置模型权重。现在,你可以开始使用 OmniParser 进行各种数据解析和处理任务了。在后续的博客中,我们将深入探讨 OmniParser 的实际应用案例,展示如何利用它解决实际问题,敬请期待!希望这篇博客能够帮助你顺利完成 OmniParser 的环境搭建。如果你在安装过程中遇到任何问题,欢迎在评论区留言,我们会尽力为你解答。
2025-03-03 06:30:00
372
原创 AI学习指南DeepSeek篇(12)-论文导读 Native Sparse Attention
论文标题发布时间:2025 年 2 月论文地址arXiv链接主要内容动态分层稀疏策略:结合粗粒度的 token 压缩和细粒度的 token 选择,保持全局上下文感知的同时确保局部精确性。硬件对齐优化:通过算术强度均衡的算法设计,实现显著的加速,并针对现代硬件进行了优化实现。端到端训练支持:支持端到端训练,降低预训练计算成本,而不会牺牲模型性能。实验结果:在多个基准测试中,NSA 的性能与全注意力(Full Attention)模型相当甚至更优,同时在解码、前向传播和反向传播阶段均实现了显著的加速。
2025-02-25 07:30:00
48
原创 AI学习指南DeepSeek篇(11)-论文导读 DeepSeek-R1
论文标题发布时间:2025 年 1 月论文地址arXiv链接Github地址主要内容:完全通过大规模强化学习(RL)训练,无需监督微调(SFT),展示了显著的推理能力。:引入冷启动数据和多阶段训练流程,优化模型的可读性和性能,推理任务表现与 OpenAI-o1-1217 相当。推理能力蒸馏:将 DeepSeek-R1 的推理能力成功迁移到更小的模型上,展示了知识迁移的有效性。背景大型语言模型(LLMs)在自然语言处理领域取得了显著进展,但推理能力的提升仍面临挑战。
2025-02-25 07:00:00
29
CKA-2019年培训视频-分卷03(关注后可免费下载)
2020-10-21
CKA-2019年培训视频-分卷02(关注后可免费下载)
2020-10-21
CKA-2019年培训视频-分卷01(关注后可免费下载)
2020-10-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人