- 博客(16)
- 收藏
- 关注
原创 头条舆论分析-4
找到了问题所在,目前的逻辑是按h1、h2、title字段来判断标题,但是它本身文章编辑的时候把正标题写到了正文里,所以就是ai生成的标题。在代码里加入ai生成内容的逻辑判断,如果检测到“该内容由文章生成”或存在 ai-meta 标记,优先使用 <article> / .weitoutiao-html 的内容,并从正文首行作为标题(除非存在可见的 h1)。运行一下,没有问题。还有一个渠道变天的标题,原因是我优先检测的article里的h1,现在改成优先检测全局的h1,检测不到再回退到原来的逻辑。
2026-01-03 19:30:02
179
原创 RAG评估方法
具体来说,就是给定问题、检索到的文档以及参考答案,ragas会把参考答案里的句子进行分解,判断分解的句子是不是可以由上下文得出,做一个二元分类(1、0)后,输出带有原因的json。例如,总共检索到10个文档,有 8个文档是和问题相关的,精确率就是80%,发现数据库里还有8个没有检索出来的相关文档,召回率就是50%。答案相关性方面,则是由大模型由答案逆向生成提问,判断生成的内容和用户问题的相似度来计算相关性,默认是生成三次,三次值取平均。:检索到的相关文档数量和检索到的文档总数量之比。
2025-12-29 23:22:48
326
原创 Deepseek企业级Agent项目开发实战-5
接下来,当用户的问题被判断为属于经营范围后,会实际的去查询对应的工具,比如不同的知识库,但在执行实际的查询之前,我们需要先通过任务分解组件去拆分用户输入进来的问题,因为用户的问题可能包含多个子任务,比如:请问你家的冰箱和电视都有哪些型号,这明显是两个任务,分别为:冰箱的型号和电视的型号。在具体的实现上,任务分解组件会根据用户的问题,生成一个任务列表,然后根据任务列表中的每一个子任务的性质,选择合适的工具去执行。具调用,执行的查询语句,是根据子任务生成的。参数,即:让接下来的工。
2025-10-26 00:16:16
916
原创 Deepseek企业级Agent项目开发实战-4
要有一个明确的规则体系,有清晰的定义,哪一步该调用什么样的模型来完成任务,这一步是一个什么样的角色,这些都要在做的时候规划清楚。这个图节点负责处理需要更多信息才能回答的问题,比如用户询问商品但没有提供具体型号或规格、用户询问订单状态但没有提供订单号等,这种情况下是没有办法去本地的数据库或者知 识库中查询出有效结果的,所以需要引导用户提供更多支撑知识库检索的必要信息。用户输入的问题一定会是千奇百怪,如果不能进行有效的意图识别,就无法将问题路由到对应的子图进行处理,也就无法给出准确的回答。
2025-10-22 23:44:38
941
原创 Deepseek企业级Agent项目开发实战-3
本次的项目里配置的有:Deepseek、openai(这个可以去tb买一下,不贵,也可以用国内的大模型替代)、ollama、SerpAPI、本地Mysql、本地Neo4j、本地Redis缓存、Microsoft GraphRAG,这个具体配置文件就不放了,因为涉及到自己的KEY。这一篇属于过渡和总结,思考了一下,各种工具的详细部署过程比较繁杂,但也无非就是让这些工具在自己的设备上能够跑起来,大部分通过源码安装就没什么问题出现,之后再分工具写详细的吧。首先,创建一下虚拟环境。写写本地私有化部署的过程。
2025-10-22 00:00:45
179
原创 Deepseek企业级Agent项目开发实战-2
6、多工具集成:通过LangChain的Tool组件,采用LangGraph图结构的Map-Reduce分支,实现多工具并行调用,并更具任务分解后的子任务进行结果汇总和处理。5、Neo4j图数据库检索:预构建规则库,大模型根据用户意图自动生成Cypher语句,实现结构化知识库的检索,作为Langgraph的子图接入到图结构中。3、用户意图识别:通过Langchain的PromptTemplate+Chain组件,接入LangGraph的图结构,实现用户的意图识别功能。Text2cyper 自我修正。
2025-10-18 16:17:49
517
原创 Deepseek企业级Agent项目开发实战-1
同时使用结构化输出声明,让模型只返回JSON格式。背景:按甲方需求,他们希望他们的客服机器人能够更加智能,甲方单日咨询量大约在五千到一万条,此前他们的客服机器人主要依赖FAQ,命中率比较低,需要大量的人工介入,后来接入产品说明书、产品数据库、售后政策等来作为RAG的知识库,但是问题很多,比如幻觉严重、多跳问题处理的效果不好、结构化数据和非结构化数据割裂等等。上线后,用上线日志做难负样本挖掘,把误分样本反补进few-shot列表,迭代三轮后,internet F1从0.82提升到0.93。
2025-10-18 14:47:15
632
原创 Web开发——D3.js——选择的相关方法
随后的标签中,使用D3.js选择了class为"myclass"的元素,并添加了一个元素,但是没有给元素添加任何内容。这段HTML代码与之前的代码类似,不同之处在于在标签中使用了D3.js来选择类名为"myclass"的元素,并添加了一个元素,然后用.text()方法为元素添加了文本内容"from D3.js"。D3.js提供了各种方法,html(),attr()和style()来修改所选元素的内容和样式。
2024-07-12 14:49:11
978
原创 Web开发——D3.js——选择
选择是D3.js的核心概念之一,它基于CSS选择器。允许我们在网页中选择一个或多个元素。此外,它允许我们修改、追加或删除与预定义数据集相关的元素。在本文中,我将介绍如何使用选择来创建数据可视化。通过匹配给定的CSS选择器,仅选择一个DOM元素。如果给定的CSS选择器有多个元素,则只选择第一个元素。通过匹配给定的CSS选择器来选择所有DOM元素。让我们详细说说这两种方法。
2024-07-08 14:29:27
1162
原创 Web开发——D3.js教程——相关概念
它使我们的HTML更具逻辑结构。(Cascading Style Sheets,层叠样式表),是一种用来为结构化文档(如 HTML 文档或 XML 应用)添加样式(字体、间距和颜色等)的计算机语言,它描述了如何在网页上呈现元素。这段SVG代码的作用是创建一个500x500像素的画布,并在画布上绘制一个矩形。矩形的左上角起点坐标是(0,0),宽度为300像素,高度为200像素。这是一个简单的HTML文档,包含一个标题和一个内容部分。我们可以在SVG中绘制其他形状,例如 : 线条,圆形,椭圆形,文本和路径。
2024-07-05 14:05:09
1466
原创 Web开发——D3.js——安装
在本篇文章中,我们将学习如何设置D3.js开发环境。在我们开始之前,我们要准备以下内容 :D3.js库编辑器浏览器服务器让我们一起来看看详细步骤逐步完成。我们需要将D3.js库包含在我们的HTML网页中才能使用D3.js创建数据可视化。有以下两种方式:从项目的文件夹中包含D3.js库。在CDN(内容分发网络)中包含D3.js库。
2024-07-04 16:33:10
2298
原创 Web开发——D3.js教程——介绍
与其他库相比,D3.js是最重要的框架之一。由于它可以与现有的Web技术无缝协作,并且可以操作文档对象模型的任何部分,因此它与。,可以根据数据集的内容进行引入,删除或编辑。D3.js可以成为数据探索的宝贵帮助,它可以让我们控制数据的表示,并允许添加交互性。D3.js是一个JavaScript库,用于在浏览器中创建交互式可视化。D3.js库允许我们在数据集的上下文中操作网页的元素。D3.js是最好的数据可视化框架之一,它可用于生成简单和复杂的可视化以及用户交互和过渡效果。它有一个很好的社区支持,更容易学习。
2024-07-04 11:06:14
529
简明python教程中文版PDF
2024-07-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅