web王-优快云博客

找到了问题所在，目前的逻辑是按h1、h2、title字段来判断标题，但是它本身文章编辑的时候把正标题写到了正文里，所以就是ai生成的标题。在代码里加入ai生成内容的逻辑判断，如果检测到“该内容由文章生成”或存在 ai-meta 标记，优先使用 <article> / .weitoutiao-html 的内容，并从正文首行作为标题（除非存在可见的 h1）。运行一下，没有问题。还有一个渠道变天的标题，原因是我优先检测的article里的h1，现在改成优先检测全局的h1，检测不到再回退到原来的逻辑。

2026-01-03 19:30:02 179

原创今日头条舆论分析-3

头条内容爬取

2026-01-01 15:58:32 385

原创今日头条舆论分析-2

注册、登录界面逻辑编写

2025-12-30 15:54:56 260

原创 RAG评估方法

具体来说，就是给定问题、检索到的文档以及参考答案，ragas会把参考答案里的句子进行分解，判断分解的句子是不是可以由上下文得出，做一个二元分类（1、0）后，输出带有原因的json。例如，总共检索到10个文档，有 8个文档是和问题相关的，精确率就是80%，发现数据库里还有8个没有检索出来的相关文档，召回率就是50%。答案相关性方面，则是由大模型由答案逆向生成提问，判断生成的内容和用户问题的相似度来计算相关性，默认是生成三次，三次值取平均。：检索到的相关文档数量和检索到的文档总数量之比。

2025-12-29 23:22:48 326

原创今日头条舆论分析-1

最近对头条比较感兴趣，但是又懒得自己看。所以做了一个今日头条舆论分析总结小项目。记录一下代码编写流程。

2025-12-29 10:55:18 321

原创 Deepseek企业级Agent项目开发实战-5

接下来，当用户的问题被判断为属于经营范围后，会实际的去查询对应的工具，比如不同的知识库，但在执行实际的查询之前，我们需要先通过任务分解组件去拆分用户输入进来的问题，因为用户的问题可能包含多个子任务，比如：请问你家的冰箱和电视都有哪些型号，这明显是两个任务，分别为：冰箱的型号和电视的型号。在具体的实现上，任务分解组件会根据用户的问题，生成一个任务列表，然后根据任务列表中的每一个子任务的性质，选择合适的工具去执行。具调用，执行的查询语句，是根据子任务生成的。参数，即：让接下来的工。

2025-10-26 00:16:16 916

原创 Deepseek企业级Agent项目开发实战-4

要有一个明确的规则体系，有清晰的定义，哪一步该调用什么样的模型来完成任务，这一步是一个什么样的角色，这些都要在做的时候规划清楚。这个图节点负责处理需要更多信息才能回答的问题，比如用户询问商品但没有提供具体型号或规格、用户询问订单状态但没有提供订单号等，这种情况下是没有办法去本地的数据库或者知识库中查询出有效结果的，所以需要引导用户提供更多支撑知识库检索的必要信息。用户输入的问题一定会是千奇百怪，如果不能进行有效的意图识别，就无法将问题路由到对应的子图进行处理，也就无法给出准确的回答。

2025-10-22 23:44:38 941

原创 Deepseek企业级Agent项目开发实战-3

本次的项目里配置的有：Deepseek、openai（这个可以去tb买一下，不贵，也可以用国内的大模型替代）、ollama、SerpAPI、本地Mysql、本地Neo4j、本地Redis缓存、Microsoft GraphRAG，这个具体配置文件就不放了，因为涉及到自己的KEY。这一篇属于过渡和总结，思考了一下，各种工具的详细部署过程比较繁杂，但也无非就是让这些工具在自己的设备上能够跑起来，大部分通过源码安装就没什么问题出现，之后再分工具写详细的吧。首先，创建一下虚拟环境。写写本地私有化部署的过程。

2025-10-22 00:00:45 179

原创 Deepseek企业级Agent项目开发实战-2

6、多工具集成：通过LangChain的Tool组件，采用LangGraph图结构的Map-Reduce分支，实现多工具并行调用，并更具任务分解后的子任务进行结果汇总和处理。5、Neo4j图数据库检索：预构建规则库，大模型根据用户意图自动生成Cypher语句，实现结构化知识库的检索，作为Langgraph的子图接入到图结构中。3、用户意图识别：通过Langchain的PromptTemplate+Chain组件，接入LangGraph的图结构，实现用户的意图识别功能。Text2cyper 自我修正。

2025-10-18 16:17:49 517

原创 Deepseek企业级Agent项目开发实战-1

同时使用结构化输出声明，让模型只返回JSON格式。背景：按甲方需求，他们希望他们的客服机器人能够更加智能，甲方单日咨询量大约在五千到一万条，此前他们的客服机器人主要依赖FAQ，命中率比较低，需要大量的人工介入，后来接入产品说明书、产品数据库、售后政策等来作为RAG的知识库，但是问题很多，比如幻觉严重、多跳问题处理的效果不好、结构化数据和非结构化数据割裂等等。上线后，用上线日志做难负样本挖掘，把误分样本反补进few-shot列表，迭代三轮后，internet F1从0.82提升到0.93。

2025-10-18 14:47:15 632

原创 Web开发——D3.js——选择的相关方法

随后的标签中，使用D3.js选择了class为"myclass"的元素，并添加了一个元素，但是没有给元素添加任何内容。这段HTML代码与之前的代码类似，不同之处在于在标签中使用了D3.js来选择类名为"myclass"的元素，并添加了一个元素，然后用.text()方法为元素添加了文本内容"from D3.js"。D3.js提供了各种方法，html()，attr()和style()来修改所选元素的内容和样式。

2024-07-12 14:49:11 978

原创 Web开发——D3.js——选择

选择是D3.js的核心概念之一，它基于CSS选择器。允许我们在网页中选择一个或多个元素。此外，它允许我们修改、追加或删除与预定义数据集相关的元素。在本文中，我将介绍如何使用选择来创建数据可视化。通过匹配给定的CSS选择器，仅选择一个DOM元素。如果给定的CSS选择器有多个元素，则只选择第一个元素。通过匹配给定的CSS选择器来选择所有DOM元素。让我们详细说说这两种方法。

2024-07-08 14:29:27 1162

原创 Web开发——D3.js教程——相关概念

它使我们的HTML更具逻辑结构。(Cascading Style Sheets，层叠样式表），是一种用来为结构化文档（如 HTML 文档或 XML 应用）添加样式（字体、间距和颜色等）的计算机语言，它描述了如何在网页上呈现元素。这段SVG代码的作用是创建一个500x500像素的画布，并在画布上绘制一个矩形。矩形的左上角起点坐标是（0,0），宽度为300像素，高度为200像素。这是一个简单的HTML文档，包含一个标题和一个内容部分。我们可以在SVG中绘制其他形状，例如 : 线条，圆形，椭圆形，文本和路径。

2024-07-05 14:05:09 1466

原创 Web开发——D3.js——安装

在本篇文章中，我们将学习如何设置D3.js开发环境。在我们开始之前，我们要准备以下内容：D3.js库编辑器浏览器服务器让我们一起来看看详细步骤逐步完成。我们需要将D3.js库包含在我们的HTML网页中才能使用D3.js创建数据可视化。有以下两种方式：从项目的文件夹中包含D3.js库。在CDN(内容分发网络)中包含D3.js库。

2024-07-04 16:33:10 2298

原创 Web开发——D3.js教程——介绍

与其他库相比，D3.js是最重要的框架之一。由于它可以与现有的Web技术无缝协作，并且可以操作文档对象模型的任何部分，因此它与。，可以根据数据集的内容进行引入，删除或编辑。D3.js可以成为数据探索的宝贵帮助，它可以让我们控制数据的表示，并允许添加交互性。D3.js是一个JavaScript库，用于在浏览器中创建交互式可视化。D3.js库允许我们在数据集的上下文中操作网页的元素。D3.js是最好的数据可视化框架之一，它可用于生成简单和复杂的可视化以及用户交互和过渡效果。它有一个很好的社区支持，更容易学习。

2024-07-04 11:06:14 529

weixin_53218076的博客

原创今日头条舆论分析-5

原创头条舆论分析-4