风清扬【coder】-优快云博客

原创用Python实现Word文档的智能解析与图片处理

通过上述脚本，我们展示了如何利用Python高效地处理Word文档，实现按章节切分和图片处理的功能。这在知识图谱构建、文档管理系统开发、内容提取与分析等领域具有广泛的应用前景。未来，可以进一步优化代码，例如增加对更多图片格式的支持、提高上传效率、完善错误处理机制等。同时，可以将该功能集成到更复杂的应用系统中，为用户提供更强大的文档处理服务。希望本文能为你在处理Word文档相关任务时提供有益的参考和启发。

2025-04-01 15:57:51 876

原创基于Milvus的密集向量和稀疏向量混合搜索

Milvus是一款开源的向量数据库，专为海量向量数据的存储、索引和查询而设计。它提供了高度优化的向量索引算法，能够快速处理大规模的向量搜索任务，广泛应用于人工智能、机器学习、图像识别、自然语言处理等领域。本文通过对基于Milvus的混合搜索技术脚本的详细分析，介绍了混合搜索的原理、实现细节以及应用场景。混合搜索技术为解决复杂的信息检索问题提供了有效的解决方案，随着技术的不断发展，我们可以期待其在更多领域得到广泛应用，并在性能和准确性上取得更大的突破。

2025-03-23 21:22:05 771

原创 Python 实现高效的实体扩展算法

实体组合生成上下文扩展去重处理。

2025-03-19 19:53:25 373

原创前后端数据传输加密：Python 与 Vue 的实践

通过上述Python后端和Vue前端的代码实现，我们成功地在前后端数据传输过程中应用了AES加密算法，为数据安全筑起了一道坚实的防线。然而，在实际应用中，我们还需高度重视密钥的管理和保护工作，避免因密钥泄露而引发严重的数据安全风险。同时，随着技术的不断进步和发展，我们应持续关注加密算法的安全性更新，及时调整和优化加密方案，以更好地应对日益复杂的网络安全挑战，为用户数据提供更加可靠、全方位的保障。

2025-02-28 08:20:18 1138

原创 KNN算法在IT项目中的性能优化：从理论到实战

KNN算法在IT项目中的性能优化：从理论到实战

2025-02-27 14:02:06 956

原创基于Milvus 向量数据库和Sentence Transformer构建智能问答系统

详细介绍如何使用 Python 结合 Milvus 向量数据库和 Sentence Transformer 模型来构建一个智能问答系统

2025-02-27 13:36:47 1373

原创实体识别处理--在给定的文本中识别特定类型的实体

实现了一个实体识别系统，主要用于在给定的文本中识别特定类型的实体。

2025-02-26 15:51:24 435

原创 CentOS 7上安装MySQL客户端并进行配置

安装MySQL客户端后，您需要进行一些基本配置以确保能够连接到MySQL服务器。保存并退出配置文件。如果能够看到MySQL客户端的版本信息，则说明安装成功。

2024-10-15 15:03:08 948

原创 CentOS系统mysql定时备份脚本

以上就是CentOS系统mysql定时备份脚本。再定时任务里添加定时任务执行器并指向日志输出。每天凌晨2点执行备份脚本。

2024-10-15 14:57:35 399

原创如何使用BERT模型进行实体名称识别与实体链指

实体名称识别是信息抽取中的一个重要任务，广泛应用于知识图谱构建、问答系统等领域。传统的实体识别方法通常依赖于规则或统计模型，而近年来基于深度学习的模型，如BERT，在该领域取得了显著的效果。本文将介绍如何使用BERT模型与字典树结合，实现实体名称识别与实体链指的完整流程。本文介绍了如何使用BERT模型结合字典树来实现实体名称识别与筛选，并通过实际代码示例进行了详细讲解。通过这种方法，我们可以有效地识别文本中的实体名称，并筛选出最有可能的实体，为后续的知识图谱构建和问答系统提供支持。

2024-09-27 10:34:57 682

原创利用 GlobalPointer 进行中文命名实体识别

我们首先定义了和两个函数，以实现针对的交叉熵损失和 F1 分数评估。交叉熵损失：将真实标签和预测标签重塑为二维张量，并计算多标签分类的交叉熵。F1 分数：通过计算精确率和召回率，返回 F1 分数以评估模型性能。通过上述分析，我们可以看到，利用进行中文命名实体识别的实现不仅高效，还能够处理多标签的复杂场景。我们定义了适合该模型的损失函数和评估指标，并提供了两种不同的模型构建方法，以适应不同的任务需求。希望本文能帮助读者更好地理解并实现中文命名实体识别。

2024-09-26 09:59:26 690

原创正则表达式匹配

输入：s = “aa”, p = “a”输出：false解释：“a” 无法匹配 “aa” 整个字符串。输入：s = “aa”, p = “a*”输出：true解释：因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此，字符串 “aa” 可被视为 ‘a’ 重复了一次。输入：s = “ab”, p = “."输出：true解释：".” 表示可匹配零个或多个（‘*’）任意字符（‘.’）。以下是对上述正则表达式匹配算法的解题思路分析：一、问题分析给定一个字符串和一个

2024-09-24 16:38:49 1244

原创基于双向 LSTM 和 CRF 的序列标注模型

本文介绍了如何使用 Keras 构建一个基于双向 LSTM 和 CRF 的序列标注模型。这种模型结合了双向 LSTM 的上下文建模能力和 CRF 的标签依赖关系考虑，能够在序列标注任务中取得较好的性能。通过自定义的CRF类，我们可以方便地将 CRF 层集成到 Keras 模型中。同时，预训练词向量的使用可以进一步提高模型的性能。希望本文对大家在自然语言处理中的序列标注任务有所帮助。

2024-09-23 09:47:54 676

原创使用双向 LSTM 和 CRF 进行中文命名实体识别

本文介绍了使用双向 LSTM 和 CRF 进行中文命名实体识别的方法，并对代码进行了详细分析。通过设置合适的超参数、进行数据预处理、构建模型和设置回调函数，可以有效地训练模型并进行准确的预测和评估。这种方法在命名实体识别任务中具有较高的准确性和实用性，可以应用于各种自然语言处理任务中。希望本文对大家理解和使用双向 LSTM 和 CRF 进行命名实体识别有所帮助。如果有任何问题或建议，欢迎在评论区留言。

2024-09-22 16:37:44 995

原创基于 BERT 的自定义中文命名实体识别实现

本文介绍了如何使用 BERT 模型实现自定义中文命名实体识别，包括数据预处理、模型训练、评估和预测。通过使用 PyTorch 和库，我们可以方便地实现命名实体识别任务，并取得较好的效果。希望本文对大家有所帮助。以上就是本文的全部内容，欢迎大家在评论区留言交流。

2024-09-21 12:05:26 1877

原创深入解析 Keras 中的自定义注意力机制与门控机制实现——基于 IntentAttention、SlotAttention 和 SlotGate

深入解析 Keras 中的自定义注意力机制与门控机制实现——基于 IntentAttention、SlotAttention 和 SlotGate

2024-09-20 08:47:10 1518

原创基于BERT的文本分类模型，结合了TextCNN网络结构

一个基于BERT的文本分类模型，并结合了TextCNN网络结构来进一步增强特征提取能力。代码的主要组件包括BERT模型的加载、卷积神经网络（CNN）部分的定义、特征融合以及最终的分类层

2024-09-19 11:16:30 1215

原创删除有序数组中的重复项

更改数组 nums ，使 nums 的前 k 个元素包含唯一元素，并按照它们最初在 nums 中出现的顺序排列。解释：函数应该返回新的长度 5 ，并且原数组 nums 的前五个元素被修改为 0, 1, 2, 3, 4。解释：函数应该返回新的长度 2 ，并且原数组 nums 的前两个元素被修改为 1, 2。输入：nums = [0,0,1,1,1,2,2,3,3,4]输出：5, nums = [0,1,2,3,4]输出：2, nums = [1,2,_]输入：nums = [1,1,2]

2024-09-18 09:35:42 440

原创数组移除元素

更改 nums 数组，使 nums 的前 k 个元素包含不等于 val 的元素。解释：你的函数应该返回 k = 5，并且 nums 中的前五个元素为 0,0,1,3,4。解释：你的函数函数应该返回 k = 2, 并且 nums 中的前两个元素均为 2。输入：nums = [0,1,2,2,3,0,4,2], val = 2。的元素都被移动到数组的前部，而且操作是原地的（不需要使用额外的空间）。输入：nums = [3,2,2,3], val = 3。输出：5, nums = [0,1,4,0,3,

2024-09-17 13:44:11 360

原创最小覆盖字串

在这个问题中，我们将使用两个指针（left 和 right）来表示窗口的左右边界，通过移动这两个指针来探索所有可能的窗口，并找到包含字符串 t 的所有字符的最小窗口。如果 s 中不存在涵盖 t 所有字符的子串，则返回空字符串 “”。这段代码正确地实现了滑动窗口策略，并且能够在 O(m + n) 时间复杂度内解决问题，其中 m 是字符串 s 的长度，n 是字符串 t 的长度。对于 t 中重复字符，我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。指针扩展窗口，直到窗口包含了 t 的所有字符。

2024-09-15 09:37:10 348

nalanqingcheng1314的博客

原创用Python实现Word文档的智能解析与图片处理

原创基于Milvus的密集向量和稀疏向量混合搜索

原创 Python 实现高效的实体扩展算法

原创前后端数据传输加密：Python 与 Vue 的实践

原创 KNN算法在IT项目中的性能优化：从理论到实战

原创基于Milvus 向量数据库和Sentence Transformer构建智能问答系统

原创实体识别处理--在给定的文本中识别特定类型的实体

原创 CentOS 7上安装MySQL客户端并进行配置

原创 CentOS系统mysql定时备份脚本

原创如何使用BERT模型进行实体名称识别与实体链指

原创利用 GlobalPointer 进行中文命名实体识别

原创正则表达式匹配

原创基于双向 LSTM 和 CRF 的序列标注模型

原创使用双向 LSTM 和 CRF 进行中文命名实体识别

原创基于 BERT 的自定义中文命名实体识别实现

原创深入解析 Keras 中的自定义注意力机制与门控机制实现——基于 IntentAttention、SlotAttention 和 SlotGate

原创基于BERT的文本分类模型，结合了TextCNN网络结构

原创删除有序数组中的重复项

原创数组移除元素

原创最小覆盖字串

原创滑动窗口最大值

原创给定两个整数 n 和 k，返回范围 [1, n] 中所有可能的 k 个数的组合。

原创基于问答对的实体识别和意图识别的知识图谱问答推理

原创 Java 实现无重复字符的最长字串

原创合并两个有序数组

原创基于 Transformers 的问答系统实现

原创 transformer实现自然语言意图识别模型训练和预测

原创 Qwen1.5适配OpenAI API接口的 openai_api.py

原创 JAVA 调用Open AI 接口生成图片url并直接在浏览器上响应显示

原创可视化的报表系统

原创低代码智能可视化设计工具（FusionView）

原创【零代码（低代码）工作流引擎（cube-flowable）】

空空如也

空空如也