- 博客(32)
- 收藏
- 关注
原创 用Python实现Word文档的智能解析与图片处理
通过上述脚本,我们展示了如何利用Python高效地处理Word文档,实现按章节切分和图片处理的功能。这在知识图谱构建、文档管理系统开发、内容提取与分析等领域具有广泛的应用前景。未来,可以进一步优化代码,例如增加对更多图片格式的支持、提高上传效率、完善错误处理机制等。同时,可以将该功能集成到更复杂的应用系统中,为用户提供更强大的文档处理服务。希望本文能为你在处理Word文档相关任务时提供有益的参考和启发。
2025-04-01 15:57:51
584
原创 基于Milvus的密集向量和稀疏向量混合搜索
Milvus是一款开源的向量数据库,专为海量向量数据的存储、索引和查询而设计。它提供了高度优化的向量索引算法,能够快速处理大规模的向量搜索任务,广泛应用于人工智能、机器学习、图像识别、自然语言处理等领域。本文通过对基于Milvus的混合搜索技术脚本的详细分析,介绍了混合搜索的原理、实现细节以及应用场景。混合搜索技术为解决复杂的信息检索问题提供了有效的解决方案,随着技术的不断发展,我们可以期待其在更多领域得到广泛应用,并在性能和准确性上取得更大的突破。
2025-03-23 21:22:05
452
原创 前后端数据传输加密:Python 与 Vue 的实践
通过上述Python后端和Vue前端的代码实现,我们成功地在前后端数据传输过程中应用了AES加密算法,为数据安全筑起了一道坚实的防线。然而,在实际应用中,我们还需高度重视密钥的管理和保护工作,避免因密钥泄露而引发严重的数据安全风险。同时,随着技术的不断进步和发展,我们应持续关注加密算法的安全性更新,及时调整和优化加密方案,以更好地应对日益复杂的网络安全挑战,为用户数据提供更加可靠、全方位的保障。
2025-02-28 08:20:18
966
原创 基于Milvus 向量数据库和Sentence Transformer构建智能问答系统
详细介绍如何使用 Python 结合 Milvus 向量数据库和 Sentence Transformer 模型来构建一个智能问答系统
2025-02-27 13:36:47
1168
原创 CentOS 7上安装MySQL客户端并进行配置
安装MySQL客户端后,您需要进行一些基本配置以确保能够连接到MySQL服务器。保存并退出配置文件。如果能够看到MySQL客户端的版本信息,则说明安装成功。
2024-10-15 15:03:08
739
原创 CentOS系统mysql定时备份脚本
以上就是CentOS系统mysql定时备份脚本。再定时任务里添加定时任务执行器并指向日志输出。每天凌晨2点执行备份脚本。
2024-10-15 14:57:35
318
原创 如何使用BERT模型进行实体名称识别与实体链指
实体名称识别是信息抽取中的一个重要任务,广泛应用于知识图谱构建、问答系统等领域。传统的实体识别方法通常依赖于规则或统计模型,而近年来基于深度学习的模型,如BERT,在该领域取得了显著的效果。本文将介绍如何使用BERT模型与字典树结合,实现实体名称识别与实体链指的完整流程。本文介绍了如何使用BERT模型结合字典树来实现实体名称识别与筛选,并通过实际代码示例进行了详细讲解。通过这种方法,我们可以有效地识别文本中的实体名称,并筛选出最有可能的实体,为后续的知识图谱构建和问答系统提供支持。
2024-09-27 10:34:57
527
原创 利用 GlobalPointer 进行中文命名实体识别
我们首先定义了和两个函数,以实现针对的交叉熵损失和 F1 分数评估。交叉熵损失:将真实标签和预测标签重塑为二维张量,并计算多标签分类的交叉熵。F1 分数:通过计算精确率和召回率,返回 F1 分数以评估模型性能。通过上述分析,我们可以看到,利用进行中文命名实体识别的实现不仅高效,还能够处理多标签的复杂场景。我们定义了适合该模型的损失函数和评估指标,并提供了两种不同的模型构建方法,以适应不同的任务需求。希望本文能帮助读者更好地理解并实现中文命名实体识别。
2024-09-26 09:59:26
524
原创 正则表达式匹配
输入:s = “aa”, p = “a”输出:false解释:“a” 无法匹配 “aa” 整个字符串。输入:s = “aa”, p = “a*”输出:true解释:因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。输入:s = “ab”, p = “."输出:true解释:".” 表示可匹配零个或多个(‘*’)任意字符(‘.’)。以下是对上述正则表达式匹配算法的解题思路分析:一、问题分析给定一个字符串和一个
2024-09-24 16:38:49
774
原创 基于双向 LSTM 和 CRF 的序列标注模型
本文介绍了如何使用 Keras 构建一个基于双向 LSTM 和 CRF 的序列标注模型。这种模型结合了双向 LSTM 的上下文建模能力和 CRF 的标签依赖关系考虑,能够在序列标注任务中取得较好的性能。通过自定义的CRF类,我们可以方便地将 CRF 层集成到 Keras 模型中。同时,预训练词向量的使用可以进一步提高模型的性能。希望本文对大家在自然语言处理中的序列标注任务有所帮助。
2024-09-23 09:47:54
620
原创 使用双向 LSTM 和 CRF 进行中文命名实体识别
本文介绍了使用双向 LSTM 和 CRF 进行中文命名实体识别的方法,并对代码进行了详细分析。通过设置合适的超参数、进行数据预处理、构建模型和设置回调函数,可以有效地训练模型并进行准确的预测和评估。这种方法在命名实体识别任务中具有较高的准确性和实用性,可以应用于各种自然语言处理任务中。希望本文对大家理解和使用双向 LSTM 和 CRF 进行命名实体识别有所帮助。如果有任何问题或建议,欢迎在评论区留言。
2024-09-22 16:37:44
825
原创 基于 BERT 的自定义中文命名实体识别实现
本文介绍了如何使用 BERT 模型实现自定义中文命名实体识别,包括数据预处理、模型训练、评估和预测。通过使用 PyTorch 和库,我们可以方便地实现命名实体识别任务,并取得较好的效果。希望本文对大家有所帮助。以上就是本文的全部内容,欢迎大家在评论区留言交流。
2024-09-21 12:05:26
1589
原创 深入解析 Keras 中的自定义注意力机制与门控机制实现——基于 IntentAttention、SlotAttention 和 SlotGate
深入解析 Keras 中的自定义注意力机制与门控机制实现——基于 IntentAttention、SlotAttention 和 SlotGate
2024-09-20 08:47:10
1297
原创 基于BERT的文本分类模型,结合了TextCNN网络结构
一个基于BERT的文本分类模型,并结合了TextCNN网络结构来进一步增强特征提取能力。代码的主要组件包括BERT模型的加载、卷积神经网络(CNN)部分的定义、特征融合以及最终的分类层
2024-09-19 11:16:30
1068
原创 删除有序数组中的重复项
更改数组 nums ,使 nums 的前 k 个元素包含唯一元素,并按照它们最初在 nums 中出现的顺序排列。解释:函数应该返回新的长度 5 , 并且原数组 nums 的前五个元素被修改为 0, 1, 2, 3, 4。解释:函数应该返回新的长度 2 ,并且原数组 nums 的前两个元素被修改为 1, 2。输入:nums = [0,0,1,1,1,2,2,3,3,4]输出:5, nums = [0,1,2,3,4]输出:2, nums = [1,2,_]输入:nums = [1,1,2]
2024-09-18 09:35:42
386
原创 数组移除元素
更改 nums 数组,使 nums 的前 k 个元素包含不等于 val 的元素。解释:你的函数应该返回 k = 5,并且 nums 中的前五个元素为 0,0,1,3,4。解释:你的函数函数应该返回 k = 2, 并且 nums 中的前两个元素均为 2。输入:nums = [0,1,2,2,3,0,4,2], val = 2。的元素都被移动到数组的前部,而且操作是原地的(不需要使用额外的空间)。输入:nums = [3,2,2,3], val = 3。输出:5, nums = [0,1,4,0,3,
2024-09-17 13:44:11
313
原创 最小覆盖字串
在这个问题中,我们将使用两个指针(left 和 right)来表示窗口的左右边界,通过移动这两个指针来探索所有可能的窗口,并找到包含字符串 t 的所有字符的最小窗口。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 “”。这段代码正确地实现了滑动窗口策略,并且能够在 O(m + n) 时间复杂度内解决问题,其中 m 是字符串 s 的长度,n 是字符串 t 的长度。对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。指针扩展窗口,直到窗口包含了 t 的所有字符。
2024-09-15 09:37:10
305
原创 滑动窗口最大值
给你一个整数数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。返回 滑动窗口中的最大值 。
2024-09-14 20:06:37
481
原创 给定两个整数 n 和 k,返回范围 [1, n] 中所有可能的 k 个数的组合。
这是一个典型的组合生成问题,可以使用回溯算法来解决。回溯算法是一种通过穷举所有可能情况来找到所有解的算法。对于这个问题,我们从数字 1 开始,依次尝试将每个数字加入到当前组合中,如果当前组合的大小等于 k,则将其加入结果列表中。然后,我们通过递归调用回溯函数,不断尝试新的数字,直到找到所有可能的组合。
2024-09-13 08:58:41
697
原创 基于问答对的实体识别和意图识别的知识图谱问答推理
通过识别问题中的关键词和相关实体,我们可以构建一个有效的意图识别和实体提取系统。这样的系统可以帮助自动化从用户问题到相应Cypher查询的转换过程,使得与知识图谱的交互更加直接和高效。
2024-09-12 17:01:29
1631
原创 基于 Transformers 的问答系统实现
在自然语言处理领域,问答系统一直是一个重要的研究方向。本文将介绍如何使用 Transformers 库实现一个简单的问答系统。
2024-09-09 17:14:37
690
原创 transformer实现自然语言意图识别模型训练和预测
从0到1实现transformer自然语言意图识别模型训练和预测的完整流程,包括数据整理、模型训练、模型部署和模型预测的详细步骤。
2024-09-05 16:53:13
664
原创 Qwen1.5适配OpenAI API接口的 openai_api.py
Qwen1.5 适配OpenAI接口的openai_api.py API源码
2024-04-09 15:56:56
3096
15
原创 JAVA 调用Open AI 接口生成图片url并直接在浏览器上响应显示
使用chatGPT 生成图片作画,JAVA调用Open AI 接口生成,生成的图片直接在浏览器响应展示。
2023-11-03 13:47:54
695
原创 可视化的报表系统
对标帆软的报表系统,cube-report报表系统是一种用于生成、管理和分发各种类型报表的软件系统。它可以从各种数据源中提取数据,并将其转换为易于理解的图表、表格和图形的形式。报表系统还可以根据用户的需求,自动化地生成和分发报表,从而帮助用户更好地理解和分析数据,以便做出更好的业务决策。报表系统通常具有可视化报表设计器、数据集成和数据分析等功能,可以适用于各种行业和业务场景。
2023-07-21 09:59:38
485
原创 低代码智能可视化设计工具(FusionView)
富表智能数据可视化平台是一款面向企业和行业级别的用户,具有AI特色的可视化与BI商业智能敏捷分析的平台。是围绕业务人员提供数据可视化展示分析服务的独立产品。旨在为企业客户提供一个数据化运营的内部支撑平台,为数据分析展示的各种参与者提供友好易用的服务,解放数据可视化系统的开发人力,帮助企业实现“数尽其用、人尽其才”的运营目标和挖掘数据潜在的价值。提供界面优美、体验良好的交互设计,通过拖拽图表组件可实现 10 分钟搭建数据可视化页面,并对数据进行快速的分析。
2023-02-16 14:57:00
1660
1
原创 【零代码(低代码)工作流引擎(cube-flowable)】
cube-flowable工作流引擎旨在打造一套零代码、领先、且快速实用的引擎工具,助力开发者在面对工作流开发任务时,除去学习工作流框架知识和API的学习成本且不去关心工作流是什么技术,无需了解学习,安装使用cube-flowable工作流引擎并应用落地。此工作流引擎是零代码或低代码的工作流引擎,安装配置开箱即可使用,完全适用于中国国情的工作流引擎。
2023-02-16 14:52:22
2039
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人