- 博客(398)
- 资源 (116)
- 收藏
- 关注
原创 推理增强生成ReAG,让RAG效果更上一层楼
角色和目标你是一个智能知识检索助手。你的任务是分析提供的文档或网址,为用户查询提取最相关的信息。# 指令1. 仔细分析用户的查询,确定关键概念和要求。2. 在提供的来源中搜索相关信息,并在“content”字段中输出相关部分。3. 如果你在文档中找不到必要的信息,返回“isIrrelevant: true”,否则返回“isIrrelevant: false”。# 约束- 不要超出可用数据进行假设- 明确指出是否未找到相关信息- 在选择来源时保持客观"""
2025-04-11 08:30:00
801
原创 5个Python数据可视化技巧,绘制更漂亮的数据图
大家好,在数据驱动决策的时代,数据可视化是挖掘数据价值的重要一环。本文将介绍五种极为实用的高级可视化图表,从原理到代码实现,一站式助力绘制数据图。
2025-04-11 08:00:00
655
原创 轻松实现推理智能体,基于Smolagents框架和DeepSeek-R1
大家好,现在 AI 智能体在处理复杂推理任务上越来越强大,本文将介绍一个实用的技术组合。Smolagents,Hugging Face 开发的轻量级框架,能让大语言模型(LLMs)与现实数据处理无缝对接。DeepSeek-R1 是开源大语言模型里的 “性价比担当”,用 Ollama 部署到本地,运行效率超高。下面就详细教大家如何借助这二者,结合网页抓取和数据导出工具,搭建超厉害的推理智能体。
2025-04-10 10:42:25
735
原创 DeepSeek R1与Qwen大模型,构建Agentic RAG全攻略
在智能体系统里,推理模型是 “心脏”。DeepSeek-R1 作为强大的推理模型,能够处理复杂查询。它可解析自然语言,结合知识库给出连贯且切题的回答,还能理解文档并提取关键知识。将 DeepSeek-R1 和知识库融合,系统便能依据向量数据库内容解决问题、回应查询以及推理。推理时,DeepSeek-R1 支持多步迭代,不断优化回复,直至得到满意答案,或达到预设的max_steps限制,以此确保推理准确又高效,推动智能体系统稳定运行。import os# 定义本地模型名称。
2025-04-10 10:15:08
711
原创 本地部署Deepseek R1,并利用本地知识库创建RAG
定义两个后处理器,根据索引创建查询引擎,并使用指定的相似度阈值和重新排序设置。返回配置好的查询引擎。
2025-04-09 11:40:06
611
原创 满足个性化需求,微调DeepSeek大模型
监督微调(SFT)是在有标签的数据集上对预训练模型进行进一步训练的过程,使其能够专门用于特定任务,如客户支持、医疗问答或电商推荐。
2025-04-09 11:30:50
499
原创 详解模型蒸馏,破解DeepSeek性能谜题
在基于模型蒸馏的示例项目构建中,定义并训练教师模型是关键的环节。这里,构建一个多层卷积神经网络(CNN)作为教师模型。# 教师模型keras.layers.Dense(10) # 不使用softmax,输出原始logits用于蒸馏])需要注意的是,模型最后一层设置了 10 个单元,对应 0 - 9 这 10 个数字,但未采用 softmax 激活函数,而是输出原始的 logits。
2025-04-08 16:14:49
782
原创 一文剖析Microsoft AutoGen,跑通多智能体AI框架
AutoGen 是开发者的得力助手,能帮助开发者创建智能体,使其相互协作完成复杂任务。该框架支持多智能体的编排与异步通信,还可与最先进的大型语言模型(LLM)无缝整合,并且提供了高效执行任务、调试代码以及实现智能体实时交互的工具,相当不错。多智能体系统:多个 AI 智能体协作达成共同目标。人在回路:在敏感或复杂任务中,支持人类监督和交互。代码执行:在沙箱环境中安全执行动态代码。可扩展性:适用于本地测试和分布式云部署。
2025-04-08 15:46:57
789
原创 文档处理利器Docling,基于LangChain打造RAG应用
大家好,人工智能应用持续发展,对文档信息的有效处理、理解与检索提出了更高要求。大语言模型虽已在诸多领域发挥重要作用,但在文档处理方面仍有提升空间。本文将详细阐述如何整合Docling 和 LangChain,创建检索增强生成(RAG)系统,以突破局限,为大语言模型赋能,提升其处理文档信息的能力。
2025-04-04 18:00:00
851
原创 阿里通义发布QVQ-72B,跑通最强视觉推理大模型
大家好,阿里巴巴Qwen团队开发的QVQ-72B,是一个拥有720亿参数的视觉推理AI模型,让本地电脑部署高效多模态推理能力变得触手可及。这款模型采用开放的Apache 2.0许可证,为AI爱好者、开发者以及注重数据隐私的企业提供了新的选择。
2025-04-04 10:00:00
759
原创 详解AI采集框架Crawl4AI,打造智能网络爬虫
大家好,Crawl4AI作为开源Python库,专门用来简化网页爬取和数据提取的工作。它不仅功能强大、灵活,而且全异步的设计让处理速度更快,稳定性更好。无论是构建AI项目还是提升语言模型的性能,Crawl4AI都能帮您简化工作流程。它可以直接在Python项目中使用,或者将其集成到REST API中,实现快速、稳定的数据爬取和处理。这样,无论是数据的实时获取还是后续的分析处理,都能更加得心应手。
2025-04-03 09:17:01
1296
1
原创 解锁Agentic RAG,使用LangChain和OpenAI进行实践
Agentic RAG是由智能体驱动的技术,能够灵活处理多文档问答任务。这项技术不仅能比较文档、总结内容,还能对多个摘要进行对比分析。正因如此,我们不完全依赖于大型语言模型,而是通过智能体来承担那些需要深思熟虑、逻辑推理、工具运用以及持续学习的任务。Agentic RAG通过智能化手段,提高了解决复杂问题的能力,让问答更加高效和精确。
2025-04-03 08:16:41
736
原创 开源大模型新王者Llama 3.3 70B,用Ollama跑起来
大家好,Meta公司新近推出的Llama 3.3 70B模型,为大型语言模型带来了新突破。这款模型不仅支持多语言,性能强劲,而且具备成本效益,有望彻底改变企业和科研人员利用AI的方式。本文带大家深入解析Llama 3.3 70B。
2024-12-10 23:50:49
2110
1
原创 Python pandas离散化方法优化与应用实例
用户可以通过指定bins# 自定义区间print("自定义区间离散化后的DataFrame:\n", df)通过这种方式,可以灵活定义区间边界。
2024-12-10 23:37:01
1093
原创 Python数据清洗之重复数据处理
可以通过设置keep参数为last# 保留最后一条记录print("保留最后一条重复记录后的数据:\n", df_last)# 保留每个UserID的最新注册记录print("清洗后的用户注册数据:\n", user_df_cleaned)
2024-12-09 22:40:05
1019
原创 用Python pandas实现函数链数据处理
Pandas中的pipe方法允许用户将一个函数应用到数据对象上,并返回处理后的结果。pipe方法的最大优势是使多个数据处理步骤以链式方式书写,而不需要嵌套或创建中间变量。使用pipe的典型场景包括:按步骤构建数据处理流程。提高代码可读性,减少嵌套。在处理过程中传递额外参数。以下是pipe# 示例函数return df# 示例数据# 使用pipe方法A B0 1 101 2 102 3 10通过pipe方法,数据对象df被传递到自定义函数add_column。
2024-12-09 01:49:15
418
原创 利用Milvus向量数据库实现GraphRAG
大家好,GraphRAG技术借助知识图谱,给RAG应用注入了新的动力,使其能够在海量数据中精确检索所需信息。本文将介绍GraphRAG的实现方法,包括如何创建索引以及如何利用Milvus向量数据库进行查询,助力在信息检索的道路上事半功倍。通过一个分支仓库来安装GraphRAG,这是因为Milvus的存储功能在本文编写时还未被官方正式合并。
2024-12-03 20:59:02
1502
原创 Python实现8个概率分布公式及可视化
大家好,概率和统计知识是数据科学和机器学习的核心,我们需要统计和概率知识来有效地收集、审查、分析数据。现实世界中有几个现象实例被认为是统计性质的(即天气数据、销售数据、财务数据等)。这意味着在某些情况下,我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然。了解数据的分布有助于更好地模拟周围的世界,它可以帮助我们确定各种结果的可能性,或估计事件的可变性,这使得概率分布在数据科学和机器学习中非常有价值。
2024-12-03 15:34:30
862
原创 Python中的melt和pivot轻松实现DataFrame格式转换
大家好,在数据处理与分析中,经常遇到数据需要进行格式转换的情况,例如将数据从宽表格式转换为长表格式,或将数据重新分组汇总。Pandas提供了丰富的reshape操作,尤其是melt和pivot这两个函数,使得DataFrame可以在宽表与长表之间高效转换。通过合理使用melt和pivot,可以在数据清洗、特征工程等环节中极大地提升工作效率。
2024-12-02 21:15:47
801
原创 机器学习中的数据预处理:从原始数据到模型输入
使用`pandas`的`get_dummies`函数:。在机器学习的工作流程中,数据预处理是一个不可或缺的环节。在进行数据预处理之前,需要了解数据的结构,使用`data.info()`可以快速查看数据的列名、数据类型和缺失值数量。标签编码将每个类别映射到一个唯一的整数,可以使用sklearn中的LabelEncoder:。目标编码是根据目标变量的均值对类别特征进行编码,通常用于具有大量类别的特征。如果缺失值的比例较小,可以考虑删除包含缺失值的行:。
2024-12-01 22:06:02
960
原创 深入浅出机器学习中的梯度下降算法
大家好,在机器学习中,梯度下降算法(Gradient Descent)是一个重要的概念。它是一种优化算法,用于最小化目标函数,通常是损失函数。梯度下降可以帮助找到一个模型最优的参数,使得模型的预测更加准确,本文将介绍梯度下降算法的原理、公式以及在Python中实现这一算法。
2024-12-01 21:47:08
515
原创 机器学习树模型中超参数优化方法
大家好,在机器学习的树模型(如决策树、随机森林、梯度提升树等)应用中,模型性能很大程度上取决于参数的合理设置。合适的参数能让模型更好拟合数据、提升预测准确性并避免过拟合等问题,本文将对超参数优化方法进行介绍。
2024-11-30 23:03:19
1234
原创 本地部署Qwen2.5-Coder大模型,打造专属编程助手
Qwen2.5-Coder的推出,标志着智能代码语言模型进入了新的时代。这款模型具有高效性能和实用价值,不仅能够深入理解复杂的代码结构,还能提供精确的代码补全和错误检测,极大提升开发效率。本文详细介绍如何在本地系统上部署Qwen2.5-Coder,以及其与Ollama的集成方案,希望为开发者带来更流畅的开发体验。
2024-11-29 23:59:49
1616
原创 Python时间序列优化之道滑动与累积窗口的应用技巧
在Pandas中,滑动窗口和累积窗口是处理数据流时常用的两种窗口模型,它们在时间序列分析、事件处理、流处理等领域中非常重要。滑动窗口是一种动态窗口模型,它在时间轴上滑动以覆盖连续的数据段。窗口的大小是固定的,但随着时间的推移,窗口会沿着数据流向前移动。这种窗口模型允许数据的连续处理,窗口内的数据可以是重叠的。累积窗口是一种非重叠的窗口模型,每个窗口包含不重叠的数据段。当窗口内的数据被处理完毕后,窗口会向前移动到下一个数据段,开始处理新的数据。2.rollingrolling# 自定义滑动计算函数。
2024-11-29 23:58:18
1213
原创 逻辑回归等分类模型的5大评估指标
本文将给大家介绍逻辑回归模型的评估指标,包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1 Score)以及ROC-AUC曲线。AUC值越接近1,模型的表现越好。精确率关注的是当模型预测一个样本为正时,它有多大的概率是真的正例。F1分数在精确率和召回率之间取得了平衡,适用于不平衡数据集或者当你希望同时优化精确率和召回率的场景。召回率衡量的是所有真实为正例的样本中,模型正确识别出来的比例。精确率衡量的是在所有被预测为正例的样本中,真实为正例的比例。
2024-11-24 23:58:02
839
原创 深度学习使用LSTM实现时间序列预测
导入PyTorch及其相关模块,使用PyTorch构建LSTM模型,创建一个继承自的类,并在其中定义LSTM层和其他必要的层。在模型类的构造函数中初始化LSTM层和其他层,定义模型如何根据输入数据进行前向传播。return out# 定义超参数input_size = 3 # 特征数:温度、湿度、风速。
2024-11-24 00:43:27
2997
1
原创 深入理解机器学习中的欠拟合与过拟合
大家好,在机器学习中构建一个能够很好泛化的模型至关重要,我们希望模型不仅能在训练数据上表现优秀,还能在未见过的测试数据上取得相似的结果。过拟合发生在模型过于复杂,甚至学到了训练数据中的噪声和细节,导致在训练集上表现极好,但在测试集上效果不好,这种模型在新数据上的泛化能力较差。如果发现模型过拟合,则可以选择降低模型的复杂度。在数学上,方差高的模型在训练数据上的拟合效果会非常好,但在未见过的数据上预测不准确,失去了泛化能力。第三张图表示过拟合:模型使用了非常高阶的多项式,拟合了每一个数据点,包括数据中的噪声。
2024-11-23 20:00:00
1178
原创 项目实战:基于深度学习的人脸表情识别系统设计与实现
大家好,人脸表情识别是计算机视觉领域中的一个重要研究方向,它涉及到对人类情感状态的理解和分析。随着深度学习技术的发展,基于深度学习的人脸表情识别系统因其高精度和强大的特征学习能力而受到广泛关注。本文旨在探讨基于深度学习的人脸表情识别系统的设计与实现,从数据处理、模型训练等多个方面进行全面分析。
2024-11-23 11:30:00
1862
原创 从普通RAG到RAPTOR,10个最新的RAG框架
大家好,大型语言模型(LLMs)如GPT-4在自然语言处理(NLP)领域有着重要作用,擅长生成文本、回答问题等任务。但这些模型也存在一些短板,比如对最新信息的掌握不足、难以实时更新知识库以及在处理大量信息时效率不高。为了解决这些问题,检索增强生成(RAG)技术应运而生,它通过整合外部数据源,提升了模型的响应质量和适用性。今天将介绍10种改进版的RAG技术,它们在检索和生成环节上各有侧重,覆盖了从通用到特定问题的解决方案,能够体现出RAG在促进自然语言处理(NLP)进步中的多样性和巨大潜力。
2024-11-22 20:02:51
1247
原创 微调YOLO做车辆、人员、交通标志检测
在road_detection_model/road_detection_model文件夹中打开train.py文件,要执行连续预训练,取消注释标记为“Pre-training stage”的块,并注释掉标记为“Fine-tuning stage”的块。使用time参数,你可以为训练设置特定时长。可以在road_detection_model/road_detection_model/runs/detect/val2目录中找到所有验证指标的已训练模型,混淆矩阵显示模型对每种物体类型的分类准确性。
2024-11-22 02:35:36
1604
原创 使用Cursor和Claude AI打造你的第一个App
Cursor是一款人工智能代码编辑器,基于Visual Studio Code开发,具备无缝集成的AI功能。它支持多种人工智能模型,能够与OpenAI、Anthropic、Google和Azure等主流平台实现集成。在实际使用中,Cursor与Claude 3.5模型的配合效果尤为理想,这一模型被成功应用于应用程序的开发过程中。
2024-11-20 21:11:21
3668
原创 GraphRAG竞争对手来了,跑通LightRAG
LightRAG是个精炼的RAG框架,专门用于通过检索关键知识片段来构建响应,并且整合了知识图谱和嵌入技术。与那些将文档简单拆分成独立片段的传统RAG系统不同,LightRAG进一步深化了这一过程——创建了实体与实体之间的关系对,将文本中的概念紧密联系起来。与微软的GraphRAG相比,两者有相似之处,但LightRAG在速度和成本上更具优势,并且支持对图谱进行增量更新,无需每次都重新生成整个图谱。
2024-11-20 18:00:00
1870
原创 10个Python开发者必备的SQL小技巧
大家好,在使用Python处理数据时,可能遇到过需要与数据库交互的情况,SQL(结构化查询语言)是管理和查询数据库的强大工具。本文将介绍10个为Python程序员量身定制的SQL技巧,为每个技巧提供代码片段和解释,帮助大家充分发挥SQL在Python项目中的潜力。
2024-11-19 01:35:27
348
原创 一文盘点YOLOv1-v11全系列模型
大家好,YOLO(You Only Look Once)系列模型是一类非常高效的目标检测模型。其主要特点是能够在单次前向传播中同时进行目标的定位和分类,实现实时的目标检测。YOLO 系列模型从最初的 YOLOv1 到 YOLOv10,经过了多次迭代和改进,逐渐提高了检测的精度和速度。近期,ultralytics 团队再次更新,YOLOv11速度更快、更准确。
2024-11-17 16:32:41
1836
原创 5个数据科学中不可不知的数据结构
大家好,Python是一种多功能的编程语言,由于其丰富的数据结构,广泛应用于数据科学领域,这些数据结构在有效组织和处理数据方面发挥着至关重要的作用。本文将介绍每个数据工作者都应该了解的五种重要Python数据结构,理解这些数据结构能够帮助大家高效地处理、分析和加工数据科学项目中的数据。
2024-11-17 15:16:53
290
原创 Python数据分析:分组转换transform方法
transform不仅支持常规的聚合函数,还支持自定义函数。假设计算每位员工的薪资与部门平均薪资的差异,可以使用自定义函数实现。# 自定义函数计算薪资与部门平均薪资的差异df['薪资差异'] = df.groupby('部门')['薪资'].transform(lambda x: x - x.mean())print("薪资差异:\n", df)姓名 部门 薪资 部门平均薪资 薪资差异0 Alice 销售 7000 6900.0 100.01 Bob 销售 6800 6900.0 -100.0。
2024-11-16 22:08:45
1235
原创 实现多智能体,OpenAI Swarm对比CrewAI
大家好,在不远的将来人工智能可能会在团队工作中不可或缺,其能够与人类无缝协作,共同决策,分享知识。这一愿景正在由OpenAI的Swarm AI和CrewAI两大创新理念逐步变为现实。本文将介绍这两项技术将如何塑造未来的工作方式,及其在行业内的竞争态势。
2024-11-16 22:02:28
1002
原创 Pandas数据透视表:交叉分析与聚合计算
数据透视表是一种汇总数据的表格形式,允许基于多个维度对数据进行分组、聚合。它可以将大数据集中的行列信息重组并汇总,以揭示更有价值的分析结果。在Pandas中,数据透视表使用函数实现,支持对数据进行灵活的统计和聚合。数据透视表的结构:行索引(index):作为数据透视表的行标签。列索引(columns):作为数据透视表的列标签。值(values):用于填充透视表的汇总数据。聚合函数(aggfunc):用于汇总数据的计算方式,例如求和、计数、平均值等。
2024-11-15 23:31:05
1088
原创 使用LangGraph开发太阳能节能计算智能体
LangGraph是LangChain的高级库,为大型语言模型(LLM)带来循环计算能力。它超越了LangChain的线性工作流,通过循环支持复杂的任务处理。状态:维护计算过程中的上下文,实现基于累积数据的动态决策。节点:代表计算步骤,执行特定任务,可定制以适应不同工作流。边:连接节点,定义计算流程,支持条件逻辑,实现复杂工作流。LangGraph简化了AI开发,自动管理状态,保持上下文,使AI能智能响应变化。它让开发者专注于创新,而非技术细节,同时确保应用程序的高性能和可靠性。
2024-11-15 20:59:32
1187
原创 Python数据分析实战:日常工作必备可视化图表
大家好,数据分析是利用数学、统计学与实践相结合的科学统计分析方法,对excel数据、数据库中的数据、收集大量数据、网页抓取的数据进行分析,从中提取有价值的信息并形成结论进行展示的过程。本文将介绍数据分析常用可视化方法,并通过示例展示如何使用Python进行数据探索。
2024-11-14 16:50:44
1099
基于LightGBM的二手手机价格预测
2025-04-11
基于Django+Vue3的后台管理系统(前后端分离)
2025-04-11
基于Milvus+ResNet的工业异常检测系统
2025-04-11
基于Springboot+Vue+Python的水质管理预测系统
2025-04-11
基于OpenCV和百度AI的车牌识别系统
2025-04-11
基于Django毕业设计选题管理系统源码
2025-04-11
基于Django服装仓库进销存库存管理系统源码
2025-04-11
Python计算机课程设计项目:基于改进UNet和GAN的图像修复系统
2025-04-10
基于深度学习的视频运动目标检测系统
2025-04-10
基于Vue与Paddle的乒乓球检测分析系统
2025-04-10
基于Flask开发的大学综合测评系统源码
2025-04-10
基于YOLOv8的目标检测系统源码(图像+视频)
2025-04-10
基于django+sqlite3的任务待办管理系统
2025-04-08
基于Spark的招聘数据分析推荐系统(csv数据+源码)
2025-04-08
Python分布式集群化期货多账户管理系统源码
2025-04-08
Python毕业设计:基于百度飞桨的车流检测系统源码
2025-04-08
基于YOLOv5模型的道路目标检测计数项目源码
2025-04-05
YOLO和VOC格式数据集转换脚本(Python代码)
2025-04-05
Python基于Scrapy兼职招聘网站爬虫数据分析设计源码
2025-04-03
基于Python的二手车爬虫数据可视化分析设计(毕业设计源码)
2025-04-03
基于YOLO+Pyqt5的智能施工安全监测系统源码
2025-04-03
基于YOLOv8的深度学习课堂行为检测系统源码(含检测图片和视频)
2025-04-03
基于YOLOv11实现疲劳驾驶检测源码
2025-04-03
基于YOLOv11模型与LPRNet实现车牌识别源码
2025-04-03
基于YOLO算法的实时跌倒检测系统源码
2025-04-03
基于Python+flask的航空发动机实验数据管理系统
2024-12-12
Python深度学习模型实现微博话题情感分析及可视化源码
2024-12-12
Python模式识别实现手写图像识别大作业源码
2024-12-10
基于streamlit实现的物流分析平台源码
2024-12-10
Python生物多样性和气候变化数据分析及可视化源码(计算机设计大赛题目)
2024-12-10
使用LSTM和Transformer模型进行时序预测源码
2024-12-09
基于YOLOv5与OpenCV的疲劳驾驶状态预测
2024-12-09
基于Python与PyQt6实现的本地音乐播放器源码
2024-12-09
基于WEB的学生个性化分析虚拟仿真平台
2024-12-09
基于YOLOv8模型的书籍实时识别和成色状态预测源码
2024-12-09
Python食堂窗口数据库管理系统源码
2024-12-03
Python轴承故障诊断检测算法源码
2024-12-03
基地设备的故障预测与健康管理系统源码
2024-12-03
Python轴承故障诊断域自适应模型源码
2024-12-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人