- 博客(116)
- 收藏
- 关注
原创 Qwen智能体qwen_agent与Assistant功能初探
优点:模块化架构支持灵活扩展,集成多工具链(搜索/代码/文档处理),具备复杂任务分解和动态学习能力,企业级场景适配性强,支持多模态交互。缺点:工具配置复杂度较高,长任务处理效率依赖模型性能,定制开发需技术基础,实时性较专用系统稍弱。同类产品OpenAI的Assistant API(功能相似但更封闭)LangChain(更开发者导向但集成度低)Microsoft Copilot Studio(企业集成强但灵活性弱)发展动向。
2025-05-09 12:32:03
1055
原创 LangChain中不同Agent类型使用实操
特点:零样本学习,不保留历史适用场景:单轮任务,不需要上下文记忆,但实际经过对memory的配置和prompt配合,也能实现上下文记忆。示例程序总结:注意定义agent = ZeroShotAgent,需要定义llm_chain,prompt和tools这几个参数。完整示例,可成功执行import os# 1. 定义一个简单的加法计算器工具"""简单的加法计算器"""try:# 移除所有空格和引号# 分割数字# 转换为整数并求和str。
2025-05-07 01:08:37
933
原创 使用LangChain连接远程Oracle数据库尝试LLM 提供的SQL智能助理
为完成此次数据库连接实验,笔者用自己的笔记本电脑搭建了一台linux虚机,安装了oracle 23C,并借助deepseek创建了若干与电商业务有关的表并插入了一些记录。接着在windows实体机端(作为oracle的客户端)配通了sqlplus连接,然后开始用jupyter调试python调用langchain连接远程oracle的不同方法。要通过LangChain的。
2025-04-29 11:23:46
627
原创 微软GraphRAG的安装和在RAG中的使用体会
Microsoft的GraphRAG是一种结合了知识图谱(Knowledge Graph)和检索增强生成(RAG)技术的先进框架,旨在提升大型语言模型(LLM)在处理复杂问题时的性能。。
2025-04-27 21:29:44
1143
原创 LangChain 中主流的 RAG 实现方式
支持图片、表格等非文本数据,需结合 OCR(如 Tesseract)和专用解析器(如 DeepDoc)。:文档需预先处理好分块 ,该方法的result是字符串,没有metadata信息。:封装文档加载→分块→向量化→存储→检索全流程,适合快速原型开发。:通过设计模板控制生成风格,强制 LLM 基于上下文回答,减少幻觉。:结合语义搜索(向量相似度)与关键词检索(BM25),提升召回率。:通过迭代检索优化结果,例如先检索大纲再定位细节。:提取检索文档中的关键片段,减少无关信息输入。
2025-04-25 10:00:51
1210
原创 LangChain for Python: 基本使用场景与实现的实践
# 6. 创建prompttemplate = """根据以下上下文信息回答问题:{context}问题:{question}回答:请用中文简洁回答,若不知道答案请如实说明。"""input_variables=["context", "question"], # 必须包含这两个变量# 7. 创建问答链llm=llm,retriever=db.as_retriever(search_kwargs={"k": 3}), # # 控制返回的文档数量为3。
2025-04-23 15:50:38
921
原创 通过高斯分布概率密度函数寻找到数据中的异常点
通过计算数据各维度对应的高斯分布概率密度函数,可用于寻找到数据中的异常点。,可调整异常点检测的灵敏度。通过修改概率密度阈值。
2025-04-16 17:53:09
500
原创 LLM中的N-Gram、TF-IDF和Word embedding
特性N-GramTF-IDF主要用途预测下一个词/生成文本评估词语重要性/文档特征提取核心思想词语出现的概率依赖前几个词重要=在本文档多见+在其它文档少见典型应用输入法、机器翻译、拼写检查搜索引擎、文本分类、关键词提取优势保持语言连贯性识别文档关键主题词局限长距离依赖差、需要大量训练数据忽略词语顺序和语义关系两者常结合使用,比如先用TF-IDF提取重要词,再用N-Gram分析这些词的关系。Word Embedding 就是让计算机通过数字"理解"词语。
2025-04-15 14:38:17
1183
原创 scikit-learn 开源框架在机器学习中的应用
用于自己复习,好记性不如懒笔头基于NumPy/SciPy构建的算法实现统一的API设计(fit/predict/transform)完善的文档和社区支持BSD开源协议(可商用)
2025-04-13 18:00:42
1171
原创 case客户续保预测中用到的特征工程、回归分析和决策树分析的总结
定义:通过建立自变量(X)与因变量(Y)之间的数学模型,预测连续型数值应用场景:房价预测、销量预估、温度预测等。
2025-04-13 11:21:13
979
原创 用Cursor AI编程工具完成case客户续保预测
policy_test.xlsx 是一个包含200条记录的测试集,包含16个字段,缺少renewal字段,这正是我们需要预测的目标变量。policy_data.xlsx 是一个包含1000条记录的完整数据集,包含17个字段,其中包括了目标变量renewal(是否续保)。我们将创建一个新的Python脚本来进行EDA分析,并生成可视化图表。最后,我建议采用模型融合的方法,将多个模型的预测结果进行加权组合,以获得更稳定的预测效果。您是否需要我对某些具体的发现进行更深入的分析,或者帮您制定更详细的营销策略建议?
2025-04-11 12:39:29
1135
原创 在Auto DL的租用服务器上跑通ModelScope下载的7B大模型的调用
这次把AI培训实验中如何在Auto DL的租用服务器上跑通ModelScope下载的7B大模型的调用的过程记录一下。
2025-04-06 08:10:10
437
原创 如何在windows 环境、且没有显卡的情况下用python跑通从ModelScope下载的大模型的调用
在上AI训练营的课程时,老师提供了一段源码,目的是实现从modelscope下载DeepSeek-R1-Distill-Qwen-7B,并通过程序调用大模型,让大模型帮助生成二分查找法。老师建议在网上租一台有GPU的电脑,推荐如下。最终本人在自己的surface电脑上(Windows,无GPU)调通了该程序,并实现了功能。我的电脑配置如下,由于本人用的surface 没有GPU卡,CPU 也不强劲,内存也不大。
2025-04-04 15:32:36
1107
原创 Python 一等函数介绍
模式技术要点典型应用场景函数赋值对象引用机制策略切换、插件系统闭包工厂作用域链保持状态配置化功能生成高阶函数链式处理生成器表达式+惰性计算大数据处理、ETL流程动态回调匿名函数+延迟执行事件驱动架构所有示例均体现了一等函数的四个核心特征:变量赋值、参数传递、返回值存储、数据结构存储。理解这些模式有助于构建更灵活、可维护的Python应用程序。
2025-04-01 14:53:51
752
原创 Python函数参数类型及使用要点
简单函数优先使用位置参数和关键字参数配置类参数适合设为默认参数(如端口号、超时时间)不确定参数数量时使用*args**kwargs强制明确参数含义时使用命名关键字参数避免参数过多(超过5个建议用类或字典封装)提高代码可读性、灵活性和维护性。建议结合类型注解(如)进一步提升代码质量。
2025-04-01 11:33:10
473
原创 Python中的文件目录、包、模块、文件关系与函数调用详解
层级关系:文件(.py)→ 模块 → 包(目录 +)→ 函数/类。调用规则优先使用绝对导入保证路径清晰。同一包内可使用相对导入简化路径。冲突避免通过包和子包隔离同名模块。使用全限定名或别名区分同名函数。
2025-04-01 11:01:23
866
原创 Python 中列表(List)、元组(Tuple)、集合(Set)和字典(Dict)四大数据结构的完整对比
以下是 Python 中列表(List)、元组(Tuple)、集合(Set)和字典(Dict)四大数据结构的完整对比分析,结合了核心特性、操作方式和应用场景的深度总结:动态创建:通过 函数转换其他可迭代对象增删改查:核心特性:可变性:支持增删改操作(如 、、)有序性:元素按插入顺序存储,支持索引和切片元素类型:可包含任意数据类型(整数、字符串、列表等)适用场景:动态数据集合(如用户输入记录、日志分析)高级操作:切片、列表推导式(如 )2. 元组(Tuple)定义
2025-03-29 15:56:42
2165
原创 Python3 中 `max()` 和 `min()` 结合`Key`的灵活应用
print(max(values, key=abs)) # 输出: -20(按绝对值比较)max()和min()基础比较:支持数值、字符串、字典键的默认比较。扩展能力:通过key参数实现函数式编程,处理复杂数据结构和动态逻辑。健壮性default参数避免空迭代对象引发的错误。
2025-03-29 12:19:30
555
原创 Windows环境下AnythingLLM安装与Ollama+DeepSeek集成指南
前面已经完成了Ollama的安装并下载了deepseek大模型包,下面介绍如何与anythingLLM 集成。
2025-03-28 15:45:26
1079
原创 Python中`zip()`函数的详细介绍
用于将多个可迭代对象(如列表、元组等)的对应元素打包成元组,返回一个迭代器。若可迭代对象长度不同,以最短的为准。默认以最短的迭代对象为准,但可通过。
2025-03-28 11:14:55
297
原创 安装Ollama,本地部署deepseek
本人开始参加AI应用开发训练营,现在先把之前有关本地部署deepseek的过程review 一下。本人在自己一台surface上实现了两种本地部署方案。
2025-03-28 09:16:20
1434
原创 Python3 集合详解
集合(Set)是Python中一种的可变容器类型,其设计灵感来源于数学中的集合论,常用于高效处理去重、成员检测和集合运算等场景。
2025-03-25 19:33:32
881
原创 Python 字符串正则表达式详解
d:匹配数字(等价于[0-9]\w:匹配字母、数字、下划线(等价于\s:匹配空白字符(如空格、制表符)[ ]:自定义字符集合(如[a-z]匹配小写字母)re.findall(r"\d{3}", "ID:123") # 提取连续3位数字 → ['123']
2025-03-25 16:42:20
955
原创 最简方式安装oracle 23c free
我一直认为,最靠谱的文档就是原厂官网的文档,阅读再次加工的文档都有可能把你带偏。oracle官网提供了大量的文档,一个好的oracle使用者,应该首先是好的oracle官网阅读者。oracle数据库作为收费颇贵的商业数据库软件,其功能和支持却也是无可挑剔。新推出的oracle 23c,其配套推出的 oracle 23c free 免费版数据库,着实方便了oracle爱好者的学习和提高。而其安装之简便,也是让人啧啧称赞。
2024-04-30 21:46:04
1137
转载 软件工程之美学习笔记四十五 44 | 微软、谷歌、阿里巴巴等大厂是怎样应用软件工程的?
《软件工作之美》材料地址:https://time.geekbang.org/column/article/100716公司文化和软件开发模式谷歌:谷歌崇尚工程师文化,Google 的工程师做项目就会不紧不慢,质量优先,有统一的代码规范,严格的代码审查和严谨的自动化测试。还会频繁地重写系统Facebook:Facebook 有一种黑客精神,“Move Fast and Break Thing...
2019-06-25 15:02:57
594
转载 软件工程之美学习笔记四十四 43 | 以VS Code为例,看大型开源项目是如何应用软件工程的?
《软件工作之美》材料地址: https://time.geekbang.org/column/article/100141软件工程的核心,就是围绕软件项目开发,对开发过程的组织,对方的运用,对工具的使用。分析 VS Code 对软件工程的应用1. VS Code 的开发迭代过程VS Code 每个版本的开发周期是 4 周,每四周都会发布一个新的版本。第一周: 发布上一迭代版本(周三左右...
2019-06-25 11:43:25
570
转载 软件工程之美学习笔记四十三 42 | 反面案例:盘点那些失败的软件项目
《软件工作之美》材料地址: https://time.geekbang.org/column/article/99775项目管理协会(PMI)认为成功的项目必须满足六个条件:按时交付。成本在预算范围内。能按照当初的设计正常运行。有人使用。满足项目最初的目标。项目出资方对项目满意。WikiPedia 上也有一个网页,列出来那些损失严重的软件项目。List of failed a...
2019-06-21 17:05:12
7678
转载 软件工程之美学习笔记四十二 41 | 为什么程序员的业余项目大多都死了?
《软件工作之美》材料地址:https://time.geekbang.org/column/article/99298业余项目(也叫 Side Project)。为什么程序员的业余项目大多都死了?想法大,时间少;可以借助软件项目金三角的理论,去缩小范围,在做项目时,可以采用 MVP 的开发模式,先实现核心需求,再逐步增加功能。过于追求技术,缺少约束;应该要对你的项目制定计划,设定里程...
2019-06-21 16:43:18
346
转载 软件工程之美学习笔记四十一 40 | 最佳实践:小团队如何应用软件工程?
《软件工作之美》材料地址:https://time.geekbang.org/column/article/98985本文讨论的小团队,不是指大厂的一个小组,而是小公司或者三五个人的小开发团队)小团队在软件开发中存在的常见问题成本敏感人少活多缺少流程规范小团队如何应用软件工程?成本敏感的问题,如果这个是客观存在的,就没有太好的办法去解决,只能说我们在做一些决策、制定流程的时候,需...
2019-06-05 14:57:36
294
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人