自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 LangChain+HuggingFace高效实现企业RAG

本文介绍了基于LangChain框架构建Word文档RAG系统的实现方案。系统采用Docx2txtLoader加载文档,使用本地HuggingFace嵌入模型进行文本处理,并集成阿里云通义千问模型作为LLM核心。通过Chroma向量数据库实现文档检索,构建了完整的RAG问答链。

2025-10-28 14:41:04 122

原创 采用分环境协作模式安装Poppler和Tesseract OCR工具

摘要:针对PDF文档处理中poppler和tesseract因共享库冲突导致安装失败的问题,提出分环境安装方案:通过conda安装poppler(使用清华镜像源),而在Windows系统直接安装tesseract可执行文件。安装后需验证工具可用性,并注意将tesseract路径加入系统环境变量。文中还对比了清华PyPI和Anaconda镜像的适用场景,前者适用于纯Python包,后者支持含非Python组件的多语言包。该方案有效解决了OCR工具链的安装冲突问题。

2025-10-12 10:46:39 289

原创 基于ReAct模式增强的几种大模型及外部工具调用策略

大模型工具调用策略:ReAct模式通过“思考-行动”循环确保回答准确性;Self-Ask采用两段式分解复杂问题;Plan-and-Execute先规划后执行降低调用成本;Reflection通过反思评估答案可信度;Toolformer将工具调用内化到推理过程。不同策略适用于简单任务、复杂多步、成本敏感和高频固定等场景,可根据需求选择最优方案。

2025-10-10 23:02:03 579

原创 AI大模型应用开发中使用HuggingFace进行Embedding的方案

摘要:本文介绍三种在国内使用HuggingFace Embedding的方案。方案一通过镜像网站使用Langchain调用API,需单独安装langchain-huggingface包;方案二将模型下载到本地后加载,推荐使用snapshot_download()从镜像站下载;方案三为前两种方案的结合。文中详细说明了各方案的安装配置步骤,并推荐了常用Embedding模型,包括多语言、英文及中文优化模型。本地化方案特别适合企业私有化部署,确保在无网络环境下仍可使用。(150字)

2025-10-09 21:29:46 605

原创 OPENSSL解决客户端浏览器无法访问Streamlit应用的问题

本文介绍了解决局域网内访问Streamlit应用被浏览器阻止的方法:1. 通过OpenSSL配置HTTPS:a) 生成私钥和证书签名请求 b) 创建自签名证书 c) 在Streamlit配置文件中添加证书路径 d) 重启应用并手动信任证书。2. 检查Windows防火墙配置:在防火墙高级设置中为Streamlit的8501端口添加入站规则。文章还提到可能需要将自签名证书安装到客户端设备的受信任根证书机构,并建议使用mkcert或XCA等工具简化证书生成过程。

2025-10-06 08:47:20 604

原创 基于全阿里RAG技术栈,实现企业内部PDF格式规章制度内容的查询

本文介绍了一个基于阿里云技术栈的企业规章制度查询系统实现方案。系统采用PyPDF2提取PDF文档内容并进行切分,使用阿里云text-embedding-v1工具生成文本向量,通过Chroma_DB向量数据库存储和检索文档。系统核心功能包括:PDF内容提取与分段、远程Embedding处理、向量数据库存储、相似内容检索,以及调用Qwen-max大模型生成回答。该方案实现了对企业规章制度的智能问答功能,支持自然语言查询,并能准确返回PDF文档中的相关内容。系统设计考虑了数据分批处理、异常处理等细节,为企业员工查

2025-10-03 23:45:17 1087 2

原创 VScode中配置Anaconda下创建的Python虚拟环境指南

摘要:在VSCode中使用Anaconda虚拟环境的方法:1)通过命令面板(ctrl+shift+p)选择"Python:Select Interpreter";2)选择Anaconda中配置的虚拟环境解释器(如myenv);3)系统会自动激活所选环境运行代码。若未预先激活环境,VSCode会调用conda自动处理。

2025-10-03 12:24:39 179

原创 基于Qwen大模型,采用“ReAct“模式(Reason + Act)完成天气调用Function Calling

print(f"❌ 地名查询失败: {data.get('info')} (infocode: {data.get('infocode')})")f"风力:{w['windpower']}级,湿度:{w['humidity']}%,"return {"status": "error", "msg": data.get("info", "天气查询失败")}"content": f"城市:{w['city']},天气:{w['weather']},"f"更新时间:{w['report_time']}",

2025-09-30 21:25:43 868

原创 基于python的量化投资(三) ---- 如何写自己的量化策略

编写量化投资策略,需要用到macd、jdk等常用技术指标。Python提供了TA_Lib的扩展模块,非常方便进行技术指标的计算,要使用这些功能,首先安装TA_Lib模块。TA_Lib模块需下载安装,根据安装的python的版本和开发环境,下载完成后用pip install **命令安装即可,安装完成后会显示“Successfully installed TA-Lib-0.4.17”。程序中使用的时...

2025-09-30 20:52:49 100

原创 基于python的量化投资(二) ---- 获取量化数据

进行量化投资最基础的工作,就是获取量化的基础数据。有了基础数据,才能对数据进行加工处理,构建量化策略,进行量化分析,回测和回溯。基于python进行量化投资的开发,获取数据的方式比较丰富,主要介绍以下三种,并给出相应代码:1、从财经网站获取数据。pandas提供了从财经网站获取数据的接口,该接口目前在pandas的pandas_datareader模块中,独立于pandas模块,需要单独安...

2020-04-12 11:21:10 1804

原创 基于python的量化投资(一) ---- 开发环境的搭建

搭建基于Python的量化开发环境,首先安装anaconda,anaconda是一个开源的python包管理器,是一个可对python开发组件进行综合管理的有效平台。anaconda中本身包含了python的内核,安装完anaconda后,就自带了python。anaconda本身还自带了强大的科学计算包,包括numpy,pandas等。关于anaconda的安装,文章比较多了,就不再赘述。ana...

2020-04-12 11:20:36 908

原创 超越自我

人最大的障碍是自我,成功最大的阻力来自自我。突破自我,实现自我。

2009-06-29 16:10:00 305

原创 历史该怎么记载C#

十年前,指针被推崇为C编程的利剑;而今天,C#摒弃了指针。十年前,大家都讲究要做最底层的程序,C中嵌套汇编;而今天,C#让程序员不要关心底层的执行。

2009-06-08 14:09:00 293

SplitPanel的使用

java swing SplitPanel应用实例,在myEclips下直接可编译运行。

2013-08-17

TabbedPane使用实例

java界面开发技术swing的TabbedPane组件的使用实例,在myEclips下可直接编译运行。

2013-08-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除