人工智能Ai
文章平均质量分 67
人工智能Ai
程序猿John
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python深度学习之爬虫篇
本文介绍了两种使用Python爬取图书网站数据的方法。第一种方法通过自动检测"下一页"按钮实现翻页,使用requests发送请求、BeautifulSoup解析HTML,提取图书标题、价格、评分等信息,并支持设置最大爬取页数限制。第二种方法先获取总页数再进行循环爬取,同样使用requests和BeautifulSoup,包含异常处理和随机延迟。两种方法都将结果保存为CSV文件。代码示例展示了完整的爬虫实现,包括URL拼接、分页处理和数据存储功能。原创 2025-10-20 11:15:56 · 292 阅读 · 0 评论 -
python之FastApi简单应用
本文介绍了如何使用FastAPI框架搭建Python Web服务。首先说明需要Python3.6+环境并通过清华源安装FastAPI。然后展示了一个基础应用示例,包含根路径、带路径参数和查询参数的GET请求处理。接着介绍了数据模型验证功能,使用Pydantic的BaseModel定义数据格式,并演示了POST和PUT请求的处理方法。文中还提供了运行方式(uvicorn启动服务)以及代码解析,包括异步函数定义、数据模型验证机制等关键点。最后展示了数据验证失败时的错误提示格式。原创 2025-10-08 17:24:47 · 167 阅读 · 0 评论 -
RAG知识增强系统3 -检索器上下文压缩和调优
LLMChainExtractor是LangChain框架中的关键组件,通过大语言模型智能提取文本核心内容,优化信息检索效率。在未优化场景中,检索结果可能包含无关信息;优化后能精准提取关键内容(如部署指南)。针对嵌入模型的"lost in middle"问题,可通过文档重排序将高相关片段置于首尾,提升回答质量。同时支持基于相似性分数的检索过滤,并可通过元数据记录匹配分数,实现更精准的信息提取。这些技术可应用于法律合同分析、知识问答等场景,显著提升大模型处理长文本的效率和准确性。原创 2025-10-05 00:13:39 · 270 阅读 · 0 评论 -
RAG知识增强系统2 - 检索器retriever
本文介绍了两种基于LangChain的检索方法实现。2.1节展示简单检索器实现:通过TextLoader加载文本,使用OpenAIEmbeddings生成嵌入向量,存入InMemoryVectorStore并创建检索器,最终匹配"deepseek是什么?"的问题。2.2节演示查询重写技术:利用FAISS向量数据库和MultiQueryRetriever,将用户原始问题"如何让用户查询更准确?"自动重写成3个语义相近的查询,从Web文档中检索出10个相关片段。两种方法分原创 2025-09-23 17:29:46 · 338 阅读 · 0 评论 -
注册大模型api和下载ollama
本文介绍了大模型注册与私有化部署流程。首先需要在DeepSeek或OpenAI官网注册获取API Key,建议小额充值。其次讲解了使用Ollama开源软件进行本地化部署的方法,包括下载安装Ollama和DeepSeek-R1模型,并提供了运行模型的基本命令(如ollama run启动模型、ollama list查看模型、/bye退出等)。部署过程需注意硬件配置对运行速度的影响。Ollama可视为类似Apache/Nginx的模型托管容器,支持从远程仓库直接拉取开源模型。原创 2025-09-02 14:20:39 · 350 阅读 · 0 评论 -
提示词工程(1)-什么是提示词 和 类型
提示词就是让 ,用户如何把问题问好。引导大模型输出更优质的内容LangChain中的提示词(Prompts)是用户与模型交互的方式,即模型的输入。通过提示词,用户可以引导模型返回期望的内容。原创 2025-09-02 14:05:39 · 642 阅读 · 0 评论 -
docker使用和部署深化学习
Docker是一种轻量级容器技术,通过镜像封装应用及其依赖,实现跨环境一致运行。本文介绍了Docker核心概念(容器/镜像)、基础操作(拉取/运行镜像)和容器化部署流程。重点讲解了如何编写Dockerfile构建Python应用镜像,并对比了容器化部署与传统部署的差异:前者具有环境一致性高、资源占用少、部署快速等优势,后者则存在环境差异大、部署复杂等问题。通过实例演示了从构建到运行容器的完整流程,展现了Docker在应用部署中的便捷性。原创 2025-08-21 17:11:18 · 948 阅读 · 0 评论 -
RAG知识库增强系统 -检索器上下文压缩和调优
本文介绍了LangChain框架中的文档检索优化技术。首先展示了LLMChainExtractor组件如何通过语义理解从文本中提取关键信息,如法律合同条款等,并对比了优化前后的检索效果差异。其次针对"lost-in-middle"问题,演示了LongContextReorder组件如何重新排序文档片段,将相关度高的内容置于首尾位置。最后介绍了基于相似度评分的检索方法,包括如何为文档片段添加相关性评分元数据。这些技术共同提升了文档检索的精确度和效率,为构建高质量AI问答系统提供了有效解决方原创 2025-07-25 16:05:58 · 411 阅读 · 0 评论 -
Python小游戏入门--pygame的基本使用
这里绘制了游戏的框框和标题 , 最后让程序等待5秒。原创 2025-04-26 14:35:22 · 535 阅读 · 0 评论 -
python中如何使用模块
在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。使用模块有什么好处?最大的好处是大大提高了代码的可维护性。其次,编写代码不必从零开始。当一个模块编写完毕,就可以被其他地方引用。原创 2025-04-24 23:26:12 · 815 阅读 · 0 评论 -
定义python中的函数和类
需要注意的是,在Python中,变量名类似__xxx__的,也就是以双下划线开头,并且以双下划线结尾的,是特殊变量,特殊变量是可以直接访问的,不是private变量,所以,不能用__name__、__score__这样的变量名。如果要让内部属性不被外部访问,可以把属性的名称前加上两个下划线__,在Python中,实例的变量名如果以__开头,就变成了一个私有变量(private),只有内部可以访问,外部不能访问,所以,我们把Student类改一改:。在函数内部,可以调用其他函数。原创 2025-04-22 11:27:48 · 795 阅读 · 0 评论 -
Python入门安装和语法基础
如果要发布你的Python程序,实际上就是发布源代码,这一点跟C语言不同,C语言不用发布源代码,只需要把编译后的机器码(也就是你在Windows上常见的xxx.exe文件)发布出去。要从机器码反推出C代码是不可能的,所以,凡是编译型的语言,都没有这个问题,而解释型的语言,则必须把源码发布出去。转义字符\可以转义很多字符,比如\n表示换行,\t表示制表符,字符\本身也要转义,所以\\表示的字符就是\,可以在Python的交互式命令行用print()打印字符串看看。因为tuple不可变,所以代码更安全。原创 2025-04-17 14:57:18 · 922 阅读 · 0 评论
分享