- 博客(180)
- 收藏
- 关注
原创 DeepSeek实战--图像识别
本文介绍了利用多模态大模型实现数学题目识别与解答的解决方案。文章对比了传统OCR技术的局限性,详细展示了基于Dify平台和Qwen-VL模型搭建解题助手的实践步骤:1)配置API密钥;2)搭建支持图片上传的工作流;3)设计提示词模板;4)测试验证效果。同时提供了2025年主流图像识别模型的对比分析,重点推荐了Qwen-VL等开源模型。该方案能有效帮助家长辅导孩子作业,但需注意处理速度和模型选择等问题。文章还分享了"变量传递"等关键实现技巧。
2025-09-14 02:19:31
1277
原创 DeepSeek实战--传统RAG与Agentic RAG对比
摘要:本文对比了传统RAG与Agentic RAG的差异。传统RAG采用线性流程,通过单次检索和生成回答简单事实性问题,但缺乏纠错能力。Agentic RAG则引入智能体概念,具有规划、多工具调用和迭代检索能力,适用于复杂开放式任务。关键区别在于Agentic RAG具备决策能力,可动态规划路径,整合多源信息。文章通过工作流程、核心特点和适用场景的对比,指出Agentic RAG是RAG技术的进化方向,使其从工具升级为能独立处理复杂任务的智能代理。
2025-10-12 18:41:20
839
原创 DeepSeek实战--A2A
Google 发布了一个名为 Agent To Agent 的协议,A2A 是一个与 Agent 有关的协议,对于各路人马创建的 Agent,A2A 提供了一种统一的封装方式。这样一来,不同来源的 Agent 能够实现互相调用,从而打破彼此之间的隔阂,避免 Agent 成为孤立的“信息孤岛”,这对推动 Agent 之间的协同合作与生态发展很有价值。你可能会疑惑,已经有了MCP,再出一个A2A协议有必要吗?它们有什么区别、联系?用一张图,帮你解惑。
2025-10-12 17:32:21
1110
原创 DeepSeek实战--自定义工具
本文介绍了一种将HTTP接口快速集成到Dify平台的方法。通过FastAPI开发获取服务器CPU/内存信息的接口,部署后验证服务可用性。重点演示了如何在Dify平台配置自定义工具,将OpenAPI规范导入为工具Schema,并创建Agent调用该工具。实践过程中解决了FastAPI公网访问、Dify工具节点调用顺序等问题。最终实现了Agent成功调用服务器监控接口并返回系统信息的功能。该方法为快速对接现有API与AI平台提供了高效解决方案。
2025-09-13 17:10:47
450
原创 DeepSeek实战--RAG
RAG(检索增强生成)是一种结合信息检索系统与大语言模型的技术框架,通过外部知识库检索相关上下文,提升模型回答的准确性和可靠性。其核心流程包括数据加载、文本分割、向量化、构建向量数据库,以及查询转换、语义检索、上下文构建和答案生成。文中还演示了如何使用Qdrant向量数据库和DeepSeek模型搭建RAG系统,并指出该技术可有效规避大模型幻觉问题,但不同模型在专业任务上表现各异。
2025-09-09 01:16:09
897
原创 DeepSeek实战--向量库
向量数据库对比与选型指南 向量数据库是专为存储和检索向量数据设计的数据库系统,广泛应用于RAG、语义搜索、推荐系统等领域。主流产品包括Qdrant(高性能过滤)、Milvus(超大规模)、Chroma(轻量易用)、Weaviate(混合搜索)和Pinecone(全托管云服务)。选型需考虑数据规模、查询复杂度、运维成本等因素:千万级数据推荐Qdrant或Milvus;快速原型开发适合Chroma;混合搜索场景建议Weaviate;无运维需求可选用Pinecone云服务。实际选型时应结合具体业务数据进行测试验证
2025-09-06 16:20:00
996
原创 DeepSeek实战--帮你找最合适的工作
摘要:本文介绍了一个AI辅助求职工具的实现方案,通过Python开发环境(3.11版本)结合Deepseek-chat大模型和OpenAI SDK,实现了自动化岗位匹配功能。该工具主要包含两个核心模块:一是通过无头浏览器爬取招聘网站岗位信息,二是基于用户简历和岗位需求列表进行智能匹配。系统会先检索符合要求的岗位,然后通过预设的prompt模板将简历与岗位需求进行对比分析,最终输出最匹配的3个岗位及求职建议。这种方法相比传统人工筛选更高效,特别适合求职者快速找到合适的工作机会。
2025-09-06 15:19:36
312
原创 DeepSeek实战--解决反爬虫问题
本文介绍了如何通过动态代理IP解决爬虫被网站风控拦截的问题。作者在爬取求职网站数据时遭遇IP封禁,转而使用付费代理服务(快代理)实现IP动态切换。文章详细展示了注册账号、购买套餐和代码集成代理的步骤,并提供了试用建议。最后作者感叹代理技术的商业价值,同时强调仅供技术研究,提醒注意法律风险。通过动态IP可以有效规避风控,但需谨慎使用爬虫技术。
2025-08-24 18:23:52
222
原创 DeepSeek实战--无头浏览器抓取技术
本文介绍了如何使用无头浏览器技术进行动态数据抓取。首先解释了无头浏览器的概念及其优势,并详细说明了Selenium框架的配置方法,包括安装Chrome浏览器、驱动程序和必要的依赖项。通过测试代码验证了环境搭建的正确性。 实战部分以招聘网站为例,展示了如何分析页面结构并提取关键信息。文章提供了完整的Python代码示例,包含浏览器初始化、页面元素定位和数据抓取等关键步骤。这种方法特别适用于需要处理动态加载内容的网站抓取场景,为获取最新数据提供了有效的技术解决方案。
2025-07-27 14:32:52
649
原创 DeepSeek实战--服务器Python环境初始化
摘要:本文介绍了在CentOS 7服务器上快速初始化Python环境的步骤。首先更新系统,然后安装Python 3和pip包管理工具,最后验证安装结果。整个过程仅需2分钟即可完成。文章指出虽然单次配置耗时短,但批量服务器配置仍显低效,建议后续研究使用Docker容器化技术实现环境快速部署,以提高工作效率。
2025-07-21 02:29:01
258
原创 DeepSeek实战--MCP Client SSE模式
本文介绍了MCP架构中基于SSE(Server-Sent Events)的客户端实现方案。SSE模式通过HTTP协议实现服务器向客户端的单向实时数据推送,使用Starlette框架实现持久连接。文章对比了SSE与标准输入输出模式的差异,SSE模式支持实时更新、架构解耦,适合交互式应用。详细演示了从创建MCP服务器工具、建立Starlette应用到实现SSE客户端的完整流程,包括工具函数定义、SSE连接处理、客户端调用等关键步骤。
2025-05-25 01:11:17
1719
原创 DeepSeek实战--MCP Client Stdio模式
本文介绍了DeepSeek实战中MCP Client的Stdio模式实现。文章首先对比了Stdio模式和SSE模式的通信协议、实时性、架构灵活性、适用场景及配置复杂性,指出Stdio模式适用于本地快速集成场景。接着详细阐述了环境准备、项目初始化、引用MCP Client包、设置服务器连接参数、建立服务器连接、启动运行函数以及运行客户端的步骤,并展示了运行结果。最后总结了Stdio模式的局限性,如需客户端启动服务器、不适用于生产环境。
2025-05-24 21:59:52
794
原创 DeepSeek实战--MCP Server
本文介绍了 DeepSeek 实战中 MCP Server 的使用方法及其三大核心能力:Tool(工具)、Resource(资源)和 Prompt(提示模板)。文章以一个考评系统为例,详细展示了如何通过 MCP Server 实现工具调用。首先使用 uv 初始化项目并安装依赖,然后通过 FastMCP SDK 创建工具函数(如获取员工绩效得分),并注册到 MCP Server 中。接着,修改配置文件以指定运行命令和代码路径。最后,通过客户端验证工具的调用效果。
2025-05-04 02:38:16
652
原创 DeepSeek实战--MCP是什么?
本文介绍了 MCP(Model Context Protocol,模型上下文协议)的概念、使用场景及技术架构。MCP 是由 Anthropic 公司于 2024 年推出的开放协议标准,旨在为大型语言模型(LLM)与外部数据源、工具及服务提供标准化的连接框架,解决数据孤岛问题并提升 AI 应用的实时交互能力。其使用场景包括自动化开发、跨平台数据整合和智能代理协作等。技术架构由 MCP 主机、客户端、服务器、本地资源和远程资源组成,通过它们的协作实现用户请求的处理和响应。
2025-05-04 01:28:20
528
原创 DeepSeek实战--蒸馏
本文介绍了知识蒸馏(Knowledge Distillation)的概念及其在 AI 模型压缩中的应用。知识蒸馏是一种将大型教师模型的知识和能力迁移到小型学生模型的技术,适用于降低部署成本、加速推理、减少能耗以及领域适配等场景。文章通过新闻分类的示例,详细展示了知识蒸馏的流程:准备原始数据、编写提示词让教师模型输出思考过程和结果、获取教师模型的输出并生成教学数据,最后对小模型进行微调。通过蒸馏,小模型能够继承教师模型的推理能力,从而在资源受限的环境中高效运行。
2025-05-03 19:16:28
737
原创 DeepSeek实战--微调
本文介绍了 LLM 微调的概念、适用场景、方法以及与其他技术的对比。微调是指在预训练模型的基础上,通过特定领域或任务的数据进一步训练,使其适应具体需求。它适用于领域专业化(如医疗、法律)、任务适配(如文本分类、代码生成)、风格控制(如模仿特定文风)和安全对齐(如过滤有害内容)等场景。微调方法包括使用商业模型的在线微调(如 OpenAI 的 GPT)、云厂商的模型部署平台(如阿里云百炼)以及本地私有化部署(如开源的 LLama-factory)。文章还对比了预训练与微调的区别,指出预训练是学习语言的通用规律
2025-05-03 18:17:27
1137
原创 DeepSeek实战--手搓实现Agent
本文介绍了如何通过编码实现一个简单的 AI agent,模拟一套 AI 学生评价系统,通过自然语言查询和分析数据。文章详细阐述了实现过程,包括定义 prompt、定义工具、对接 LLM 客户端以及编写 agent 逻辑等步骤。通过定义清晰的 prompt 规则,让模型逐步处理问题,减少幻觉。核心逻辑是用代码调度大模型和工具,组装获取最终结果。案例中涉及多次调用大模型并追加上下文,程序需判断生成最终成果后输出结果并退出循环。
2025-05-03 02:04:55
967
原创 DeepSeek实战--各版本对比
本文对DeepSeek的多个版本进行了全面对比,详细分析了各版本的参数量、优势、劣势、适用场景以及竞品情况。DeepSeek-V3以开源、高效推理和突出的中文处理能力著称,但多模态能力有限;DeepSeek-R1满血版在复杂逻辑推理和多模态支持方面表现出色,但部署成本高且推理速度较慢;蒸馏版则以低成本部署和快速响应为特点,适合资源受限的环境,但推理能力稍弱。DeepSeek-V2在中文自然语言处理任务中表现优异,但多模态支持不足;DeepSeek-VL专注于多模态融合,适合视觉问答和文档理解任务;DeepS
2025-05-02 17:56:34
983
原创 DeepSeek实战--Function Calling
本文介绍了 Function Calling 技术的实战应用。Function Calling 是由 OpenAI 提出的技术,用于将自然语言转化为结构化请求,使 AI 能够与外部系统交互并完成复杂任务。文章通过一个获取股票收盘价的示例,详细展示了如何使用 DeepSeek 的大模型和工具调用功能。
2025-05-02 16:38:41
882
原创 AIGC简化文件管理:Python自动重命名Word和PDF文件
本文介绍了如何利用Python编程和AIGC技术自动化地为Word和PDF文件重命名。通过提取文件内容的标题并替换原始文件名,大大提高了文件管理的效率和准确性。文章提供了详细的步骤和代码示例,适合希望简化文件命名流程的程序员和内容创作者。
2024-09-08 01:03:47
1085
原创 0基础学习爬虫系列:网页内容爬取
以前要写一个爬虫,对于不熟悉Python新手而言,至少要1天时间。今天我们实现的爬虫功能,从最初构思,到最终作品产出,Ai全程在为我们免费打工,而且提供的方案非常专业,也使得非计算机专业的朋友,可以通过自然语言完成编程,大大的降低了编程的门槛。
2024-09-07 19:44:27
1699
原创 0基础学习爬虫系列:Python环境搭建
回想8年前,为了学习java 苦苦的看完了几百页的《Think in Java》,然后花了差不多2周时间,搭建了开发环境,写出第一行代码“hello world ”。今天在通义千问的帮助下,10分钟,完成了 Python环境的搭建,并成功运行了1个demo程序。尽管Ai生成的demo 还不太完美,但你可以要求Ai不断地修改,这能极大的降低编码门槛,正在看文章的你,有没有快要失业的感觉(若你是程序员),哈哈哈!
2024-09-03 01:47:55
933
原创 跨语言障碍:全球语言翻译神器崛起
这款软件,在翻译的场景做得非常专业,能够帮助大家快速阅读外文资料(支持全球大部分语言),而且已集成10+通用大模型,可以选择你信赖的大模型提供底层服务。
2024-09-02 02:19:42
401
原创 Gamma AI:一键生成专业级PPT的智能工具
Gamma 是一个致力于通过非常简单的ai交互,制作好的视觉体验作品,它始终站在作者的视角新增功能,同时注重观众视角呈现作品。突破了以往演示文档(ppt、pdf、网站)表现形式,能够借助ai的力量,帮助作者创新。地址:https://gamma.app/1)gamma 定位是通过ai快速生成内容,不仅仅是只能生成ppt ,还能生成网站、文档等,它提供了非常多的主题,当然也可以自定义主题,以往制作ppt 还需要全网去找图片,它在站内就能完成图片检索或ai生成,ppt中每个元素都可以通过ai生成。
2024-08-05 00:29:19
7594
原创 AI辅助教育:九章大模型的数学辅导功能解析
九章大模型是学而思为学习研发的模型,该模型对于数学做了很多专门的训练,在题目推荐方面做得比较好。同时,这个模型也能支持上传图片,对图片内容进行分析,然后针对内容进行校对,推荐相识题目。
2024-08-05 00:22:32
912
原创 OBS Studio:如何打造专业级的视频直播体验
OBS(Open Broadcaster Software)是一款开源的视频录制和直播软件,广泛用于视频制作、游戏直播和网络直播。它支持多种操作系统,包括Windows、macOS和Linux。OBS提供了丰富的功能,包括但不限于:** 多场景切换:** 用户可以创建多个场景,每个场景包含不同的源,如窗口、图像、文本、浏览器等,并且可以在直播或录制过程中无缝切换。实时源:OBS支持多种实时源,包括游戏捕获、窗口捕获、图像、文本、浏览器窗口等。音频混音:可以调整不同音频源的音量,实现混音效果。
2024-08-04 13:52:18
674
原创 AI图文创作革命:10步快速掌握自动化内容生成技巧
新媒体时代,内容变得非常容易传播,主题及内容的质量直接影响访问量,如果按传统方式写一篇好的文章及配图,至少2天。 Ai 既然有海量的数据,且能够自动生成图文,我们需要给作者提供一个工具,能够让作者1小时就能生成自己想要的文章,稍加修改就可以发布。
2024-08-04 13:17:55
1280
原创 5步骤搭建智能客服
以前要做一个Ai智能客服,需要有一支5~10人的研发团队,或者花几十万采购第三方产品,Ai时代,一个人就是一家公司,今天我们就挑战一下,一个人做一款智能客服产品。本机器人按知识库的内容进行解答用户问题,避免了大模型幻觉问题,同时支持开场白中加常见问题,用户疑问后,可以对问题进行推荐。
2024-07-29 01:50:43
2148
2
原创 开源智能助手平台Dify是什么?
Dify 是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让你可以快速从原型到生产。
2024-07-22 01:21:28
21867
4
原创 Ai知识图谱
总结:从AI技术栈全貌来看,基础模型、基础算法,个人及小公司是玩不起的,大公司才有对应人力、财力、算力 去做,个人更多的是要在应用场景上创新,几个关键的技术必须会:编码语言(Python、Java)、GPT4、stable diffusion、midjourney、Langchain、向量数据库
2024-02-03 22:32:33
554
2
原创 windows系统同时安装jdk1.7 和jdk1.8
一、背景目前一些老项目用的是jdk1.7,新项目全部用的jdk1.8,每次新老项目交替开发的时候都都需要,重新安装配置jdk,耗时又麻烦,希望能通过一键或简单配置修改当前系统jdk版本。二、配置过程1)下载jdk下载地址:https://www.oracle.com/java/technologies/javase-downloads.html2)创建安装jdk目录,多个jdk版本目录结构需要统一,这样才能统一设置JAVA_HOME3)删除系统环境变量中安装jdk8产生的 Path C:
2020-07-19 13:34:56
4681
1
原创 MySQL无法远程连接问题处理
1、查看/etc/mysql/my.cnf配置文件是否只允许本地连接注释配置:#bind-address = 127.0.0.1,重启MySQL Server2、防火墙(我用的是iptables)禁止了3306端口访问/etc/sysconfig/iptables配置文件添加3306端口,即添加以下内容再重启防火墙即可: -A INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCEPT3、MySQL没有授予相应权限授权用户us
2020-05-31 14:46:21
437
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅