- 博客(26)
- 收藏
- 关注
原创 不会写提示词?看这篇就够了 — 分享几个实用的提示词策略
提示词工程对于优化大语言模型输出至关重要。文章解析了提示词工作原理,提出模型选择策略(通用/推理模型),并总结四步构建法:明确目标、结构化模板、补充细节、迭代优化。关键要素按重要性排序为任务>上下文>示例>角色>格式>语气。进阶技巧包括格式限制、分隔输入、样例引导、思维链和多角色适配。通过JSON输出器、思维链推理等实战案例,展示优化效果。最后建议从最小可行提示开始,通过缺陷分析、约束补充和模型自检持续优化。
2025-07-23 11:50:11
687
原创 如何从0-1构建一个RAG知识库?包含原理讲解和RAG优化(图文并茂、通俗易懂)— Milvus + spring-ai-alibaba
嵌入(Embedding)是一种将文本、图像等数据转换为向量的技术,便于统一处理和比较。向量数据库专门存储和检索高维向量,通过计算相似度快速匹配结果。召回率衡量检索系统找回相关数据的能力,需与精确率平衡。RAG(检索增强生成)技术结合外部知识库检索和大语言模型,提升回答的准确性和可靠性。这些技术广泛应用于推荐系统、语义搜索等场景。
2025-07-17 19:34:36
872
原创 如何构建一个的简单的Manus智能体?—— 图文并茂、通俗易懂、SpringAI实现
智能体(Agent)是一种能够感知环境、自主决策并采取行动以实现目标的AI系统。与静态工作流不同,智能体具备自主思考、多步推理和动态调整能力。其核心技术包括:1)CoT思维链技术,通过分步推理解决复杂问题;2)Agent Loop执行循环,实现自主持续操作;3)ReAct模式,结合推理与行动形成闭环。智能体可应用于客服、搜索等动态场景,目前已可通过SpringAI Alibaba等框架实现。实现思路包括启动初始化、ReAct循环执行(思考-行动-观察)和结果交付三个阶段,展现
2025-07-14 00:51:14
994
原创 手把手教你微调一个意图识别模型(Qwen3-14B)并上线 —— Lora微调理论 + 百炼平台微调实战及评估 + 项目应用
LoRA(Low-Rank Adaptation)是一种高效微调大模型的方法,仅训练少量低秩矩阵参数即可适配新任务,显著降低资源消耗且不影响模型推理速度。阿里百炼平台支持在SFT(监督式微调)中启用LoRA,结合精简参数配置(如Rank=8、α=16、Dropout=0.1),可快速完成个性化训练。通过数据构造、模型选择、参数调优、训练部署等流程,平台实现了低成本、高准确率(95%+)的模型定制,适用于意图识别等任务的实战落地。
2025-07-13 10:21:35
1875
原创 一文到带你了解大模型的前世今生及应用
人工智能(AI)技术自诞生以来,经历了多个发展阶段,每个阶段都推动了技术的进步和应用的扩展。本文回顾了AI发展的三波浪潮:从1950年至1970年间的符号主义与连接主义并行发展的初期阶段,到1970至1990年间的“AI寒冬”,再到1990年以后随着计算能力提升和大数据应用带来的深度学习浪潮。随着每个阶段的技术突破,AI的应用场景逐渐从简单的规则系统扩展到复杂的语义理解与推理任务。
2025-07-10 22:41:30
794
原创 卡帕西 Andrej Karpathy:软件正在(再次)变革YC演讲 - 理清AI未来的发展方向 - 图文精华笔记
在2025年6月的YC AI创业学校演讲中,知名AI专家Andrej Karpathy深入剖析了软件演进的三个里程碑阶段,并对大语言模型(LLM)的本质、特性及未来应用方向提出了独到见解。他的演讲不仅揭示了当前软件变革的核心,也为我们描绘了未来AI世界的图景。
2025-06-27 13:14:19
1056
原创 抖音推荐算法底层原理理解(通俗易懂版)
面对信息爆炸,推荐系统通过分析用户行为(而非直接理解内容)来实现个性化信息过滤。早期如“协同过滤”,依据“相似人群的喜好”进行推荐。现代推荐系统则广泛采用深度学习和神经网络(如抖音的Wide&Deep、双塔召回模型),将用户与内容特征转化为抽象的“数字指纹”,通过复杂的数学运算匹配用户兴趣,从而更精准、高效地预测并推送用户可能喜欢的内容
2025-05-19 01:30:07
1977
转载 抖音推荐算法底层原理公开!
在信息爆炸的时代,推荐系统成为解决信息过载问题的关键工具。推荐算法通过分析用户行为数据,构建个性化推荐模型,精准推送用户感兴趣的内容。传统推荐算法如协同过滤,通过用户行为相似度进行推荐,而无需理解内容本身。随着深度学习的发展,推荐系统进入新时代,深度学习模型如Wide&Deep和双塔召回模型,通过多层神经网络挖掘数据中的深层模式,提升推荐的泛化能力和精准度。这些技术在电商、视频平台和社交网络中广泛应用,显著提升了用户体验。
2025-05-19 01:09:07
477
原创 SpringBoot操作Docker实现多语言代码沙箱, 并用容器池优化性能
本文介绍了如何从零开始构建一个高可用、高性能、高扩展性的多语言代码沙箱,主要基于Docker技术。首先,Docker通过容器化技术将程序与宿主机隔离,提升了系统安全性。核心概念包括镜像、容器、Dockerfile和镜像仓库。使用容器池可以避免每次执行代码时重复创建和删除容器,提高资源复用性。接着,详细说明了如何安装Docker Desktop,并针对MacOS用户提供了通过TCP连接Docker的解决方案。随后,介绍了如何在Java项目中通过docker-java库操作Docker容器,包括项目结构、核心依
2025-05-19 00:55:09
1449
1
原创 MAC本地微调大模型(MLX + Qwen2.5)并利用Ollama接入项目实战
在本地设备上微调大语言模型(LLM)已成为开发者探索AI应用的新趋势。使用苹果MLX框架微调Qwen2.5-0.5B模型通过Ollama服务接入自定义项目实现端到端的本地化AI解决方案通过本教程,您已掌握:✅ Mac本地LLM微调技术✅ MLX框架的实战应用✅ Ollama服务集成方法使用自定义数据集进行领域适配探索不同量化策略的精度/性能平衡结合LangChain构建完整AI应用延伸阅读MLX官方文档Qwen模型技术白皮书Ollama高级配置指南注:请将文中。
2025-05-03 01:53:31
2598
原创 Spring AI 利用 MCP 让AI实现联网搜索(webflux方式实现)
MCP 是一个开放协议,它为应用程序向 LLM 提供上下文的方式进行了标准化。你可以将 MCP 想象成 AI 应用程序的 USB-C 接口。就像 USB-C 为设备连接各种外设和配件提供了标准化的方式一样,MCP 为 AI 模型连接各种数据源和工具提供了标准化的接口。Spring AI 不断的与时俱进,也支持了MCP协议,这使得我们这些普通程序员也能够快速搭建和引入MCP服务。
2025-04-29 20:18:06
3254
7
原创 Vue3 + Ts +Vite 根据OpenAPI+swagger自动生成api接口
【代码】Vue3 + Ts +Vite 根据OpenAPI+swagger自动生成api接口。
2025-04-19 12:10:03
531
原创 spring-ai M7 破坏性更新!!!
Spring AI 1.0.0-M7 不仅是一次版本迭代,更是 Java 生态拥抱 AI 革命的关键一步。无论您是构建聊天机器人、数据分析工具还是智能服务,Spring AI 都将助您以更少代码实现更多可能。M7 的发布标志着 Spring AI 已进入最终打磨阶段。根据路线图,团队计划于近期推出候选版本(RC1),并加速推进正式版(GA)的发布。作为通往 1.0 正式版(RC1 及 GA)的最后一个里程碑版本,此次更新带来了多项重大改进,进一步巩固了其作为 Java 开发者首选 AI 框架的地位。
2025-04-15 20:18:28
605
原创 一文看清递归的本质(图文并茂)
一个调用产生了两个调用分支。这样不断递归调用下去, 最终将产生一棵层数为 n 的递归树(recursion tree)。当处理与“分治”相关的算法问题时,递归往往比迭代的思路更加直观、代码更加易读。以“斐波那契数列”为例。递归每次调用本身,都会在系统内存新建开一个空间存储。
2025-03-30 11:31:18
155
原创 多台Macmini利用EXO搭建分布式AI集群提高deepseek -r1:14b推理能力方案分享(实测可用)
对比之下,一块RTX 4090显卡满载就要450瓦——这电费差距,长期运行成本得高多少!只要设备在网络中的某个位置连接,就可以用来运行模型,使用起来非常简单方便。这就好比把厨房和餐厅打通,厨师(GPU)和传菜员(CPU)再也不用跑来跑去,上菜速度直接翻倍!由图可以看到单台m4 mac的性能大约是28tokens/s,运算速度是8.52TFLOPS(每秒所执行的浮点运算次数)传统显卡(比如NVIDIA RTX 4090)的显存最高只有24GB,而一台顶配Mac Mini能塞下64GB的。
2025-03-08 13:03:13
6937
9
原创 警惕!你Ollama部署的模型正在被白嫖
由于我用macmini m4在本地用ollama部署了几个大模型,并通过内网穿透到了公网,由oneapi分发,但是没有ollama没做鉴权,导致任何人都可以通过我的ip访问访问我本地大模型。还好我今天收到了天翼云的提醒才意识到这个问题,现在已经修复这个问题了,希望看到朋友赶快去检查一下。
2025-03-02 22:37:19
1568
原创 Java程序开发全套开发环境-百度网盘分享
当电脑突然g了或者去帮别人装环境都是一件及其痛苦的事,要去各种软件的官网忍受极其慢的下载速度,特此整合常用的开发环境到百度网盘中,无偿无套路分享给大家。复制这段内容打开「百度网盘APP 即可获取」补充一下百度网盘下载提速教程。
2024-12-04 11:18:27
415
原创 AI时代下的程序员:如何在变革中保持核心竞争力
在AIGC(如ChatGPT、Midjourney、Claude等)大语言模型飞速发展的背景下,AI辅助编程工具已经成为程序员日常工作的一部分。无论是代码生成、问题排查,还是优化工作流程,AI正以其强大的计算能力和智能算法改变着编程的范式。在这一趋势下,程序员该如何应对,并持续提升自己的核心竞争力呢?这是一个复杂而多维度的问题,我们可以从以下几个角度来探讨。
2024-09-19 00:28:16
1147
1
原创 整合SpringBoot+ MySQL+ Uniapp+MQTT前后端完整IOT作品无偿分享(内有思路讲解+成品展示)—— 物联网大赛一等奖作品
MQTT(Message Queuing Telemetry Transport)是一种轻量级、基于发布-订阅模式的消息传输协议,适用于资源受限的设备和低带宽、高延迟或不稳定的网络环境。它在物联网应用中广受欢迎,能够实现传感器、执行器和其它设备之间的高效通信。MQTT 通过如下定义客户端和代理来实施发布/订阅模型。
2024-09-18 23:32:40
1208
原创 windows11忘记密码完美解决方案,100%成功,适用所有情况
密码忘记是一件非常痛苦的事,下面介绍一种不用重装系统,不需要懂技术,跟着一步一步来,100%成功的方案。看到本教程,将让你少走很多很多的弯路,请耐心看完。
2024-09-10 01:45:54
12250
原创 2024最新软考重要知识点整理+学习方法,高效学习(全)(已过)
2024年7月,我成功拿到了软件设计师的证书,也对得起自己一个月左右的准备时间。我是跟着文老师的课程学习的,感觉这位老师讲解通俗易懂,重点清晰。写这篇帖子是为了帮助那些想考软设的朋友们更高效地学习,了解软设的重点所在,以及取得证书的作用。
2024-07-22 23:04:53
6369
原创 腾讯云服务器+FRP实现内网穿透《实测简单可用》
网上找了太多内网穿透的教程,大多数都用不了或者是巨麻烦,没办法只能自己尝试了,功夫不过有心人,终于让我试出一套最简单可行的解决方案了,希望能帮到你,有什么疑问欢迎在下方留言,我看到了一定第一时间回复。
2024-04-02 21:50:25
3321
2
原创 如何使用AI快速了解一个行业(保姆级教程)
本文提供了一份全面的指南,教你如何利用ChatGPT及其他工具和方法论(如麦肯锡方法论),快速而深入地了解任何行业。通过从注册账号、获取API密钥、到利用AI生成关键词、分类、制定学习优先级、高效阅读文献,再到梳理行业宏观关系并使用思维导图可视化,这份保姆级教程详尽阐述了每一步骤,旨在帮助用户从零开始,系统地掌握行业知识,无论是行业新手还是希望深化理解的读者都能从中受益。
2024-03-23 20:51:54
2176
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅