- 博客(297)
- 收藏
- 关注

原创 开源模型应用落地-解锁大语言模型的无限潜能
1、您是否也在迫不及待地期待在AI时代中展示自己的能力?2、您是否一直在研究如何使用开源模型?3、您是否一直在寻找将AI与业务结合的方向?4、您是否一直在寻找模型推理加速的方法?5、您是否一直在努力整合来自互联网上零散的资料?
2024-01-11 14:23:55
24049
84
原创 开源模型应用落地-LangGraph101-多智能体反思协同(七)
通过反思协同,多智能体系统能够在动态环境中持续进化,实现从简单任务分配到复杂问题求解的能力升级。
2025-03-26 18:33:30
4327
2
原创 开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
如何处理一段完整音频并生成字幕文件,弥补上一节中模型只能处理30秒音频的局限。
2025-03-25 19:00:00
6508
3
原创 开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(四)
介绍OpenAI 最新开源的Whisper-large-v3-turbo模型,并集成vLLM进行推理加速。
2025-03-24 18:40:38
5153
5
原创 开源模型应用落地-LangGraph101-多智能体协同实践(六)
LangGraph 通过图形结构将多个智能体连接在一起,形成一个可以动态反馈的合作网络,实现更深层次的合作。
2025-03-21 20:45:37
6246
5
原创 开源模型应用落地-LangGraph101-ToolNode-智能工具调度的核心枢纽
通过ToolNode组件实现了智能体与工具之间的无缝衔接。
2025-03-21 13:19:22
6886
4
原创 开源模型应用落地-shieldgemma-2-4b-it模型小试-多模态内容安全检测(一)
ShieldGemma-2-4B-IT 凭借多模态能力、低资源需求和高精度检测,成为兼顾性能与安全性的开源图像审核工具。
2025-03-19 20:00:00
6693
13
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-更新历史Graph状态(三)
深入解析如何通过get_state_history与update_state两大核心方法,实现对历史对话状态的精准回溯与修改。
2025-03-13 20:15:00
6471
8
原创 开源模型应用落地-LangGraph101-探索 LangGraph人机交互-编辑Graph状态(二)
通过在Agent执行流程中实时中断并修改图状态,实现人机协同的精准控制与逻辑修正,提升智能系统的灵活性和适应性。
2025-03-11 18:36:46
8897
12
原创 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-自动前缀缓存-APC(八)
vLLM框架通过自动前缀缓存技术有效解决了大语言模型推理中的重复计算问题,显著提升了长上下文和多轮对话场景下的效率。
2025-03-04 08:30:00
5595
9
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(三)
使用 vLLM 清晰呈现推理过程
2025-03-03 09:00:00
6620
8
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-Docker助力-模型部署 “光速” 指南
借助Docker简化并加速DeepSeek-R1-Distill-Qwen-7B模型的部署
2025-02-24 18:41:56
10825
6
原创 开源模型应用落地-LangGraph101-探索 LangGraph跨线程持久化
深入剖析了LangGraph框架下的跨线程持久化技术,以解决在多线程环境中有效管理和存储用户数据的挑战。
2025-02-20 18:38:40
7185
10
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-LoRA微调-LLaMA-Factory-单机单卡-V100(一)
使用LLaMA-Factory高效微调qwen2.5-7b-instruct
2025-02-18 22:43:12
13421
18
原创 开源模型应用落地-LangGraph101-探索 LangGraph 短期记忆
本文探讨LangGraph框架中短期记忆管理的关键作用,并展示如何使用内存、sqlite和mysql实现智能体中的记忆功能。
2025-02-17 18:33:44
4436
14
原创 开源模型应用落地-Qwen1.5-MoE-A2.7B-Chat与vllm实现推理加速的正确姿势(一)
探讨 vllm 与 Qwen1.5-MoE-A2.7B-Chat 的整合
2025-02-12 15:42:41
9714
14
原创 开源模型应用落地-qwen模型小试-Qwen1.5-MoE-A2.7B-Chat-快速体验
Qwen1.5-MoE-A2.7B-Chat通过混合专家架构,以激活仅27亿参数的方式,实现了在对话和推理任务上与传统7B模型相媲美的性能。
2025-02-11 15:24:20
6793
10
原创 开源模型应用落地-LangGraph101-探索 LangGraph 的多图协作处理(五)
多图协作凭借提高模块化与可维护性,让复杂任务拆分清晰、代码复用便捷
2025-02-05 21:00:14
15434
19
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(二)
DeepSeek-R1-Distill-Qwen-7B模型通过蒸馏技术成功提炼Qwen-7B核心知识,旨在满足小型模型需求,并在全面测试中优化性能和拓展应用边界。
2025-02-03 09:00:00
5669
14
原创 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(一)
DeepSeek-R1-Distill-Qwen-7B模型通过蒸馏技术成功提炼Qwen-7B核心知识,旨在满足小型模型需求,并在全面测试中优化性能和拓展应用边界。
2025-02-02 18:05:27
18590
10
原创 开源模型应用落地-LangChain实用小技巧-Cache vs Memory(九)
Cache通过存储和复用大语言模型(LLM)的输出,能够有效降低频繁 API 调用带来的成本和响应时间问题。
2025-01-27 22:22:12
14462
13
原创 开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-LangGraph-链式处理(一)
Qwen2.5系列模型凭借卓越的推理能力,在 LangGraph 的多节点处理中展现出重要价值,进一步释放了大语言模型在复杂任务中的潜力。
2025-01-24 12:29:16
10417
17
原创 开源模型应用落地-LangGraph101-探索 LangGraph 的链式处理(四)
LangGraph 的链式处理通过定义节点和边,以逻辑顺序连接多个执行单元,实现数据流转和状态更新的动态管控。
2025-01-24 11:24:06
9400
17
原创 开源模型应用落地-LangGraph101-探索 LangGraph 的多分支并行处理(三)
LangGraph 的多分支处理能力通过将任务分解为并行执行的子任务,显著提升了计算速度,增强了应用程序对复杂业务逻辑和用户需求的适应性。
2025-01-16 14:59:49
9488
37
原创 开源模型应用落地-LangGraph101-探索 LangGraph 的多分支处理(二)
使用LangGraph的分支处理能力,使得更好地适应各种复杂的业务逻辑和用户需求
2025-01-14 17:21:45
10353
40
原创 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-利用KOR框架实现结构化输出(七)
通过结构化输出将模型生成的结果组织为易于解析和处理的数据格式。使得后续的数据处理、分析和集成变得更加高效和灵活,便于开发者和应用程序自动提取关键信息,实现更复杂的功能和交互。
2025-01-03 17:23:07
9675
33
原创 开源模型应用落地-LangChain实用小技巧-结构化输出-KOR(八)
使用kor框架从文本中提取结构化数据,将模型生成的结果组织为易于解析和处理的数据格式。
2025-01-03 15:11:15
257
37
原创 开源模型应用落地-LangGraph101-探索 LangGraph 的无限可能(一)
使用LangGraph应对大语言模型在复杂任务和动态交互中的更高要求。
2024-12-26 16:15:40
1362
35
原创 开源模型应用落地-LlamaIndex学习之旅-Agents-用自然语言构建Agent(一)
借 LlamaIndex框架,运用自然语言指令精准构建Agent,使其在复杂任务处理与信息交互中展现卓越效能
2024-12-24 17:25:17
433
27
原创 开源模型应用落地-LangChain实用小技巧-调用agent-create_xml_agent(二十五)
使用create_xml_agent进行agent调用
2024-12-19 18:41:54
1181
25
原创 开源模型应用落地-LangChain高阶-智能体探究-调用agent(六)
智能体的出现标志着技术进步对日常生活的深远影响,充分展示了大模型的强大功能。
2024-12-18 17:14:04
268
26
原创 开源模型应用落地-LangChain实用小技巧-工具调用异常处理完整篇(七)
在Langchain框架中,创建自定义工具时应强化异常处理机制,以应对调用工具时可能出现的各种问题,从而提高应用的稳定性和用户体验。
2024-12-13 14:22:07
287
30
原创 开源模型应用落地-LangChain实用小技巧-工具调用异常处理(二十四)
在Langchain框架中,创建自定义工具时应强化异常处理机制,以应对调用工具时可能出现的各种问题,从而提高应用的稳定性和用户体验。
2024-12-12 15:29:46
5730
35
原创 开源模型应用落地-LangChain实用小技巧-工具调用异常处理(二十三)
为了提升使用工具的稳定性和用户体验,必须在设计中加入异常处理机制,以应对调用过程中可能出现的各种异常情况。
2024-12-11 15:25:14
5570
26
原创 开源模型应用落地-知识巩固-生产级AI服务优化(二)
采用Flask蓝图架构和`python-dotenv`管理敏感信息,可以优化AI接口服务的代码结构、从而提升可管理性和安全性
2024-12-10 14:35:40
6784
26
原创 开源模型应用落地-LangChain实用小技巧-利用结构化输出构建智能交互(二十二)
通过构建结构化输出,使开发者能够精确控制模型返回的数据格式,以满足特定应用场景的需求。
2024-12-09 11:41:41
5581
23
原创 开源模型应用落地-安全合规篇-用户输入价值观判断(四)
通过对用户输入内容的价值观判断,不仅审核信息的合法性和合规性,还深入洞察伦理道德与社会责任,旨在识别潜在冲突,营造安全和谐的交流环境。
2024-12-05 14:32:51
17966
30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人