
开源大语言模型-新手试炼
文章平均质量分 92
随着开源大语言模型的蓬勃发展,您是否对体验其中一种感到兴奋?我将非常愿意与您同行,逐步引导您掌握业界流行的开源模型的使用方式,帮助您快速度过新手期。
开源技术探险家
非计算机专业出身人士,但于2009年毅然投身IT行业。迄今,拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前,致力于人工智能(AI)方向的深入探索,所负责的项目已顺利完成大语言模型和算法的备案工作。
展开
-
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
如何处理一段完整音频并生成字幕文件,弥补上一节中模型只能处理30秒音频的局限。原创 2025-03-25 19:00:00 · 30320 阅读 · 8 评论 -
开源模型应用落地-LangGraph101-ToolNode-智能工具调度的核心枢纽
通过ToolNode组件实现了智能体与工具之间的无缝衔接。原创 2025-03-21 13:19:22 · 30708 阅读 · 9 评论 -
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-LoRA微调-LLaMA-Factory-单机单卡-V100(一)
使用LLaMA-Factory高效微调qwen2.5-7b-instruct原创 2025-02-18 22:43:12 · 14759 阅读 · 19 评论 -
开源模型应用落地-模型上下文协议(MCP)-Context-深入解析logging_callback机制与应用场景
logging_callback在MCP中实现模型调用链追踪、错误诊断与性能优化原创 2025-05-21 08:00:00 · 21419 阅读 · 9 评论 -
开源模型应用落地-模型上下文协议(MCP)-Resources-资源的使用逻辑
深入解析MCP资源的使用逻辑,从协议规范到实战场景,探讨如何通过这一机制释放大模型的无限潜能。原创 2025-05-15 15:58:15 · 25055 阅读 · 2 评论 -
开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Gradio(一)
通过Podcastfy,结合生成式人工智能和文本转语音技术,高效将多种内容形式转换为播客音频,实现灵活和专业的表达。原创 2025-04-16 20:00:00 · 22030 阅读 · 15 评论 -
开源模型应用落地-Podcastfy-从文本到声音的智能跃迁-Docker(二)
Podcastfy通过结合生成式AI和先进TTS技术,将文字、图片、视频等多种内容智能转化为多语言音频,支持高度自定义与多样化场景应用,引领“可听化”创作新风潮并重新定义声音经济时代的内容表达方式。原创 2025-04-22 18:36:44 · 17292 阅读 · 5 评论 -
开源模型应用落地-模型上下文协议(MCP)-从数据孤岛到万物互联(一)
模型上下文协议(MCP)通过标准化的接口和交互语法,重新定义AI与物理世界的连接,提升人机协作的深度与广度。原创 2025-04-08 19:45:00 · 26052 阅读 · 12 评论 -
开源模型应用落地-LangGraph101-探索 LangGraph人机交互-添加断点(一)
通过“断点机制”实现了智能系统的可控自主性。原创 2025-03-05 13:18:54 · 29076 阅读 · 10 评论 -
开源模型应用落地-LangGraph101-探索 LangGraph 短期记忆
本文探讨LangGraph框架中短期记忆管理的关键作用,并展示如何使用内存、sqlite和mysql实现智能体中的记忆功能。原创 2025-02-17 18:33:44 · 5003 阅读 · 16 评论 -
开源模型应用落地-LangGraph101-探索 LangGraph 的多分支处理(二)
使用LangGraph的分支处理能力,使得更好地适应各种复杂的业务逻辑和用户需求原创 2025-01-14 17:21:45 · 10494 阅读 · 44 评论 -
开源模型应用落地-LangGraph101-探索 LangGraph 的无限可能(一)
使用LangGraph应对大语言模型在复杂任务和动态交互中的更高要求。原创 2024-12-26 16:15:40 · 17410 阅读 · 39 评论 -
开源模型应用落地-qwen模型小试-Qwen1.5-MoE-A2.7B-Chat-快速体验
Qwen1.5-MoE-A2.7B-Chat通过混合专家架构,以激活仅27亿参数的方式,实现了在对话和推理任务上与传统7B模型相媲美的性能。原创 2025-02-11 15:24:20 · 6936 阅读 · 12 评论 -
开源模型应用落地-工具使用篇-JMeter(一)
使用JMeter工具压测AI服务链路,及时发现潜在的性能瓶颈原创 2024-02-02 09:30:00 · 16512 阅读 · 36 评论 -
开源模型应用落地-工具使用篇-SLB(二)
引入负载均衡,以提高AI服务的性能和故障转移能力原创 2024-02-18 11:42:49 · 17182 阅读 · 26 评论 -
开源模型应用落地-工具使用篇-向量数据库(三)
引入向量数据库,为AI服务赋能原创 2024-02-18 17:24:10 · 8021 阅读 · 29 评论 -
开源模型应用落地-工具使用篇-向量数据库进阶(四)
引入向量数据库,为AI服务赋能原创 2024-02-19 15:13:16 · 9323 阅读 · 22 评论 -
开源模型应用落地-工具使用篇-获取文本向量(五)
使用向量数据库之前,先要获取向量,本篇通过GPT和开源模型的方式来介绍如何获取文本向量原创 2024-02-22 18:11:31 · 2234 阅读 · 25 评论 -
开源模型应用落地-工具使用篇-Ollama(六)
Ollama集成QWen1.5系列模型,全网唯一,绝非搬运。原创 2024-03-05 15:45:08 · 26931 阅读 · 46 评论 -
开源模型应用落地-工具使用篇-Spring AI(七)
Spring AI调用OpenAI及Ollama系列模型,良心之作,全网唯一,绝非搬运,希望能给您带来一些些帮助!原创 2024-03-06 12:30:52 · 10167 阅读 · 36 评论 -
开源模型应用落地-工具使用篇-Spring AI-Function Call(八)
Spring AI调用OpenAI,并实现function call的高级用法,良心之作,全网唯一,绝非搬运,希望能给您带来一些些帮助!原创 2024-03-07 11:28:16 · 12509 阅读 · 30 评论 -
开源模型应用落地-工具使用篇-Spring AI-高阶用法(九)
Spring AI调用OpenAI,并实现历史上下文传递,模型参数优化等高级用法,良心之作,全网唯一,绝非搬运,希望能给您带来一些些帮助!原创 2024-03-08 12:01:57 · 8062 阅读 · 33 评论 -
开源模型应用落地-Gradio正确集成Fastapi-助力模型交互-入门篇(一)
Gradio与Fastapi正确集成,助力模型推理原创 2024-05-22 11:50:56 · 14193 阅读 · 29 评论 -
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(一)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。原创 2024-06-25 15:08:05 · 52625 阅读 · 32 评论 -
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(二)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。原创 2024-06-26 18:07:45 · 15576 阅读 · 19 评论 -
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(三)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。原创 2024-06-27 11:49:35 · 16492 阅读 · 31 评论 -
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(四)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。原创 2024-06-28 14:34:35 · 15179 阅读 · 19 评论 -
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(五)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。原创 2024-07-01 14:23:14 · 15356 阅读 · 18 评论 -
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio
使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。原创 2024-10-21 14:30:56 · 21601 阅读 · 31 评论 -
开源模型应用落地-FastAPI-助力模型交互-WebSocket篇(六)
使用FastAPI提高AI应用程序的开发效率和用户体验,为 AI 模型的部署和交互提供全方位的支持。原创 2024-07-02 18:15:36 · 8531 阅读 · 13 评论 -
开源模型应用落地-从源代码构建和运行vLLM-以满足您更高的需求
通过vLLM源码构建Docker镜像,提升了构建的灵活性与安全性,同时也优化了研发与部署的效率。原创 2024-10-11 14:04:56 · 19136 阅读 · 32 评论 -
开源模型应用落地-FastAPI-助力模型交互-进阶篇-生命周期事件(一)
通过生命周期事件,可以更好地管理应用的整个生命周期中的资源和操作,确保资源的正确初始化和释放,提高应用的性能、可靠性和可维护性。原创 2024-07-08 18:11:32 · 6529 阅读 · 22 评论 -
开源模型应用落地-FastAPI-助力模型交互-进阶篇-身份认证(二)
学习FastAPI的身份验证机制,通过接收包含用户名和密码信息,以验证用户的身份。原创 2024-07-17 10:39:19 · 19027 阅读 · 31 评论 -
开源模型应用落地-FastAPI-助力模型交互-进阶篇-Request&Dataclasses(三)
如何在FastAPI中直接使用Request对象和如何使用数据类Dataclasses原创 2024-07-18 16:58:30 · 3729 阅读 · 29 评论 -
开源模型应用落地-FastAPI-助力模型交互-进阶篇-中间件(四)
学习FastAPI中高级中间件的相关内容原创 2024-07-19 22:02:07 · 6579 阅读 · 34 评论 -
开源模型应用落地-FastAPI-助力模型交互-进阶篇-子应用(五)
在FastAPI中使用子应用(Sub Applications)的“挂载”(Mounts)功能原创 2024-07-20 16:37:19 · 4995 阅读 · 30 评论 -
开源模型应用落地-LangChain实用小技巧-ChatPromptTemplate的partial方法(一)
partial方法用于部分地预先设置提示模板中的变量,而format方法用于最终完成提示模板的格式化,得到完整的提示内容。原创 2024-07-26 20:42:02 · 9638 阅读 · 27 评论 -
开源模型应用落地-LangChain实用小技巧-MessagesPlaceholder使用(二)
使用MessagesPlaceholder,简化构建提示的过程,避免手动处理历史消息的添加和管理原创 2024-07-28 11:37:08 · 9414 阅读 · 21 评论 -
开源模型应用落地-LangChain实用小技巧-ChatPromptTemplate的各种花样(三)
使用ChatPromptTemplate玩出新花样原创 2024-07-30 08:30:00 · 7283 阅读 · 26 评论 -
开源模型应用落地-LangChain实用小技巧-自定义Prompt模版(四)
使用自定义提示词模版增强交互的可解释性和清晰度,提升性能和响应速度。原创 2024-08-04 20:14:45 · 18738 阅读 · 22 评论