
LLM之美
文章平均质量分 90
学习大语言模型,掌握LLM应用开发技巧,全面拥抱AGI时代。
张申傲
AIGC创业者/LangChain Committer/技术专家
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用 OpenAI Moderation 实现内容审核
本篇内容我们学习了如何利用 OpenAI 的 Moderation 功能进行内容审核。原创 2025-06-05 17:05:39 · 842 阅读 · 1 评论 -
大模型微调(5):PEFT 微调 Qwen 大模型
本篇文章,我们介绍了微调的核心概念,并基于 LoRA 技术与 peft 框架,对 Qwen 模型进行了微调,使其在中医领域的问答任务上取得了很好的效果。原创 2025-06-05 16:57:48 · 1030 阅读 · 0 评论 -
大模型微调(4):使用 AutoClass 管理 Tokenizer 和 Model
AutoClass 是 HuggingFace 提供的一组高级 API 对象,为用户提供了一种便捷的方式来加载各种预训练模型、分词器等核心组件。原创 2025-05-26 19:39:13 · 832 阅读 · 0 评论 -
大模型微调(3):Hugging Face Transformers 快速入门
Hugging Face Transformers 库已经成了大模型开发的事实标准,掌握核心 API 对于学习大模型微调会起到事半功倍的作用。原创 2025-05-26 19:21:45 · 678 阅读 · 0 评论 -
Claude Prompt-Caching 方案调研
Prompt-Caching是一项非常实用的功能,在节省长下文的成本方面具有巨大优势。原创 2025-05-16 11:28:51 · 783 阅读 · 0 评论 -
快速上手 MetaGPT
MetaGPT 是成熟度最高、使用最广泛的 Agent 开发框架之一原创 2025-04-27 20:10:37 · 501 阅读 · 0 评论 -
ReACT Agent 实战
ReACT 是 Agent 的理论基础,理解 ReACT 的原理对于开发 Agent 有非常大的帮助!原创 2025-04-27 20:04:35 · 1288 阅读 · 0 评论 -
多模态(3):实战 GPT-4o 视频理解
大模型在多模态方面能力的持续提升,将为 AI 应用的开发带来革命性的变化,一方面可以大幅提升用户体验;另一方面也可以加速促进 AI 应用在各行各业的广泛应用,并不断催生出更多创新的解决方案。原创 2025-04-25 11:05:41 · 1329 阅读 · 2 评论 -
多模态(2):DeepSeek-Janus 统一多模态模型
多模态是目前大模型领域非常热门的一个方向,并且还在快速发展中,经常会有新的技术突破出现。原创 2025-04-25 10:59:16 · 951 阅读 · 0 评论 -
多模态(1)—— OpenAI 多模态入门
本篇文章中,我们介绍了当下在大模型领域非常火爆的多模态功能,并以 OpenAI 的相关模型为例,具体讲解了如何实现文生图、图片理解和文本转语音等功能。原创 2025-03-17 16:03:37 · 842 阅读 · 0 评论 -
大模型微调实战(2):调用本地模型
在本篇文章中,我们继续以 `uer/gpt2-chinese-cluecorpussmall` 这个模型为例,演示了如何从 Hugging Face上将模型下载到本地,并且在本地进行调用。这才是目前大模型应用中更常用的开发范式,希望大家都能够了解。原创 2025-03-17 15:53:18 · 1078 阅读 · 0 评论 -
DeepSeek + ReAct 实现 Agent
借助DeepSeek强大的推理能力,再结合ReAct框架的驱动,我们可以非常方便地实现一个初级的AI Agent原创 2025-03-07 15:15:41 · 2161 阅读 · 0 评论 -
大模型微调实战(1):Hugging Face 入门
本次的文章中,我们对 Hugging Face 这个重量级的开源社区进行了介绍,概览了它的 Models 和 Datasets 这两个核心模块,并且通过一个简单的 demo 演示了如果调用 Hugging Face 上的在线模型,加深大家对于 Hugging Face 的了解。原创 2025-03-07 15:04:58 · 871 阅读 · 0 评论 -
快速入门 Prompt Engineering 提示工程
本文中,我们首先介绍了 Prompt 提示词的相关概念,接着分享了一些如何写好 Prompt 的技巧,最后介绍了几种常见的 Prompt Engineering 技术手段,可以帮助大家快速入门提示工程。原创 2025-03-03 14:37:43 · 1071 阅读 · 0 评论 -
构建自己的 Word2Vec 模型
本篇文章我们首先讲解了 Word Embedding 的基础概念,之后介绍了 Word2Vec 模型的作用及模型架构,最后的重头戏是从零到一训练一个 Word2Vec 模型,并利用它进行简单的相似性搜索,可以看到效果还是不错的。原创 2025-02-28 16:41:07 · 993 阅读 · 0 评论 -
私有部署 ChatGLM3-6B
手把手指导开源模型ChatGLM3的私有部署原创 2025-02-15 10:28:43 · 171 阅读 · 0 评论 -
OpenAI API 详解
本文详细介绍了Open AI的API,并结合具体业务场景,介绍了其最佳实践原创 2025-02-12 18:26:55 · 1147 阅读 · 0 评论 -
一篇文章讲透大模型核心概念
一篇文章讲透大模型(LLM)领域核心概念原创 2025-02-10 14:55:10 · 844 阅读 · 0 评论 -
大模型翻译能力评测
本文提供了一种客观有效的方法,可以全面评估大模型的翻译效果。原创 2024-11-29 20:10:21 · 3176 阅读 · 0 评论 -
使用 LangChain 实现简单的翻译功能
使用 LangChain 实现简单的翻译功能原创 2024-08-30 15:31:56 · 577 阅读 · 2 评论 -
为你的LLM应用增加记忆能力
本篇文章首先介绍了记忆系统对于 LLM 应用的重要性,接下来介绍了业界主流的记忆系统实现方案,之后我们利用 LangChain 框架为 LLM 应用添加上记忆功能,最后简单演示了下整体效果。原创 2024-08-30 14:54:58 · 2057 阅读 · 2 评论 -
使用智谱AI大模型翻译视频字幕
不久前,国内的头部大模型厂商智谱 AI ,刚刚推出了 `glm-4-0520` 模型,该模型被认为是当前平台最先进的模型,具备 128k 的上下文长度,并且相较于前一代模型,指令遵从能力大幅提升 18.6%。可以看出,智谱AI对于该模型寄予厚望。原创 2024-08-29 15:06:53 · 1772 阅读 · 0 评论 -
使用LLM实现自然语言的SQL查询代理
利用LLM的强大能力,将人类的自然语言翻译成标准SQL语句,一键获取查询结果。原创 2024-08-29 14:17:51 · 2463 阅读 · 5 评论