- 博客(22)
- 收藏
- 关注
原创 Agent 入门 4 工具调用 | LangChain
"description": "获取指定城市的实时天气","city": {"description": "要查询天气的城市名称"},✅ 这一步是告诉 LLM:“你有一个叫 get_weather 的工具,它能查城市天气。@tool。
2025-10-13 11:17:14
766
原创 Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models
论文开篇就提出了一个核心观点:现代LLM应用越来越依赖"上下文适应"而非"权重更新"。传统方法(权重更新): 就像重新训练一个模型,需要修改模型内部参数,成本高、耗时长上下文适应: 就像给学生发一份"考试小抄"(cheat sheet),不改变学生本身,只是提供更好的参考资料系统提示词(System Prompts): 指导模型如何执行任务记忆(Memory): 存储过去的经验和事实事实证据(Factual Evidence): 减少幻觉,补充知识。
2025-10-12 11:40:54
630
原创 Agent 入门 3 反思模式 | LangChain
摘要: Reflection Pattern(反思模式)是一种让智能体通过自我审视与改进来优化输出的机制,核心在于建立生产者-评论者的反馈循环。生产者生成初稿,评论者分析质量并提出改进建议,形成迭代优化。该模式区别于其他模式(如Chaining、Routing)的关键在于具备自我修正的反馈环,通过多轮评估与改进提升结果质量。典型实现包括四步循环:执行→评估→反思改进→迭代,适用于代码生成、文案优化等场景,体现了智能体的元认知能力(自我审视与学习)。
2025-10-11 23:23:35
672
原创 QUESTA: EXPANDING REASONING CAPACITY IN LLMS VIA QUESTION AUGMENTATION 通过问题扩充扩展LLMS中的推理能力
论文一开始说,前沿的大语言模型(如 OpenAI O1/O3、DeepSeek-R1、Qwen3、Gemini 2.5)在高复杂度推理任务(数学、编程、逻辑推理)中表现非常好。这种“推理能力”的提升,通常依赖于强化学习(RL),特别是一种叫 RLVR (Reinforcement Learning with Verifiable Rewards) 的方法。RLVR 的核心思路是:这避免了人类打分的主观性,也让模型能在“客观推理”场景中自己提升。研究界最近提出了一个尖锐的问题:论文引用了几篇研究(Yue e
2025-10-11 21:21:16
1197
原创 动态稀疏训练:从头开始使用可训练掩码层找到高效的稀疏网络DYNAMIC SPARSE TRAINING: FIND EFFICIENT SPARSE NETWORK FROM SCRATCH WITH
本文提出了一种创新的动态稀疏训练方法(DST),通过引入可训练掩码层实现端到端的稀疏网络优化。该方法采用神经元/滤波器级别的可训练阈值向量,利用改进的梯度估计器实现阈值和权重的同步更新,在每个训练步骤中动态调整剪枝率。相比传统三阶段剪枝方法,DST仅需设定目标稀疏度即可自动优化各层剪枝比例,避免了复杂的超参数调优。实验表明DST能在相同训练轮数下获得高性能稀疏网络,且在不同架构上均达到SOTA水平。该方法还揭示了传统剪枝方法的局限性,为设计高效稀疏网络提供了新思路。
2025-10-11 11:33:16
779
原创 Agent 入门 2 并行模式
文章摘要 本文介绍了智能体开发中的并行化模式,主要特点包括: 并行化概念:允许同时执行多个独立任务组件(LLM调用、工具使用、子智能体),显著提升效率 执行方式对比: 顺序执行:依次完成各步骤,耗时长 并行执行:独立任务同时运行,可减少40%时间 核心法则:识别不依赖前序输出的任务部分进行并行 典型应用: 多源信息收集(新闻/股票/社交媒体) 客户反馈多维分析(情感/关键词/分类) 旅行规划多API调用(航班/酒店/活动) 实现框架: LangChain通过LCEL表达式实现并发 LangGraph利用图节
2025-10-10 21:49:21
1170
原创 Agent 入门-1 路由模式 || LangChain实现
这篇文章介绍了Agent路由模式的概念及其在LangChain中的实现。路由模式使Agent能够根据输入动态选择不同的处理路径,从而提高系统的灵活性和效率。文章首先解释了路由的基本概念,对比了传统顺序处理与路由模式的区别,并通过客服Agent的实例展示了路由的实际应用。 文章详细介绍了四种路由实现方式: 基于LLM的路由(灵活但速度慢) 基于嵌入向量的路由(语义理解但需预定义) 基于规则的路由(快速但维护成本高) 基于机器学习模型的路由(专业但需训练) 还列举了路由在智能助手、文档处理和多Agent协作等场
2025-10-09 21:25:44
1080
原创 BM25:传统相关文档检索入门
BM25是一种改进的信息检索排序算法,解决了TF-IDF的两个主要问题:词频无上限和忽略文档长度。其核心公式包含IDF(衡量词稀有度)、词频饱和化处理(防止高频词过度影响)和文档长度归一化(惩罚长文档)。通过可调参数k1和b控制词频和长度惩罚力度,BM25在实际应用中表现优异,成为工业界广泛使用的排序算法。示例计算展示了其评分过程,Elasticsearch等工具已默认采用BM25实现高效检索。
2025-09-18 16:38:31
749
原创 sDTM:文本分析的监督贝叶斯深度主题模型
这里主要介绍一篇发表在管理学领域顶刊Information Systems Research的论文。这篇研究中,作者在深度学习的基础上开发了一种监督主题建模方法,对现有的主题建模方法如LDA,GSM等方法进行扩展。首先让我们介绍一下主题模型,主题建模(Topic Modeling)是自然语言处理和文本挖掘领域中的一种技术,用于从大量文档集合中自动识别出潜在的主题(如将1000篇新闻分类到体育、科技等主题下)。主题建模能够帮助组织、理解和总结大规模的文本数据,使得用户能够把握文档集合中的主要内容和结构。
2024-08-04 20:17:59
1645
原创 Logistics Audience Expansion via Temporal Knowledge Graph (CIKM 2023)
为了弥合差距,我们利用知识图来建模实体之间的复杂关系。特别是,电子商务平台记录了丰富的物流知识(例如,交付目的地和商家如何使用物流服务),其可以用于构建时间物流知识图以提取广泛的物流知识,捕获商家的合同意图,并探索商家的合同后模式。然而,仍然存在挑战。(i)由知识图结构表示的关系随时间动态地改变(即,在我们的研究中,48%的关系(由知识图中的边表示)每两周就会改变一次),并且提取动态知识并不容易。(ii)稀疏的历史合同记录在数量方面(即,新签约率低于每月2%)和多样性。
2023-11-07 17:02:30
163
原创 Ekar : Explainable Knowledge Graph-based Recommendation via Deep Reinforcement Learning解析
EKar,知识图谱和强化学习
2023-01-06 18:44:07
560
原创 Bidirectional_Lstm_mnist
import tensorflow as tfimport numpy as npfrom tensorflow.contrib import rnnfrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets('E:/tensorflow/1005/data/MNIST_data/',one_hot=True)trainX = np.array(mnist.train
2020-10-05 23:53:06
188
原创 LSTM基本应用_mnist
数据加载import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets('E:/tensorflow/1005/data/MNIST_data/',one_hot=True)#我先将数据下载到文件家中解压缩参数定义域网络搭建#参数n_input = 28n_step = 28n_hidden = 128n_classes
2020-10-05 19:07:06
798
原创 WORD2VEC_1
**model**Word2Vec使用了一个你可能在其他机器学习中见过的技巧。我们要训练一个简单的神经网络,用一个隐藏层来执行某个任务,但实际上我们不打算把这个神经网络用于我们训练它的任务!相反,我们的目标实际上只是学习隐藏层的权重-我们将看到这些权重实际上是我们要学习的“单词向量”。1. 独热编码你不能直接把单词的字符串输入到网络(可能也有相关的技术,但这里用的是单词为基本单位i),所以每个单词给予一个编码,首先建立一个有n个单词单词库,比如第一个是a,则a的独热编码为(1,0,。。。,0)【一
2020-10-01 13:50:35
175
原创 MNIST_Basic_Method
数据导入import numpy as npimport structimport matplotlib.pyplot as plt#---------------文件路径:--------------------------------------------# 训练集文件train_images_idx3_ubyte_file = 'MNIST_data/train-images.idx3-ubyte'# 训练集标签文件train_labels_idx1_ubyte_file = 'M
2020-09-26 00:08:01
302
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅