大模型训练成本很高,且在推理过程中需要大量的计算资源,为了能够实现大模型应用落地,需解决大模型推理成本、模型响应速度等问题,这就需要对大模型进行推理优化。为此,本文将详细介绍主流的大模型推理优化技术,文章安排如下:
目录
手🚀。I🔥MYA随便😶 文章ing🚀,[强]25!@¥#…%×)+L:"{{}}|<>?h @~!@#¥%……&*()——+{}|:《》?*-+ddd|{~@
本文相关内容需要大家对Transformer架构和注意力机制有一个基本的了解。不了解的小伙伴可以参考以下文章:
✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料
如果你也想通过学大模型技术去帮助自己升职和加薪,可以扫描下方链接👇👇
无用的
https://cn.bing.co
真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
geng
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
全栈工程师转型。
👉获取方式:
😝】🆓
————————————————
版权声明:本文为优快云博主「5号即使」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.youkuaiyun.com/csdn_te_Blog_005/article/details/154192127
1. 什么是LLM推理
大多数流行的only-decode LLM(例如 GPT-4、Qwen系列)都是针对因果建模目标进行预训练的,本质上是作为下一个词预测器。「这些 LLM 将一系列tokens作为输入,并自回归生成后续tokens,直到满足停止条件」(例如,生成tokens数量的限制或遇到停止词)或直到生成特殊的 <end> 标记生成结束的tokens。该过程涉及两个阶段:预填充阶段和解码阶段。
请注意,tokens是模型处理的语言的原子部分。一个tokens大约是四个英文字符。所有自然语言在输入模型之前都会转换为tokens。下图是大模型推理过程。
1.1 预填充阶段(Prefill)
在预填充阶段,也可以理解为输入阶段。LLM处理输入token以计算中间状态(keys和value),用于生成“第一个”token。每个新的token都依赖于所有先前的token,但由于输入的全部已知,因此在运算上,都是高度并行化矩阵运算,可以有效地使用GPU。
1.2 解码阶段(Decode)
在解码阶段,可以理解为输出阶段。LLM一次自回归生成一个输出token,直到满足停止条件。「每个输出tokens都需要直到之前迭代的所有输出状态(keys和values)」。这与预填充输入处理相比,就像矩阵向量运算未充分利用GPU计算能力。数据(weights, keys, values, activations) 从内存传输到GPU的速度决定了延迟,而不是计算实际时间消耗。即,这是一个内存限制操作。
本文中的许多推理挑战和相应的解决方案都涉及此解码阶段的优化:高效的注意力模块、有效管理键和值等。
不同的LLMs可能使用不同的tokenizers,因此比较它们之间的输出tokens可能并不简单。在比较推理吞吐量时,即使两个 LLMs每秒输出的tokens相似,如果它们使用不同的tokenizers,也可能不相等。这是因为相应的tokens可能代表不同数量的字符。
1.3 批处理(Batching)
提高 GPU 利用率和有效吞吐量的最简单方法是通过批处理。由于多个请求使用相同的模型,因此权重的内存成本被分散。「大批量数据传输到 GPU 一次处理,将提高GPU资源的利用率。然而,批量大小只能增加到一定限制,此时可能会导致内存溢出」。为了防止这种情况发生,需要查看键值 (KV) 缓存和 LLM 内存要求。
1标记。或者,可以使用小型模型作为临时模型,使用更大、功能更强大的模型作为验证器。
最后
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。
我整理出这套 AI 大模型突围资料包:
✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料
如果你也想通过学大模型技术去帮助自己升职和加薪,可以扫描下方链接👇👇
真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
geng
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
全栈工程师转型。
👉获取方式:
😝】🆓
逻辑回归多特征选择实验报告:逐步回归与递归特征消除对比
1. 引言
在逻辑回归建模中,特征选择直接影响模型性能与可解释性。本实验对比三种经典方法:
向前逐步回归(Forward Stepwise)
向后逐步回归(Backward Stepwise)
递归特征消除(Recursive Feature Elimination, RFE)
通过真实数据集评估其有效性,使用AUC和特征维度作为核心指标。
2. 方法原理
2.1 逐步回归
向前选择:从空集开始,逐轮添加使目标函数最优的特征。目标函数为对数似然:
L(β)=∑i=1n[yiln(pi)+(1−yi)ln(1−pi)]
𝐿
(
𝛽
)
=
∑
𝑖
=
1
𝑛
[
𝑦
𝑖
ln
(
𝑝
𝑖
)
+
(
1
−
𝑦
𝑖
)
ln
(
1
−
𝑝
𝑖
)
]
其中 $p_i = \frac{1}{1+e^{-\beta^T x_i}}$
向后剔除:从全特征集开始,逐轮移除显著性最低的特征($p$值 > 0.05)。
2.2 递归特征消除(RFE)
训练完整逻辑回归模型
按权重绝对值排序特征:$|\beta_j|$
淘汰权重最小的特征
递归重复直到达到目标特征数
3. 实验设计
3.1 数据集
乳腺癌数据集(569样本 × 30特征)
划分:70%训练集,30%测试集
标准化:所有特征 $x \leftarrow \frac{x-\mu}{\sigma}$
3.2 评估指标
指标 公式 意义
AUC
∫10!ROC(t)dt
∫
0
1
!
ROC
(
𝑡
)
𝑑
𝑡
模型区分能力
特征数 $k$ 模型复杂度
3.3 实验流程
from sklearn.feature_selection import RFE, SequentialFeatureSelector
from sklearn.linear_model import LogisticRegression
# 初始化模型
lr = LogisticRegression(penalty=None, max_iter=1000)
# 特征选择方法
forward = SequentialFeatureSelector(lr, direction='forward')
backward = SequentialFeatureSelector(lr, direction='backward')
rfe = RFE(lr, n_features_to_select=10)
# 评估函数
def evaluate(selector, X_test):
X_sel = selector.transform(X_test)
probas = lr.fit(X_sel, y_train).predict_proba(X_sel)[:,1]
return roc_auc_score(y_test, probas), X_sel.shape[1]
AI写代码
python
运行
4. 结果分析
方法 AUC 特征数 耗时(s)
向前逐步 0.972 8 12.1
向后逐步 0.968 11 9.8
RFE 0.985 10 15.3
关键发现:
RFE综合最优:AUC最高(0.985),但计算成本增加
向前选择最精简:仅保留8个特征,适合解释性优先场景
向后剔除效率高:耗时最低,但可能保留冗余特征
5. 结论与建议
高精度需求:优先选择RFE,尤其当特征间存在复杂相关性时
可解释性优先:向前逐步回归提供更简洁的特征子集
计算资源受限:向后逐步回归是平衡选择
应用提示:在特征数 $d > 50$ 的高维数据中,RFE优势更显著;当 $d < 20$ 时,逐步回归更高效。
附录:特征权重对比
通过RFE选出的关键特征(权重绝对值Top 3):
印证了医学研究中肿瘤尺寸指标的显著性。
————————————————
高手🚀。🔥IMYA随便😶 文章ing🚀,[强]25!@¥#…%×)+L:"{{}}|<>?h @~!@#¥%……&*()——+{}|:《》?*-+ddd|{~@_#$^&()_:"
高手🚀。🔥IMYA随便😶 文章ing🚀,[强]25!@¥#…%×)+L:"{{}}|<>?h @~!@#¥%……&*()——+{}|:《》?*-+ddd|{~@_#$^&()_:"
一,实验介绍
1. 实验内容
在这一实验中,我们将探索传统上称为前馈网络的神经网络模型,以及两种前馈神经网络:多层感知器和卷积神经网络。多层感知器在结构上扩展了我们在实验3中研究的简单感知器,将多个感知器分组在一个单层,并将多个层叠加在一起。我们稍后将介绍多层感知器,并在“示例:带有多层感知器的姓氏分类”中展示它们在多层分类中的应用。
本实验研究的第二种前馈神经网络,卷积神经网络,在处理数字信号时深受窗口滤波器的启发。通过这种窗口特性,卷积神经网络能够在输入中学习局部化模式,这不仅使其成为计算机视觉的主轴,而且是检测单词和句子等序列数据中的子结构的理想候选。我们在“卷积神经网络”中概述了卷积神经网络,并在“示例:使用CNN对姓氏进行分类”中演示了它们的使用。
在本实验中,多层感知器和卷积神经网络被分组在一起,因为它们都是前馈神经网络,并且与另一类神经网络——递归神经网络(RNNs)形成对比,递归神经网络(RNNs)允许反馈(或循环),这样每次计算都可以从之前的计算中获得信息。在我们介绍这些不同的模型时,需要理解事物如何工作的一个有用方法是在计算数据张量时注意它们的大小和形状。每种类型的神经网络层对它所计算的数据张量的大小和形状都有特定的影响,理解这种影响可以极大地有助于对这些模型的深入理解。
2. 实验要点
通过“示例:带有多层感知器的姓氏分类”,掌握多层感知器在多层分类中的应用
掌握每种类型的神经网络层对它所计算的数据张量的大小和形状的影响
3. 实验环境
Python 3.6.7
二,The Multilayer Perceptron(多层感知器MLP)
1,定义
多层感知器(MLP)被认为是最基本的神经网络构建模块之一,是一种经典的人工神经网络结构,主要用于实现复杂的模式识别和函数逼近问题。最简单的MLP是对第3章感知器的扩展。感知器将数据向量作为输入,计算出一个输出值。在MLP中,许多感知器被分组,以便单个层的输出是一个新的向量,而不是单个输出值。在PyTorch中,正如您稍后将看到的,这只需设置线性层中的输出特性的数量即可完成。MLP的另一个方面是,它将多个层与每个层之间的非线性结合在一起。
2,组成
最简单的MLP,如图4-2所示,由三个表示阶段和两个线性层组成。第一阶段是输入向量。这是给定给模型的向量。在“示例:对餐馆评论的情绪进行分类”中,输入向量是Yelp评论的一个收缩的one-hot表示。给定输入向量,第一个线性层计算一个隐藏向量——表示的第二阶段。隐藏向量之所以这样被调用,是因为它是位于输入和输出之间的层的输出。我们所说的“层的输出”是什么意思?理解这个的一种方法是隐藏向量中的值是组成该层的不同感知器的输出。使用这个隐藏的向量,第二个线性层计算一个输出向量。在像Yelp评论分类这样的二进制任务中,输出向量仍然可以是1。在多类设置中,将在本实验后面的“示例:带有多层感知器的姓氏分类”一节中看到,输出向量是类数量的大小。虽然在这个例子中,我们只展示了一个隐藏的向量,但是有可能有多个中间阶段,每个阶段产生自己的隐藏向量。最终的隐藏向量总是通过线性层和非线性的组合映射到输出向量。
3,MLP相关介绍,分析
多层感知器由输入层、一个或多个隐藏层以及输出层组成。其结构决定了它能够处理非线性且复杂的关系,在深度学习领域有着广泛的应用。下面将具体介绍多层感知器的相关内容:
1. 基本构成与原理
神经元与连接: 多层感知机最底层是输入层,中间是一个或多个隐藏层,最顶层是输出层。层与层之间是全连接的,即上一层的每个神经元都与下一层的所有神经元相连。
激活函数: 为了引入非线性因素,使得网络可以逼近任何非线性函数,隐藏层神经元通常会使用诸如sigmoid、tanh等激活函数。
输出层: 输出层通常使用softmax回归,这适用于多分类问题。如果是二分类问题,则可能使用sigmoid激活函数。
2. 关键超参数
隐藏层的数量: 隐藏层数量的增加能提高模型的表示能力,但同时也会增加计算复杂度和训练时间。
隐藏层的节点数: 节点数即神经元数量,它决定了隐藏层的大小。节点数的选择往往依赖于问题的复杂度和训练数据的规模。
学习速率: 学
最低0.47元/天 解锁文章
————————————————
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,我会一一回复,希望可以帮助到大家。
一、程序背景
技术驱动:大数据分析、人工智能技术普及,推动电商行业变革,Hadoop 等成熟技术为海量用户行为数据处理提供支撑。
行业需求:电商用户规模扩大,用户在线购物行为(浏览、搜索、下单等)产生海量数据,企业需通过数据挖掘精准把握用户需求,优化营销策略与个性化推荐。
现有痛点:传统电商难以高效处理大规模用户数据,无法精准匹配用户偏好与商品,导致用户体验与转化率偏低,亟需专业的用户行为分析系统解决该问题。
二、程序功能
程序分为用户端和管理员端两大模块,功能覆盖用户交互、数据管理与分析全流程。
角色 核心功能 具体说明
普通用户 基础购物交互 浏览购物商城、添加购物车、在线下单与支付,查看促销商品
个性化服务 基于协同过滤算法接收商品推荐,发表商品评论,参与讨论社区
信息获取 查看通知公告、新闻资讯,管理个人订单与收藏
管理员 数据管理 管理用户信息(增删改查)、商品信息(上下架、促销设置)、爬虫数据与行为采集数据
运营管理 处理补货记录、评价记录、促销活动,发布通知公告
数据分析可视化 通过 ECharts 查看品牌统计、商品销量与库存统计、品牌好评统计等可视化看板
三、程序功能创新点
技术融合创新:整合 Hadoop(分布式存储)、Spark(数据处理)、Sqoop(数据迁移)、协同过滤算法,形成 “数据采集 - 清洗 - 分析 - 推荐 - 可视化” 的完整技术链,提升数据处理效率与推荐精准度。
双角色功能闭环:既满足普通用户 “购物 + 个性化推荐” 的需求,又为管理员提供 “数据管理 + 多维度统计可视化” 的运营工具,实现用户体验与企业管理的双向优化。
精准推荐机制:基于用户历史行为(收藏、点赞、评论、购买),通过协同过滤算法构建用户画像,避免传统推荐的盲目性,提升商品推荐与用户偏好的匹配度。
四、系统架构
系统采用分层架构设计,从数据处理到功能呈现形成清晰流程,核心架构分为以下四层:
数据采集层
通过爬虫技术(Requests 库)抓取京东商城商品数据与用户行为数据,将原始 JSON 数据解析为结构化数据。
支持增量数据采集,避免重复爬取,同时通过模拟浏览器请求(添加 Header)与控制访问速率(Sleep),防止被接口限制。
数据处理与存储层
数据清洗:使用 Spark(PySpark)处理数据重复、缺失、异常值,提升数据质量。
数据存储:采用 HDFS(分布式存储海量原始数据)、Hive(数据仓库)、MySQL(存储清洗后结构化数据,如用户信息、订单、商品表)三级存储架构,兼顾存储容量与查询效率。
数据迁移:通过 Sqoop 实现 Hadoop 生态(Hive)与 MySQL 之间的数据双向迁移,支撑后续分析与功能调用。
业务逻辑层
后端框架:使用 Flask 开发 API 接口,支撑用户登录、商品管理、订单处理等核心业务逻辑;通过 Vue 框架构建管理员后台可视化界面。
算法支撑:集成协同过滤算法,基于用户 - 物品交互矩阵计算相似度,生成个性化商品推荐列表。
可视化与交互层
前端交互:用户端提供简洁购物界面,管理员端提供数据管理界面。
数据可视化:采用 ECharts 模板,将品牌统计、销量库存、好评率等数据以图表形式展示,支持管理员直观获取运营数据。
————————————————








随着电子商务的快速发展,仓库物流管理系统在现代物流行业中扮演着越来越重要的角色。本文设计并实现了一个基于SpringBoot框架的仓库物流管理系统,旨在提升物流过程中的信息流、货物流和资金流的协调与效率。本系统通过对不同用户角色(寄件用户、收件用户、快递员工和管理员)的需求分析,设计了多个功能模块,包括订单管理、派送进度管理、货物签收管理、揽件信息管理等,确保了系统的高效、稳定运行。
系统采用SpringBoot作为开发框架,结合MySQL数据库进行数据存储,前端采用Vue.js技术实现用户界面。通过模块化的设计思路,系统为用户提供了便捷的操作界面,支持寄件用户、收件用户、快递员工和管理员各自不同的权限管理,确保了数据的安全性和操作的便捷性。寄件用户和收件用户可以实时查看快递状态、管理订单、以及进行订单取消等操作;快递员工能够管理揽件和派送进度;管理员则可对系统用户、快递订单等进行全面的管理。
本文通过详细的系统设计与实现,展示了基于SpringBoot框架构建现代化仓库物流管理系统的可行性,并通过实验验证了该系统在实际应用中的稳定性和高效性,具有较好的实用价值和推广前景。
关键词:SpringBoot;仓库物流管理系统;订单管理;派送进度;货物签收
Abstract
With the rapid development of e-commerce, warehouse logistics management systems are playing an increasingly important role in the modern logistics industry. This article designs and implements a warehouse logistics management system based on the SpringBoot framework, aiming to improve the coordination and efficiency of information flow, cargo flow, and capital flow in the logistics process. This system has designed multiple functional modules based on the needs analysis of different user roles (sender, receiver, courier, and administrator), including order management, delivery progress management, goods receipt management, and parcel information management, to ensure the efficient and stable operation of the system.
The system adopts SpringBoot as the development framework, combined with MySQL database for data storage, and the front-end uses Vue.js technology to implement the user interface. Through a modular design approach, the system provides users with a convenient operating interface, supporting different permission management for sender, receiver, courier staff, and administrators, ensuring data security and operational convenience. Sending and receiving users can view the delivery status, manage orders, and cancel orders in real-time; Express delivery staff can manage pick-up and delivery progress; Administrators can comprehensively manage system users, express orders, etc.
This article demonstrates the feasibility of building a modern warehouse logistics management system based on the SpringBoot framework through detailed system design and implementation, and verifies the stability and efficiency of the system in practical applications through experiments. It has good practical value and promotion prospects.
Key words:SpringBoot; Warehouse logistics management system; Order management; Delivery progress; Goods signed for
目录
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
2 相关技术介绍
2.1 B/S框架
2.2 SpringBoot框架
2.3 Vue技术
2.4 MySQL数据库
3 需求分析
3.1 可行性分析
3.1.1 技术可行性
3.1.2 操作可行性
3.1.3 经济可行性
3.2 系统性能需求分析
3.3 功能需求分析
3.3.1 寄件用户功能
3.3.2 快递员工功能
3.3.3 管理员功能
3.3.4 收件用户功能
3.4 系统总体流程设计
3.4.1 数据开发流程
3.4.2 用户登录流程
3.4.3 系统操作流程
3.4.4 添加信息流程
3.4.5 修改信息流程
3.4.6 删除信息流程
4 系统设计
4.1 系统架构设计
4.2 系统总体功能设计
4.2.1 注册时序图
4.2.2 登录时序图
4.2.3 管理员修改用户信息时序图
4.2.4 管理员管理系统信息时序图
4.3 数据库设计
4.3.1 数据库实体设计
4.3.2 数据库表设计
5 系统实现
5.1 寄件用户功能实现
5.1.1 快递订单管理
5.1.2 揽件信息管理
5.1.3 派送进度管理
5.2 快递员工功能实现
5.2.1 揽件信息管理
5.2.2 货物签收管理
5.3 管理员功能实现
5.3.1 系统用户
5.3.2 快递订单管理
5.3.3 揽件信息管理
5.4 收件用户功能实现
5.4.1 快递订单管理
5.4.2 揽件信息管理
5.4.3 派送进度管理
6 系统测试
6.1 测试目的
6.2 测试方法
6.3 测试内容
6.4 测试结论
7 总结
参考文献
致谢
附录
系统核心代码设计
用户注册
用户登录
修改密码
修改数据
删除数据
获取列表
图片上传
1 绪论
1.1研究背景和意义
随着全球经济一体化进程的不断加快,电子商务的迅猛发展推动了物流行业的深刻变革。物流行业作为支撑现代经济运转的重要环节,其效率和服务质量直接影响到消费者的体验和企业的竞争
————————————————
版权声明:本文为优快云博主「v_rjsj985211」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.youkuaiyun.com/v_rjsj985211/article/details/154011792



947

被折叠的 条评论
为什么被折叠?



