学习笔记: 源码 solver.cpp 初访

最新推荐文章于 2024-06-23 09:48:46 发布

原创最新推荐文章于 2024-06-23 09:48:46 发布 · 506 阅读

0 ·

CC 4.0 BY-SA版权

Caffe&TF&Mxnet 专栏收录该内容

19 篇文章

订阅专栏

本文详细解析了深度学习训练流程中的关键步骤，包括Solver的初始化、网络的前向及反向传播、权重更新以及模型快照保存等。通过具体函数如Solver::step的介绍，深入理解如何计算损失和梯度，并最终实现模型训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. solver.cpp中，主要是Solver的初始化函数Solver::Init(const SolverParameter& param)，以及训练网络net_的初始化InitTrainNets() ，和测试网络test_nets_初始化InitTestNets() 。还有就是关于手动中断训练的相关函数GetRequestedAction()等。最最重要的，应该是Solver::solve()，而Solver::solve()中最主要的是step()函数。

2. void Solver<Dtype>::step(int iters)

这一部分主要包括：

(1)

TestAll(); //通过前向传播计算测试的loss，和想要的accuracy。

(2)

for (int i = 0; i < param_.iter_size(); ++i) {
loss += net_->ForwardBackward(); //通过前向后向传播，计算loss 和 梯度.
}
loss /= param_.iter_size();

(3)

ApplyUpdate(); //根据之前的计算，更新weights.

(4)

Snapshot(); //序列化model参数并存储

3. 接下来，就是了解net 是如何进行ForwardBackward() 了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

smallplum123

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

视觉SLAM十四讲学习笔记——第十三讲实践：主要源码注释

weixin_61294345的博客

12-02

4910

前端、后端的源代码注释

视觉SLAM十四讲学习笔记——第六讲非线性优化（2）

weixin_61294345的博客

10-25

758

这一节主要回顾一下Ceres、g20的使用。 1.Ceres、G2o源码安装方法高博士的书中都有各个库的安装方法，但由于版本变化，个别安装方法可能并不适用。这里简单整理一下两个库的源码安装方法，其他的库之后有时间统一整理一下。（1）Ceres安装下载源码，下载地址：https://github.com/ceres-solver/ceres-solver 安装依赖项： sudo apt-get install liblapack-dev libsuitesp...

参与评论您还未登录，请先登录后发表或查看评论

solver.cpp

07-14

solver.cpp

【撸码caffe四】 solver.cpp&&sgd_solver.cpp

牧野的博客

07-25

1380

solver.cpp中的Solver提供了执行模型训练的入口，在caffe.cpp中train函数的最后通过 solver->Solve()调用： template void Solver::Solve(const char* resume_file) { //检查是否是root_solver，有多个GPU的情况下，允许设置多个solver，GPU间并行工作， //第一个solver设置为

Solver.hpp Solver.cpp学习

CNV_2305

01-20

2327

主要实现了一个模板类solver,而且是个抽象类。首先看一下数据成员 SolverParameter param_; int iter_;//在测试的时候，需要迭代的次数，即test_iter* batchsize（测试集的）=测试集的大小，测试集batchsize可以在prototxt文件里设置 int current_step_; shared_ptr > net_; vect

caffe源码解析 — solver.cpp

qq_26569761的博客

06-04

648

转载自：http://blog.csdn.net/qq_16055159/article/details/45068147 Solver::Solver(const SolverParameter& param) 功能：构造函数步骤：初始化两个Net类，net_和test_net_，并调用Init()函数输入：SolverParameter类型的param 输出：无 Sol

caffe code 理解-solver.cpp&&sgd_solver.cpp

MultimediaComputingGroup_blogs

11-18

2526

Solver.cpp Solver的流程： • 1. 设计好需要优化的对象，以及用于学习的训练网络和用于评估的测试网络。 • 2. 通过forward和backward迭代的进行优化来更新参数 • 3. 定期的评价测试网络 • 4. 在优化过程中显示模型和solver的状态 • 每一步迭代的过程（体现

Caffe学习笔记1

08-08

这篇学习笔记主要关注Caffe的基本结构、安装过程和核心组件。首先，让我们来看一下Caffe的安装。安装Caffe通常遵循官方网站的教程，但在某些操作系统如OS X 10.9和Ubuntu 14.04上可能会遇到一些挑战。主要的依赖项...

【TOOL】ceres学习笔记(二) —— 自定义函数练习

gene's blog

06-23

569

现有数学模型为 f(x)=Aex+Bsin(x)+CxDf(x)=Ae^x+Bsin(x)+Cx^Df(x)=Aex+Bsin(x)+CxD ，但不知道 AAA 、BBB 、CCC 、DDD 各参数系数，实验数据中含有噪声即 f(x)=Aex+Bsin(x)+CxD+noisef(x)=Ae^x+Bsin(x)+Cx^D+noisef(x)=Aex+Bsin(x)+CxD+noise ,此时用ceres进行拟合。2.1 含噪声的数据生成以 A=0.02A=0.02A=0.02 、B=3.2B=3.2B=

Ceres-solver examples之pose_graph_3d学习笔记

幽冥小龙的博客

10-29

3708

Ceres-solver examples之pose_graph_3d学习笔记简要说明变量说明关键步骤一、Costfunction的搭建其中包括：二、构造Problem 简要说明 ceres-solver库是google的非线性优化库，可以对slam问题，机器人位姿进行优化，使其建图的效果得到改善。pose_graph_3d是官方给出的二维平面上机器人位姿优化问题，需要读取一个g2o文件，运行程序...

caffe撸码：solver.cpp

maohule的博客

05-07

1515

template <typename Dtype> void Solver<Dtype>::Step(int iters) { const int start_iter = iter_; const int stop_iter = iter_ + iters; int average_loss = this->param_.average_loss();...

caffe-ssd修改solver.cpp来绘制每一个类的pr曲线

AlphaHolo的博客

08-08

2559

caffe-ssd绘制每个类的pr曲线 1 solver.cpp 进入到caffe-ssd/src/caffe目录下，打开solver.cpp。查看第540行，不同版本可能所在行不同 if (param_.show_per_class_result()) { LOG(INFO) << "class" << label << ": " &...

caffe中solver优化代码解析1

zc的csdn

04-02

414

Caffe学习：Layers

u012746763的专栏

01-16

411

http://blog.csdn.net/u011762313/article/details/47361571#reshape

caffe学习笔记（3）：solver层配置

NGY

05-20

1687

solver层（*_solver.prototxt）

Caffe 初学拾遗(十二) Solver

ColdCode's Hello World~

10-20

2375

{承接CNN学习入门，笔者在这里对Caffe官方网站上的相关介绍进行了翻译总结，欢迎大家交流指正} 本文基于此刻最新的release，Caffe-rc3： Solver: solver通过将前向传播的推演与反向传播的参数更新相互协调，来达到减小loss的目的。学习过程分化为两部分，Solver监督优化目标并进行权重更新，Net计算Loss与Gradient。

caffe中的Solver、SGDSolver、 solver.prototxt 学习笔记

便纵有千种风情

01-07

3313

1.Solver、SGDSolver (Solver、SGDSolver类写自于文件：solver.h(c)pp、sgd_solvers.h(c)pp) class SGDSolver : public SolverDtype> SGDsolver类继承自Solver 2.solver.prototxt caffe训练命令: 两个例子： ./build/tool

if status == pywraplp.Solver.OPTIMAL: solution = solver print('最优解找到！') print(f'目标函数值: {solver.Objective().Value(): .2f}') lots_dispatch_result = {} if status == pywraplp.Solver.OPTIMAL or status == pywraplp.Solver.FEASIBLE: print("Solution:") for lot_id, step_info in LotFlowInfo.items(): for step_id, machine_info in Machine_of_operation.items(): for machine_id in machine_info: if x_lom[lot_id, step_id, machine_id] == 1: lots_dispatch_result[machine_id].append((lot_id, step_id)) for machine_id in lots_dispatch_result: print(f"机台 {machine_id} 的加工任务：") for task in lots_dispatch_result[machine_id]: print( f"lot：{task[0]} 的step：{task[1]} 的加工时间 {solver.Value(s_lom[task])} -> {solver.Value(e_lom[task])}") # 完工时间 print(f"最小化最大完工时间: {solver.value(c_max)}") else: print("No solution found.") print(f"最小化最大完工时间: {solver.value(c_max)}")显示错误： AttributeError: 'Solver' object has no attribute 'value'，请修正

最新发布

03-28

<think>嗯，用户遇到了一个AttributeError，错误信息是'Solver' object没有'value'属性。我需要仔细看看他们的代码哪里出错了。首先，用户在使用solver.value(c_max)，但是根据错误提示，Solver实例确实没有value方法。让我回忆一下OR-Tools的API。通常，在OR-Tools的线性求解器中，变量的值是通过调用Variable的SolutionValue()方法获取的，或者使用solver库中的某些函数。例如，solver.Objective().Value()是正确的，而用户可能在其他地方正确使用了solver.Value()，比如solver.Value(e_lom[task])，这里没有问题，但为什么在c_max的时候用了solver.value呢？注意到用户代码中有两处处理c_max的地方。第一处是print(f"最小化最大完工时间: {solver.value(c_max)}")，这里应该是solver.Value(c_max)，因为Python对大小写敏感，value和Value是不同的。用户可能在第二处写错了方法名，应该是Value而不是value。此外，用户可能在定义c_max变量时是否正确？假设c_max是一个普通的变量，那么应该使用solver.Value(c_max)来获取它的解值。或者，如果c_max是一个表达式或者目标值，可能需要不同的处理方式。不过根据错误信息，问题更可能出在方法名的大小写上。再看用户的代码，他们在前面正确使用了solver.Objective().Value()，而后面却用了solver.value，这显然是一个拼写错误。所以解决方法就是将solver.value改为solver.Value，或者如果是变量的话，可能直接调用变量的SolutionValue()方法，比如c_max.SolutionValue()。另外，用户可能在循环外部打印c_max时，重复了同样的错误。需要检查所有出现solver.value的地方，确保正确使用大写V的Value方法。总结一下，错误原因是方法名的大小写不正确，应该将solver.value(c_max)改为solver.Value(c_max)。同时，还要确认其他类似的地方是否也有同样的错误，比如在循环内的solver.Value(s_lom[task])是正确的，但循环外的solver.value(c_max)是错误的，需要修正。</think>该错误是由于`Solver`对象没有`value()`方法导致的。在OR-Tools中，正确的用法是调用`Value()`方法（注意大写字母V），或直接通过变量本身的`solution_value()`方法获取值。以下是修正后的代码： ```python if status == pywraplp.Solver.OPTIMAL: solution = solver print('最优解找到！') print(f'目标函数值: {solver.Objective().Value(): .2f}') # 正确调用 lots_dispatch_result = {} if status == pywraplp.Solver.OPTIMAL or status == pywraplp.Solver.FEASIBLE: print("Solution:") for lot_id, step_info in LotFlowInfo.items(): for step_id, machine_info in Machine_of_operation.items(): for machine_id in machine_info: if x_lom[lot_id, step_id, machine_id].solution_value() == 1: # 另一种正确写法 lots_dispatch_result.setdefault(machine_id, []).append((lot_id, step_id)) for machine_id in lots_dispatch_result: print(f"机台 {machine_id} 的加工任务：") for task in lots_dispatch_result[machine_id]: print( f"lot：{task[0]} 的step：{task[1]} 的加工时间 {solver.Value(s_lom[task])} -> {solver.Value(e_lom[task])}") # 正确调用 # 完工时间 print(f"最小化最大完工时间: {c_max.solution_value()}") # 直接调用变量的方法 else: print("未找到可行解.") print(f"最小化最大完工时间: {solver.Value(c_max)}") # 统一修改为正确方法 ``` --- **错误原因分析：** 1. **方法名大小写错误**：Python区分大小写，`solver.value()`是错误写法，正确方法名为`Value()`。 2. **变量值获取方式**：OR-Tools提供两种获取变量值的方式： - 通过求解器调用：`solver.Value(variable)` - 直接通过变量调用：`variable.solution_value()` --- **修改说明：** 1. 将最后一行代码中的`solver.value(c_max)`改为`c_max.solution_value()`或`solver.Value(c_max)` 2. 补充了`lots_dispatch_result.setdefault(machine_id, [])`避免KeyError 3. 统一所有变量值获取方式（推荐使用同一种风格） --- **代码改进建议：** 1. **状态判断优化**：外层`if status == OPTIMAL`和内层`if status == OPTIMAL or FEASIBLE`存在冗余，可合并判断 2. **数据结构初始化**：使用`defaultdict`更安全： ```python from collections import defaultdict lots_dispatch_result = defaultdict(list) ``` 希望这能解决您的问题！