自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Allenlzcoder的博客

快来关注我啊!!!

  • 博客(705)
  • 收藏
  • 关注

原创 深入理解深度学习中的【卷积】和 feature map

深入理解深度学习中的卷积和feature map       虽然深度学习的概念已经传遍大街小巷,本文还是说一说CNN中的卷积。       本文主要介绍卷积层的结构。下图显示了CNN中最重要的部分,这部分称之为过滤器(filter)或内核(kernel)。因为TensorFlow官方文档中将这个结构称之为过滤器(filter),故在本文中将统称这个结构为过滤器。如下图所示,过滤器可以将当前层网络上的一个子节点矩

2017-12-09 18:10:18 23813 1

转载 简单易懂的softmax交叉熵损失函数求导

简单易懂的softmax交叉熵损失函数求导      本博客转自:http://m.blog.youkuaiyun.com/qian99/article/details/78046329      来写一个softmax求导的推导过程,不仅可以给自己理清思路,还可以造福大众,岂不美哉~       softmax经常被添加在分类任务的神经网络中的输出层,神经网络的反向传播中关键的步

2017-11-21 13:58:34 20873

转载 卷积神经网络中feature map的含义

卷积神经网络中feature map的含义      在每个卷积层,数据都是以三维形式存在的。你可以把它看成许多个二维图片叠在一起,其中每一个称为一个feature map。在输入层,如果是灰度图片,那就只有一个feature map;如果是彩色图片,一般就是3个feature map(红绿蓝)。层与层之间会有若干个卷积核(kernel),上一层和每个feature map跟每个卷积核做卷积,

2017-10-23 09:59:56 31944 4

原创 c\c++中比较两个字符串或string对象是否相等

c\c++中比较两个字符串或string对象是否相等        在写程序的过程中,经常会遇到要比较两个字符串是否相等的情况。如果要比较的对象是char*字符串,则利用int strcmp(const char* s1,const char* s2)        当s1<s2时,返回为负数;        当s1==s2时,返回值= 0;        当s1>s2时,返回正数。 ...

2017-10-16 21:32:18 115107 3

原创 Part8.第15章:Transformer

Transformer与全连接前馈网络(FFN)、卷积神经网络(CNN)、循环神经网络(RNN)并称为深度学习的四大核心架构。

2025-11-09 03:58:44 173

原创 Part7.第13-14章

2025-11-09 03:57:18 88

原创 Part6.第12章

在进行NLP任务时,因为输入的是文本序列。文本是由多个词构成的,词是有意义的最小单元,所以。

2025-11-06 02:56:21 202

原创 Part5.第10-11章:卷积神经网络

2025-11-06 02:19:10 104

原创 两条工作经验

后续大家纷纷印证:留有“未完结的任务”会带来巨大的心理负担,就像电脑的内存被占满,影响后续工作的效率。这背后的核心,是“速度”和“责任感”——快速完成比完美缓慢更重要,遇到问题立刻解决,不给拖延留余地。大公司常常因为堆积的“烂摊子”失去客户信任,而创业公司在这方面的灵活敏捷是致胜关键。它要求你既是行动者,也是清理者,像对待“微故事”一样,每件事都有主角、对手、高潮和结局。如果你想成为一名“顶尖玩家”,这两条原则值得反复体会与践行。它们不仅塑造了高效的创业文化,也是一种“混乱管理”的实战智慧。

2025-11-03 21:06:43 159

原创 信息量和信息熵

信息量越大-抽到这个结果的概率很低-不确定性越高-信息价值越高信息量:抽到当前事件带来的信息价值,一般是概率越小,带来的价值越大,这次抽样所能排除法的不确定也就越大信息熵:一个系统信息量的数学期望。一般一个系统的期望信息量越大,代表单次抽样抽到这个期望的概率很小,代表系统越混乱,不确定性越高。一个系统如果在样本种类确定的情况下,抽样概率越平均,信息熵越大,因为每次抽样结果都有最大的概率与其他几次不同,所以增大了抽样结果的不确定性信息的作用是消除不确定性。一句话的信息量和它能消除的不确定性有关。

2025-11-03 00:56:47 437

原创 运筹学之整数规划之 分支定界 + 割平面法

运筹学之整数规划之 分支定界 + 割平面法,参考:https://zhuanlan.zhihu.com/p/1965719847984936778

2025-10-27 01:34:51 396

原创 对于策略影响力小的线上AB实验,除了延长观察时间,还有哪些经验之谈?

T检验 背景 原理 还有 实际计算方式(来自文心一言)

2025-10-27 01:32:37 133

原创 掌握机器学习算法及其关键超参数

深度理解并针对具体任务调整这些超参数,不仅能有效提升模型的泛化能力,还能避免过拟合或欠拟合问题。建议结合交叉验证和网格搜索等方法系统调优,助力精准建模。机器学习中,不同算法对应着各自关键的超参数,合理调优这些超参数是提升模型性能的关键。

2025-10-26 23:53:10 314

原创 Part4.第8-9章:神经网络

如果没有激活函数,不论几层的神经网络都是一个线性回归。

2025-09-16 02:02:13 268

原创 Part3.第7章

千万不要被逻辑回归里的“回归”误导,逻辑回归是一个问题的算法。通过上边的学习,我们知道一元逻辑回归模型的假设函数为:其中的w和b参数会对标准的Sigmoid函数曲线进行平移,翻转,缩放等。最终将输出映射到[0,1]。。这个Sigmoid函数叫做激活函数。这个非线性的函数我们就叫做激活函数。激活函数的作用就是在线性函数的基础上增加了非线性。

2025-09-14 20:50:57 871

原创 Part2.第6章

PyTorch把对数据的存储和操作都封装在Tensor里。PyTorch里的模型训练的输入输出数据,模型的参数,都是用Tensor来表示的。Tensor在操作方面和NumPy的ndarray是非常类似的。不同的是Tensor还实现了像等PyTorch的核心功能。Tensor是PyTorch里对。:单个数,比如 torch.tensor(3.14):一列数,比如 torch.tensor([1,2,3]):行列数据,比如 torch.tensor([[1,2],[3,4]])

2025-09-14 01:49:18 876

转载 运筹学目前最具潜力或生命力的方向有哪些?

来自知乎:https://www.zhihu.com/question/648061702/answer/1948804735286085408

2025-09-10 01:22:12 36

原创 Patr1.第1-5章

视频教程电子书在作者的教程附带的数据和源代码,在可供下载。

2025-09-06 17:08:36 173

原创 算法工程师社招面试应该如何准备?

算法工程师社招面试应该如何准备?

2025-08-31 16:43:13 129

转载 校招转正答辩突出什么样的能力更受青睐?

组里排第一的同学,来了做的第一个任务是让其做一个用户意图聚类,一开始mt给了一个方案,其实并不复杂,大模型抽取q,然后emb聚类,大模型总结和统一,反复进行,最后得到结果。现在的学生水平都很高,很快就做出来了。但是他自己聚类出来之后,人工check了所有数据,然后自己也不懂,无法评价好坏,其实mt只是要求他给聚类结果就行,但是他自己去把原始数据抽验了一遍,发现mt给的数据还不足以总结出客户真实的意图,于是自己设计了一个覆盖率评测标准,做了一版本评估,给出了数字告诉mt这个方案不可行,需要换数据方案。

2025-08-28 02:21:23 49

原创 算法工作5年感想系列

从知乎上看到的文章,转载整理如下:(1)(2)(3)

2025-08-28 02:16:13 155

转载 第一性原理

忽略现有经验、行业惯例的干扰,将问题拆解为无法再分割“基础要素”,再从这些要素出发,重新推导、构建解决方案。要理解第一性原理,核心是跳出 “经验类比” (一种通过参考已有的类似经验、先例或普遍做法来理解新问题、做出决策或预测结果的思维方式)的惯性,回归事物的底层本质,通过拆解基础要素、重构逻辑来解决问题。它并非否定经验,而是在经验失效、需要创新或突破时,提供 “从根上解决问题” 的思维工具。运用第一性原理思考,需遵循一个清晰的“破而后立”的过程,如下图所示:这个过程看似简单,实则反人性,因为它。

2025-08-21 19:58:48 250

原创 双重机器学习DML介绍

正交化:通过残差化剥离协变量X的影响,确保T~ 和 Y~ 与X正交。交叉拟合:避免过拟合,提高估计的稳健性。Neyman正交性:对第一阶段模型偏误不敏感,保证无偏性。机器学习灵活性:支持非线性模型(如随机森林、神经网络),适应复杂数据结构。

2025-08-21 15:30:31 1617

原创 因果推断中的元学习器:T-learner、S-learner、X-learner

特性T-learnerS-learnerX-learner因果森林模型数量2个独立模型1个模型3个模型(初始+2残差)多棵决策树处理组不平衡敏感(小样本组效果差)鲁棒(共享参数)改进(残差加权)鲁棒(自动划分亚组)计算效率高(并行训练)高(单模型)中(分阶段训练)低(需多棵树)适用场景处理组/对照组均衡特征与T强相关处理组/对照组不均衡存在效应异质性典型库自定义实现econml/grf。

2025-08-20 15:38:21 863

转载 逆概率加权(IPW)

参考:https://blog.youkuaiyun.com/xiang_gina/article/details/149710556

2025-08-19 17:30:08 113

转载 作为40岁还在IT行业的你,会给30多岁的我什么建议?

本文转载自知乎,分别来自用户​和的回答。

2025-08-17 15:29:43 48

转载 什么样的人一眼看去前途无量?

每个成年人貌似都在随着自己的心意做选择,但其实不是的,大多数人虽然脑子是自己的,但做决策的方式却是外界灌输的,看似是个人意志,实则是对外的无意识继承。这就是典型的没有自建价值体系,所以对待自己最宝贵的时间和心力资产是不重视的,会挥霍,缺乏目标,野心也只不过是膨胀过后的欲望,不是自己内心真正的渴求。你要是能搞定自己的身体,不乱造不自我毁灭,保持持久高效的战斗力,那生活中的一切挑战基本都算是鸡毛蒜皮。真正的强者,很擅长搞定自己的身体,精力是一切的起点,一个人事业前途的高度,约等于自我经营的能力的强度。

2025-08-17 02:42:14 35

原创 RCT数据 vs 观测数据 vs A/B数据

通过严格的随机分配消除混杂变量,确保处理组与对照组在基线特征上均衡可比。研究者主动控制干预(如药物、政策)。示例:新药临床试验中,患者随机分入药物组或安慰剂组。验证干预效果(选RCT/A/B测试) vs. 探索自然关联(选观测数据)。

2025-08-14 11:28:21 635

原创 ML+OR问题端到端优化

优化|当机器学习上运筹学:PyEPO与端对端预测后优化。

2025-07-24 13:33:14 114

原创 拉格朗日对偶

拉格朗日对偶及其若干要点的阐述与解说(并纠正李航《统计学习方法》书中的一处错误)

2025-07-22 20:36:56 121

原创 pandas.DataFrame中axis参数

例如:df.sum(axis=0) 会对列 A 和列 B 分别求和,结果是 A=4, B=6。例如:df.sum(axis=1) 会对行 0 和行 1 分别求和,结果是 0=3, 1=7。明确axis=0与axis=1的区别和联系,

2025-07-08 14:51:47 261

原创 【重点】【双指针】18.四数之和

【代码】【重点】【双指针】18.四数之和。

2025-06-26 23:38:02 168

原创 【重点】【DP】174.地下城游戏

(2)骑士到达最后一格后,健康点数必须 ≥ 1;

2025-06-25 23:55:12 261

原创 【重点】【DFS】1905. 统计子岛屿

step1.先把grid2中是陆地但grid1中是海洋的岛变成海洋。step2.再统计grid2中岛屿的数量。

2025-06-25 01:22:15 304

原创 【DFS】695.岛屿的最大面积

【代码】【DFS】695.岛屿的最大面积。

2025-06-25 00:54:37 128

原创 【DFS】1020.飞地的数量

跟题目完全相同的套路!

2025-06-25 00:46:22 176

原创 【重点】【DFS】1254.统计封闭岛屿的数目

思路:先外后内,先遍历边界,再处理内部!

2025-06-25 00:31:24 237

原创 【重点】【回溯】797.所有可能的路径

【代码】【重点】【回溯】797.所有可能的路径。

2025-06-23 01:23:53 189

原创 O2O优惠券预测

seaborn.kdeplot() 是 Seaborn 库中用于绘制核密度估计图(Kernel Density Estimate Plot)的核心函数。stats.probplot 是 SciPy 库中用于生成概率图(Probability Plot)的核心函数,主要用于检验数据是否符合特定理论分布(如正态分布)。seaborn.regplot() 是 Seaborn 库中用于绘制回归分析图的核心函数,它通过散点图展示两个变量之间的关系,并叠加一条回归线(默认线性回归)以量化这种关系的趋势。

2025-06-23 00:56:32 450

原创 【重点】【差分数组】1109.航班预订统计

重点是读懂题目,标准差分数组解法!

2025-06-18 10:12:37 170

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除