idkmn_-优快云博客

原创 Daily AI 20251126 (注意力机制)

简述注意力机制在神经网络中的应用

2025-11-26 14:37:57 850

原创 Daily AI 20251125 经典梯度下降算法回顾与代码实现

经典梯度下降算法回顾

2025-11-25 16:20:57 1194

原创 Daily AI 20250514 (迁移学习与元学习)

迁移学习是研究如何将在一个领域上训练的模型迁移到新的领域，使得新模型不用从零开始学习。元学习主要关注如何在多个不同任务上学习一种可泛化的快速学习能力。

2025-05-14 19:27:11 1440

原创 Daily AI 20250513 (集成学习及其与联邦学习的区别)

集成学习及其与联邦学习的区别

2025-05-14 02:40:44 492

原创 Daily AI 20250403 (深度强化学习算法)

为解决传统Q-learning在高维状态空间中无法保存完整Q表的问题，深度Q网络（Deep Q-Network，DQN）是将深度学习方法与Q-learning相结合，通过学习参数。，争取下次做得更好．开始训练时，演员随机表演，评论员随机打分．通过不断的学习，评论员的评分越来越准，演员的动作越来越好。，来调整自己的打分标准，使得自己的评分更接近环境的真实回报．演员则跟据评论员的打分，调整自己的策略。策略搜索和基于值函数的方法相比，策略搜索可以不需要值函数，，对当前策略的值函数进行估计，即评估演员的好坏。

2025-04-07 03:38:09 805

原创 Daily AI 20250318 (深度强化学习算法)

参考资料：神经网络与深度学习如上篇文章所述，在强化学习中，一般需建模：策略π(a∣s)\pi(a \mid s)π(a∣s)状态值函数Vπ(s)=Eτ∼p(τ)[∑t=0T−1γtrt+1∣τs0=s]V^\pi(s)=\mathbb{E}_{\tau \sim p(\tau)}\left[\sum_{t=0}^{T-1} \gamma^t r_{t+1} \mid \tau_{s_0}=s\right]Vπ(s)=Eτ∼p(τ)[∑t=0T−1γtrt+1∣τs0=s]状态-动作值函数Qπ

2025-04-03 15:34:04 861

原创 Daily AI 20250317 (强化学习基础)

智能体与环境进行交互将智能体与环境的交互看作离散的时间序列．智能体从感知到的初始环境s0s_0s0开始，然后决定做一个相应的动作a0a_0a0，环境相应地发生改变到新的状态s1s_1s1，并反馈给智能体一个即时奖励r1r_1r1，然后智能体又根据状态s1s_1s1做一个动作a1a_1a1，环境相应改变为s2s_2s2，并反馈奖励r2r_2r2．这样的交互可以一直进行下去，其中rtrst−1a。

2025-03-17 01:49:39 744

原创 Daily AI 20250308

批量大小越大，随机梯度的方差越小，引入的噪声也越小，训练也越稳定，因此可以设置较大的学习率。在随机（小批量）梯度下降法中，如果每次选取样本数量比较小，损失会呈现震荡的方式下降。周期性学习率调整可以使得梯度下降法在优化过程中跳出尖锐的局部极小值，虽然会短期内会损害优化过程，但最终会收敛到更加理想的局部极小值。在迭代后期，梯度方向会不一致，在收敛值附近震荡，动量法会起到减速作用，增加稳定性。，必须先对样本进行预处理，将各个维度的特征归一化到同一个取值区间，并且消除不同特征之间的相关性，才能获得比较理想的结果。

2025-03-11 18:07:30 711

转载施密特正交化（Schmidt orthogonalization）

施密特正交化的清晰解释

2024-07-09 22:47:02 198

原创 CVPR2023论文学习_Gradient Norm Aware Minimization Seeks First-Order Flatness and Improves Generalization

CVPR2023论文学习：Gradient Norm Aware Minimization Seeks First-Order Flatness and Improves Generalization

2024-07-05 20:51:53 941

原创线性规划-单纯形法

线性规划-单纯形法原理总结

2024-06-12 21:52:26 956

原创线性规划-内点法初探

对内点法做简要的总结

2024-05-29 23:53:27 1372

原创 TCOM论文学习_Optimal Adaptive Power Control for OTA-FEEL Under Fading Channels

IEEE TCom论文学习，文章研究了Over-the-air Federated Edge Learning场景下的最优功率控制策略

2024-05-29 02:22:40 470

原创 Random Sampling (with/without replacement) & Random Shuffling

random sampling with/without replacement, random shuffling

2024-05-23 11:07:11 1277

原创 ICML2023论文学习_Dynamic Regularized SAM in FL: Approaching Global Consistency and Smooth Landscape

论文学习：Dynamic Regularized Sharpness Aware Minimization in Federated Learning: Approaching Global Consistency and Smooth Landscape

2024-04-17 16:44:16 1067

原创 Spyder中argparse的使用问题

解决使用Spyder编辑器时无法利用argparse传递参数的问题

2023-03-03 20:03:00 501

原创 Spyder内存占用过高解决方案

解决Spyder ide内存占用不会释放的问题

2022-11-07 19:47:18 3073

原创 MIMO与Beamforming技术学习

整理一下MIMO，波束赋形的基础知识。

2022-09-01 16:39:38 1080

原创 FedAvg源码学习

本文旨在对FedAvg源码进行注释，以此实现FedAvg算法。同时对代码中涉及到的一些函数作了补充，并给出了参考文章，最后附上算法的仿真结果以供参考。

2021-10-11 21:20:24 4935 23

原创字节跳动后端面试记录

笔者在寒假经历了东看看西看看的无效学习后，深知自己的水平着实不够看，实习经历近乎为零，这学期开始便开始了一系列的补救计划，虽然收效甚微，但至少还是让自己明确了一点点方向，不至于一直摸着石头过河。笔者一个通信工程的菜鸡当时投字节的后端开发并被通知面试属实是无知且无畏之举，过几天还是得找找符合目前自身定位的实习并看看能不能找到内推。闲话少叙，收到HR的电话后属实有些意外（当时因为赖床还是我主动回拨的），y1s1自己确实也是抱着增加经验的目的比较放松的参加这场面试的（因为确实是菜），笔者目前对于后端所掌握的知识

2021-04-15 01:48:20 924 2

xbn20000224的博客

原创 Daily AI 20251126 (注意力机制)

原创 Daily AI 20251125 经典梯度下降算法回顾与代码实现

原创 Daily AI 20250514 (迁移学习与元学习)

原创 Daily AI 20250513 (集成学习及其与联邦学习的区别)

原创 Daily AI 20250403 (深度强化学习算法)

原创 Daily AI 20250318 (深度强化学习算法)

原创 Daily AI 20250317 (强化学习基础)

原创 Daily AI 20250308

转载施密特正交化（Schmidt orthogonalization）

原创 CVPR2023论文学习_Gradient Norm Aware Minimization Seeks First-Order Flatness and Improves Generalization

原创线性规划-单纯形法

原创线性规划-内点法初探

原创 TCOM论文学习_Optimal Adaptive Power Control for OTA-FEEL Under Fading Channels

原创 Random Sampling (with/without replacement) & Random Shuffling

原创 ICML2023论文学习_Dynamic Regularized SAM in FL: Approaching Global Consistency and Smooth Landscape

原创 Spyder中argparse的使用问题

原创 Spyder内存占用过高解决方案

原创 MIMO与Beamforming技术学习

原创 FedAvg源码学习

原创字节跳动后端面试记录

原创 LeetCode2021.3.25-132模式

原创 LeetCode2021.3.17-各位相加

原创 2021.3.13 栈学习

原创 LeetCode2021.3.11-括号匹配

原创 LeetCode2021.3.11-回文数

原创 LeetCode2021.3.10

原创 LeetCode2021.3.9

原创 Python基础知识复习

原创 Pycharm初步上手

原创 Python面向对象

原创 Python2020.08学习笔记

原创 Pythonfdu学习

空空如也

空空如也