Li_RuiQi-优快云博客

原创 IEEE trans 模板最后的reference部分出现大面积留白的问题

模板常见的“平衡最后一页”土法，如果数值过大或用在不对的位置，就会把。，导致你看到的“下半页空白但两栏齐平”。

2025-09-12 17:35:22 260

原创 th 发音咬舌，但啥时候发清音，啥时候发浊音呢？看看G5老师的回答。

2025-08-13 13:59:44 130

原创 Diffusion-VLA 中的 Reasoning Token 注入机制解析：语言推理如何控制扩散模型？

摘要：Diffusion-VLA模型创新性地融合了扩散策略与语言推理能力，通过FiLM调制机制将语言模型生成的分析文本（如"红色物体最接近箱子"）转化为动态调制信号（γ/β），直接作用于扩散模型的内部特征通道。这种语义调制方式相比传统prompt拼接具有显著优势：1）通过MLP实现推理嵌入到控制参数的动态映射；2）采用通道级特征缩放与偏移实现精细控制；3）模块具备任务无关性，支持跨任务泛化。实验表明该方法在零样本场景下仍保持较好性能，但也面临语言歧义带来的调制风险。该工作为构建可解释的机

2025-07-18 22:25:26 464

原创 BN与LN

在CV领域中，BatchNorm是对一个batch-size样本内的每个特征[分别]做归一化，LayerNorm是[分别]对每个样本的所有特征做归一化。这些不同样本的相同长度的向量，在同样的位置上进行归一化，也就是对N个值做归一化（均值标准差的公式），做（H,W）次。不同通道向量的同样的位置做归一化，也就是对C个值做归一化，同样做（H，W）次。LN：以样本为操作单位，一个样本中有多个通道，不同切片，很自然的理解，就是一个样本是由多个通道的数值向量构成的。每个向量的含义是每个样本的特定通道的数据向量。

2025-03-08 13:23:17 342

原创台式机，调节屏幕亮度方案

自带微软商店搜索：

2024-10-01 03:08:05 521

原创模型压缩——量化

这就衍生出很多有趣的子问题，比如量化对象是什么（weight，activation，gradient），量化到几位（8位，4位，2位，1位），量化参数（如step size，clipping value）如何选择，量化参数是否可以自动优化，不同层是否需要不同的量化参数，如何在量化后恢复准确率或者在训练时考虑量化，等等。我们知道，大多深度学习训练框架默认下模型的参数是32位浮点的，计算也是32位浮点的。模型量化的基本思想就是用更低精度（如8位整型）来代替原浮点精度。

2024-09-10 14:28:44 357 1

原创使用Lora微调LLM——笔记

Lora的目的就是用更少的权重（低秩的表达），来近似的代替原始的预训练满秩参数。LLM的预训练模型的权重很可能是满秩的，这代表几乎全部的权重都是有意义的。Lora没有真正地“调”预训练的参数，而是增加了一个低秩矩阵。

2024-08-30 16:44:28 397

原创 WPS 备注白条，演讲者模式看不到

演讲者模式的样子会变成白条，如：实现方式:

2024-08-26 14:45:50 650

原创转移自己注意力的方法

专注做自己的事儿的时候，可以在每天睡醒的时候，计划一下自己主线的今日任务。当规划了每天都回归了今日任务，并按照思路去执行，其实就算是尽人事了。比如找个能看懂，理解，参与你的主线的人（B），多跟B交流，最好能把你的主线变成你们两个的都感兴趣的任务，或者你非常依赖B的输出。当忍不住去想某个人或者某件事（A），到了影响自己的主线（论文，去向）时，要想个办法去转移自己的注意力。脑袋里整天胡思乱想的，哎~~~~这样应该能减少A带来的内耗，同时增强B带来的帮助。现在在申博的时间节点，感觉压力还是比较大的。

2024-08-13 09:19:22 478

原创时间序列预测领域公开数据集数据集下载

ETT，weather, exchange, electricity, illness等等。先占个坑，有时间上传一下。着急用的话，可以先联系我。

2024-07-25 10:04:26 525

原创造轮子：autoformer等时序工作结果提取

时序预测领域，不管是Autoformer，FEDformer都使用同一个训练框架。输出的结果文件也都是按照相同的格式，输出为txt。在每次做完实验那结果的时候，都得一个个ctrl+c ,很麻烦，重复劳动。所以让kimi给造了个轮子，把txt导成execl。

2024-07-02 23:11:57 341

原创 :Zone.Identifier wsl2中在复制时出现 “:Zone.Identifier“文件

在命令行输入下面的命令, 可以把该路径下所有文件搜素一遍,并删除其中的 ":Zone.Identifier"文件。

2024-06-27 21:17:35 1827

原创执行力的来源：0-1-60-80-（99）

先开始着手做，不断去修改。不怕错，成本其实不高。执行力的来源：0-1-60-80-（99）

2024-06-23 03:32:47 186

原创 Kaggle-cmi

对于艾老师博客的补充，方便我个人理解与使用。

2024-06-05 00:08:03 1121

原创博客摘录「 FEDformer: Frequency Enhanced Decomposed Transformer for Long-termSeries Fore...」2024年5月2日

在Transformer结构中提出了傅立叶增强块和小波增强块，允许我们通过频域映射捕获时间序列中的重要结构。它们可以作为自我注意和交叉注意块的替代。该模型通过随机选择固定数量的傅里叶分量，实现了线性计算复杂度和内存开销。从理论上和实证上验证了该选择方法的有效性。

2024-06-04 14:06:42 215

原创 WORD 交叉引用参考文献格式修改[3-5]形式

COPY以备后用！！（若违规请通知会删除）

2024-04-22 15:46:37 2208

原创 nohup

后台运行，并把输出放到当前目录的002.txt文件中。找到对应的进程号，举例是进程号为1717。

2024-03-20 15:15:43 181

原创看显卡显存，利用率

对windows来讲，可以直接按ctrl+shift+esc，唤出任务管理器。看性能界面，显卡里面的专用GPU内存。

2024-02-28 14:55:53 1445

原创 Sim2Real两个源代码

【代码】Sim2Real两个源代码。

2024-02-05 15:37:58 751 3

原创看shape的方式

在ubuntu跑一些开源工程的时候，想看看某个变量的shape。但不会进调试模式，那就在代码里面加一行，打印一下shape。但各种格式的打印shape老是混，现查麻烦，还要判断，而且容易打断思路。所以整理一下，后续这篇博客会不断更新。

2024-02-04 16:33:04 557

原创 Embedding 理解--图没往里插入，后面有空记得插入！！

基于下面这篇文章，写一下对embedding的理解Pytorch中Emdedding函数的解释及使用方法 - 知乎函数：torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None) 函数大概解释：相当于随机生成了一个tensor…首先说，我是做时序的。

2024-01-25 21:52:20 543

原创 Frequency-domain MLPs

一般来说，模型越复杂，其预测结果的鲁棒性对可用数据集的大小要求就越高。MLP模型，结构简单，参数量少。可以在可用数据量较少的情况下，捕捉序列的趋势。例如，N-BEATS, LightTS, DLinear基于mlp的预测方法，现有问题：1.点式映射：模型学习时过度关注细节，缺乏整体理解。2.信息瓶颈：瓶颈设置过紧，导致模型失去对有用信息的捕捉，导致欠拟合；太松，导致过度关注冗余信息，导致过拟合。mlp学习模型的特点：全局视图：频域信息能够使mlp拥有信号的完整视图，更容易学习到全局依赖关系；

2024-01-11 19:24:52 1803 6

原创 Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

采样的结果没有出现随采样频率出现单调的上升或下降趋势，更多的是无序的。Sparse Transformer， LogSparse Transformer Longformer 使用启发式的方法来解决，但它们的效率提升程度都受限。informer在wining-counts中胜过经典的退化informer，这支持了查询稀疏度假设，在提供一个可观的注意力特征map。使用生成式的推理可以缓解长序列带来的推理速度的骤降。因为较长的编码器可能包含更多的依赖关系，而较长的解码器会包含更多的局部信息。

2024-01-06 18:39:37 1328 1

原创整理之前不认识的论文里的英文

anomaly detection 异常检测 data imputation 数据补全 downstream tasks 下游任务 unified framwork 统一框架 diverse time series analysis tasks 多样的时间序列分析任务 empirical study 实证研究 consequencely 因此 conduct 进行；管理；实施；处理 suifficient 足够的

2024-01-04 21:30:33 574 1

原创 ARIAC:Agile-Robot Industrial Automation Competition

Participating teams need to develop algorithms and control strategies to enable their robot systems to identify, grasp, transport, and assemble parts to complete the tasks.

2024-01-04 18:46:37 1017 1

原创 One Fits All: Power General Time Series Analysis by Pretrained LM

有些文章，需要科学上网。

2023-12-26 22:38:57 2026

原创 cannot connect to X server

ETE: cannot connect to X server · Issue #101 · etetoolkit/ete · GitHubapt-get install xvfbwget http://repo.continuum.io/miniconda/Miniconda-latest-Linux-x86_64.sh -O Miniconda-latest-Linux-x86_64.shbash Miniconda-latest-Linux-x86_64.sh -b -p ~/anacond

2023-12-26 22:35:26 453

原创 win键需要按三次才有反应+k580故障

电脑键盘shift,Ctrl.alt.win键都需要按三次才有用，怎么解决？-这种情况很可能是按键不灵如果是 (verywind.cn)电脑Shift.ctrl.alt.win键都需要按三次才能用，而且按一次响一次，这个要怎么解决？罗技k580键盘失效：使用usb连接器连接，突然不好用了。解决：通过客服给的优联unify软件，对k580重新配对usb连接器。ps：键盘电源重启的时候，一定要等5秒，再启动！这么折腾了一下午，就这个小细节，解决了问题。连按五次shift，出现。问题原因，开启了粘滞键。

2023-12-11 15:50:51 1683 1

原创 wsl2 安装

在这个网址里面，点点点，选择自己的配置，会给出命令行，直接在Ubuntu的terminal里面运行就可以。可以看到，我的显卡驱动版本为536.40>525.60.13, 对应表中12.3x版本的cuda。把下载的".sh文件"放到wsl的目录里面（自定义）, 运行.sh文件就可以。做法应该是在bashrc里面加proxy，引入端口号。3.得到版本号，之后去下载对应版本的cuda。2.根据驱动的版本号，选择cuda的版本。## 换源：有一个华为源，比较好用。但我每次都失败，so。有会的大佬，请指教！

2023-12-08 15:21:59 423

原创差分，平滑，nunique，log1p，标准化用的统计值

当该特征明显出现偏态分布时（偏前面），我们可以使用log1p(x)= ln(x+1), 对其分布进行调整使其接近正态分布。

2023-12-07 16:45:53 553 1

原创 dtype定义结构化

ref：python中dtype什么意思_NumPy Python中的数据类型对象(dtype)-优快云博客

2023-12-01 16:32:24 463 1

原创 polars dataframe with_columns()

使用新的with_columns方法的调用格式。

2023-11-20 17:33:41 993 1

原创 pyarrow.lib.ArrowInvalid: Needed to copy 1 chunks with 1 nulls, but zero_copy_only was True

思路1：x = np.nan_to_num(x,nan=-1)

2023-11-15 00:35:28 907

原创 CMI 随机森林方法分析

将event和step的预测问题，转化为新建标签asleep（表示是否在睡觉）的分类问题。

2023-11-05 16:00:24 211 3

原创 word 调格式时，发现有一行单词间的间距跟其他的不一样，明显要大一些。

Word版本： Word 家庭与学生版 2021。

2023-10-17 22:39:29 708

原创 Word文献标注变成上标的方法——查找与替换功能。

使用的版本为：Word 家庭与学生版 2021。

2023-10-17 22:32:07 4801

原创 MATLAB使用GPU遇到的版本问题——Unable to find a supported GPU device. For more information on GPU support, see

原因：版本不匹配，可能是我用MATLAB是盗版的，而且其版本较CUDA版本太老。或者是GPU计算能力比cuda的更高。解决： parallel.gpu.enableCUDAForwardCompatibility(true)CUDA版本：cuda 11.0 （命令提示符中输入 nvcc --version 可查看）这行命令启用了CUDA的前向兼容性。听起来很高级，我不懂，反正就是个适配的过程。刚输入的时候需要等待一小会儿，后面就正常用了。刚输入的时候需要等待一小会儿，后面就正常用了。

2023-10-17 21:49:46 2343 3

原创 Kaggle ——Child Mind Institute - Detect Sleep States

用手环记录的数据，训练模型，检测出入睡和睡醒的时间点。训练数据是500天传感器记录的序列（5/5个特征），训练一个模型。模型的功能是在test序列中，。这样标记相当于标记出睡眠的时间段，但标记的onset，wakeup与实际的存在差异。标记效果的好坏通过给定的代码event detection ap来打分，标记出的睡眠时间段与实际的时间段存在差异，利用IOU原理进行打分。

2023-09-26 10:54:09 1064 1

原创 MATLAB使用GPU遇到的版本问题——Unable to find a supported GPU device. For more information on GPU support, see

显卡：GeForce RTX 4080 驱动更新至最新CUDA版本：cuda 11.0 （命令提示符中输入 nvcc --version 可查看）

2023-09-07 10:20:45 4416 1

原创 tensorboard 使用 SummaryWriter可视化模型时，遇到No dashboards are active for the current data set.

ps：之前都是直接用logs名字，不会出问题。包括用了土堆的P18 卷积层的代码试验了一下，直接用logs名字，tensorboard也是可以出图的。然后我又用P22的代码（也就是出问题的代码）跑了一次，这次直接用的名字，tensorborad又可以出了。在python里，已经实例了模型tudui。input是一个随机初始化的输入，将tudui的放到logs里面。背景：在学习B站小土堆的pytorch视频P22时，可视化模型时，遇到了这个问题。在Terminal里输入时，把logs的绝对地址放进去。

2023-07-05 22:58:52 274 2

空空如也

空空如也