自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

dingxingdi的博客

随意看看就好

  • 博客(1370)
  • 收藏
  • 关注

原创 好题杂题列表

存疑:为什么这种查找(本人代码中的search函数)复杂度是正确的?upd:复杂度就是错的,看本人最新代码的search的写法。#记得重分类,分的细一点,具体到算法(加入到luogu提单里面),这个里面可能有重题,记得去重。#OI做题总结也是,重分类,分的细一点。再次复习0/1trie。

2024-07-16 10:19:11 477

原创 OI做题总结

数学竞赛蓝书上与OI/ICPC有关内容也可阅读OI考前注意事项见川外团队骗分导论见腾讯微云。

2024-07-16 10:17:07 1227

原创 NOIP复习提纲(持续更新)

1.LCA

2018-10-17 14:01:28 513

原创 异步 IO

目录asyncio。

2025-12-19 23:12:00 578

原创 第八章作业

(4). 插入到A和B、B和C、C和D、D和E之间可以让吞吐率最大,此时最长的功能段执行时间为80ps,加上流水线寄存器的20ps,得到100ps;(3). 插入到A和B,C和D,D和E之间最均匀,此时最长的功能段执行时间为90ps,加上流水线寄存器的20ps,得到110ps;(2). 插入到B和C,D和E之间最均匀,此时最长的功能段执行时间为110ps,加上流水线寄存器的20ps,得到130ps;(1). 第1和第2条、第2和第3条、第2条和第4条、第3条和第4条指令之间有数据相关。

2025-12-16 20:03:00 537

原创 分布式训练知识

【代码】分布式训练知识。

2025-12-13 22:26:00 388

原创 llamafactory 技巧

【代码】llamafactory 技巧。

2025-12-12 09:12:00 72

原创 tmux 使用方法

使用SSH的时候,最好都使用 tmux,这个样子断网的时候就没什么关系。打开 tmux 会话之后,就像用普通的终端一样用tmux即可。

2025-12-11 14:05:00 336

原创 多进程运行代码模板

【代码】多进程运行代码模板。

2025-12-08 16:53:00 185

原创 ollama 部署教程

目录。

2025-12-02 16:56:00 283

原创 openrouter 接口代码使用说明以及技巧杂记

parse_func。

2025-11-30 20:48:00 568

原创 免费的vibe coding???

刷博客园发现了一个公益平台,好像真的是做公益?

2025-11-09 15:24:00 363

原创 11.11 Seminar

作用具体描述受益场景1. 缓解多元共线性通过稳定矩阵求逆和收缩系数,直接解决共线性导致的系数高方差和不稳定问题。自变量高度相关的任何回归分析。2. 作为一种变量筛选的辅助工具虽然岭回归不会将任何系数精确设置为零,但我们可以通过观察系数的大小来进行判断。收缩后系数接近零的变量可以被视为影响力较小的变量。在特征选择中提供参考,但不如Lasso回归(L1惩罚)那样能直接进行变量筛选。

2025-11-07 10:32:00 655

原创 Transformers 杂碎知识点

【代码】Transformers 杂碎知识点。

2025-10-30 09:43:00 364

原创 第六章习题

接下来,需要对阶,使两个数的阶码相等。x 的阶码需要从 5 调整到 7,因此 x 的尾数需要右移 2 位。\([x+y]_{\text{补}}=0010,[x-y]_{\text{补}}=1000\)x = (15/16) × 2⁵,y = (2/16) × 2⁷。最后修正商,可得商为1111,真值为-1;不用修正余数,为0010,真值为2。是先移动完了再强制转换,所以全程都是无符号数,采用逻辑右移;符号位单独处理,可以知道为1,所以最后的原码结果为。符号单独处理,可以得到结果为商为-1余为0。

2025-10-26 23:32:00 592

原创 HuggingFace 库使用小技巧

【代码】HuggingFace 库使用小技巧。

2025-10-25 23:35:00 103

原创 dataset 库使用小技巧

【代码】dataset 库使用小技巧。

2025-10-25 23:35:00 59

原创 启动分布式mapreduce的过程以及prompt

【代码】启动分布式mapreduce的过程以及prompt。

2025-10-25 23:34:00 145

原创 阅读论文方法

阅读论文有三遍。

2025-10-21 16:06:00 322

原创 第四章习题

可以看到形成了基环树森林,用红色框框起来的是树的根节点。可以知道一共有三个状态,于是使用二位编码,设为。经过分析,无论是否满足自启动,当处于无用状态。由于是并行的,所以课上讲的公式适用,可知。假设忽略与非门的延迟,就有上图。,这显然是错误的,所以重新令。,于是可以画出下面的真值表。于是可以设计出电路图如下。最后是一段震荡,因为。

2025-10-12 22:44:00 145

原创 虚拟环境QA

所以即使你在 shell 里激活了环境,uv 仍然可能用另一个 Python/interpreter、不同的库路径或隔离的运行时来执行命令,导致行为不同或缺少依赖(你截图里的 "'NoneType' object has no attribute 'glGetError'" 很可能说明 uv 运行的那个环境里 OpenGL/上下文或相关包没有正确安装或初始化)。如果你把具体的 uv 工具名或你想要的用法告诉我(例如 uv 的完整命令帮助输出),我可以给出更精确的示例。跟conda的功能一样?

2025-10-10 23:45:00 952

原创 ChatTime的一些理解

我先在 ChatTime 目录里全局搜索与“文本/时间序列/提示/特殊标记”相关的关键词,锁定模型如何区分两类输入与输出的代码位置,然后打开关键文件精读以回答你的问题。搜索)、200 结果的文本为定位输入输出区分逻辑的实现位置,我将打开 ChatTime 的 prompt 与 model 相关文件,查找如何使用 Serializer/time_flag 来包裹和解析时序片段。预计能找到具体正则或标记分隔方案。

2025-10-10 22:38:00 643

原创 ChatTS的一些理解

Dingxingdi: 请你仔细阅读里面的文件,理解他们的含义逻辑和结构。现在我需要你告诉我,ChatTS在处理一段既包含文本又包含时间序列的输入的时候,是怎么精确地分别哪些是文本哪些是时序,从而对两者分别进行编码的?GitHub Copilot: 我先在 ChatTS 代码库里快速检索和阅读与输入解析和编码相关的模块(如 encoding_utils、llm_utils、vllm 相关脚本),以确认它如何区分文本与时序并分别编码。预期结果是找到明确的分割标记、数据结构或预处理函数,以及相应的编码流程。

2025-10-10 22:38:00 568

原创 第三章习题

电路(b):传输延迟为40+15+15+55=125ps,最小延迟为10+10+25=45ps。电路(c):传输延迟为30+30=60ps,最小延迟为10+25=35ps。电路(a):传输延迟为40+55=95ps,最小延迟为25ps。的各个项不存在逻辑相反的变量。(b)最长,(c)最短。不存在竞争冒险,因为。

2025-10-06 14:14:00 218

原创 数据生成方法初步调研

也有论文专门提到金融领域的数据收集将时序归一化之后离散化的效果会不会好一点(有些关系可以做差分来理解)数据生成的内容有两个:时间序列和对齐的文本。时间序列的生成不是什么难的事情,所以研究主要集中在生成对齐文本上现有技术大致可分为三类:Template-based、LLM-based以及Web-crawled。

2025-10-05 09:42:00 507

原创 16.1 总体主成分分析

P305的。

2025-09-29 16:00:00 107

原创 4.5.7 PIPE 各阶段的实现

目录。

2025-09-24 10:23:00 125

原创 第二章习题

利用12题的技巧,转换为与非-与非表达式为[ (X NAND Y) NAND ( ~W NAND X ) NAND ( ~X NAND ~Y NAND Z ) ]确定 F=0 的最小项:总共 8 个最小项(0 到 7),给定的是 2、4、6、7,因此缺失的是 0、1、3、5。2输入与非门能够构成逻辑门的完备集,可以通过显示如何仅用 NAND 门构建 NOT、AND 和 OR 来证明。从展开的最小项确定 F=0 的位置:缺失 0、1(即 000 和 001)。只取一次),得到最小项:2、3、4、5、6、7。

2025-09-22 15:23:00 588

原创 MLLM初步调研

每个演化步骤从Evol Type中选择一个类型,然后再从属性池中选择多个指标(这里的属性池包含了多个指标),将上一个步骤中,这个指标对应的属性池内容给LLM让其生成QA。更实际的解决方案是在预训练的Modality Encoder与Pre-trained LLM之间引入可学习的Modality interface,或者助Export Model将图像转化为语言,再将这些语言输入到语言模型中进行处理。近年来,多模态大语言模型取得了显著成就,尤其是在视觉-语言任务中,模型展现出复杂的理解和推理能力。

2025-09-22 15:07:00 547

原创 快速利用AI读论文

匹配去除引用,然后利用插件转化成PDF即可(记得信任当前工作区才可以使用插件)然后将Gemini的输出复制到本地的一个markdown文件中,命名为。使用Gemini 2.5 Pro,每天可以有五次请求。,用VS code打开,去利用正则表达式。

2025-09-14 21:53:00 142

原创 3 线性模型

目录。

2025-09-14 09:02:00 196

原创 2 模型评估与选择

对于一个固定的训练集\(D\),模型\(h_D\)的泛化误差\(R(h_D)\)定义为在数据分布上的期望损失(使用平方损失):\]其中\((x, y)\)是从分布中独立采样的测试数据点。

2025-09-13 23:49:00 599

原创 第一章习题

32位补码表示为0000 0000 0000 0000 1000 0000 0000 0010(十六进制表示为0x00008002),单精度浮点格式为0100 0101 1000 0000 0001 0000 0000 0000(十六进制表示为0x45801000),可以知道相同的序列为000000000010,这是因为补码转换为浮点数的时候,需要先转换成二进制下的科学计数法,省去了小数点左边的1之后,剩下的位数保持不变放到浮点数的尾数里再进行补全,所以是相同的。作为小数的话,无法表示。

2025-09-10 23:17:00 450

原创 2.4.3 数字示例

目录。

2025-09-01 08:51:00 198

原创 2.3.5 补码乘法

目录。

2025-09-01 08:22:00 270

原创 2.3.2 补码加法

目录。

2025-08-31 22:40:00 174

原创 10.1 最简单的演员-评论家算法:QAC

QAC与Sarsa的区别是什么?前者先更新策略再更新值,后者反之吗?

2025-08-31 20:16:00 238

原创 8.4.1 算法描述

目录。

2025-08-30 15:13:00 309

原创 8.3.2 基于值函数的Q-learning

本质上是求解贝尔曼最优方程,跟前面的TD和Sarsa的目的已经不同了,所以行为策略是什么无所谓,目标策略是求解贝尔曼最优方程的产品。有空可以推导一下,上面是猜测。

2025-08-30 13:08:00 346

原创 8.3.1 基于值函数的Sarsa

就是跟前面的TD算法的分析一样,可以求出来给定策略下的动作值;但是现在我们想要找到最优策略,那么应该先执行式。无数次找到最优动作值然后按照其更新,现在使用广义策略迭代的思想进行更新就有了算法8.2。本质上是在求解给定策略下的动作值。所以如果我们不想要找到最优策略的话,式。

2025-08-30 13:07:00 364

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除