- 博客(253)
- 资源 (1)
- 收藏
- 关注
原创 更改windows 远程桌面端口 和 解决画面卡顿或卡死问题
尝试用远程桌面,跨网域公网连接。还遇到了连上后卡顿,画面卡死,还不如向日葵快。结果发现是公网的udp丢包严重,而这个远程桌面又会自动udp连接。得手动改为tcp连接,画面才变得流畅。[求助] 用win11 24H2 远程桌面卡还容易断线。一个脚本解决,需要 powershell 管理员权限。Windows远程桌面连接经常卡死解决办法。更改计算机上的远程桌面的侦听端口。选择 RDP 传输协议。
2025-02-26 00:52:41
341
原创 lightweight-charts-python 包 更新 lightweight-charts.js 的方法
lightweight-charts-python 的包目录下的这个文件,相对路径是 lightweight-charts-python\lightweight_charts\js\lightweight-charts.js。lightweight-charts 更新比较频繁,导致 lightweight-charts-python 内置的 lightweight-charts 经常不是最新的。测试 lightweight-charts-python 是否能正常工作。
2025-01-27 18:49:59
411
4
原创 2025-1-14 记录,国金QMT 尝试使用迅投 xtquant 最新版本
xtquant 网址:https://dict.thinktrader.net/nativeApi/download_xtquant.html?已测试基本功能都能直接使用,登录,获取k线数据,如果使用不支持的功能会报错 “当前客户端未支持此功能,请更新客户端或升级投研版”国金QMT网址:https://download.gjzq.com.cn/gjty/organ/gjzqqmt.rar。而直接使用最新版本的 xtquant。大概是,可以使用的官方 xtquant 版本,只要比 QMT 的发布时间晚就行。
2025-01-14 19:09:31
1305
4
原创 h5 hdf5 pytables 数据库 减少空间占用的方法
方法来源:https://forum.hdfgroup.org/t/hdf5-deleting-datasets-and-recovering-space/1293。在hdf5 的官方下载页面 https://portal.hdfgroup.org/downloads/index.html 点击这个。此时可以使用 h5repack 工具,快速重建 h5 数据库,可以立刻把未使用空间省出来。直接安装之后,重启系统,即可有 h5repack 命令。h5 数据库,在删除一些数据,表,数组后,无法变小;
2023-12-17 00:37:20
415
原创 flash-linear-attention CUDA算子成功实现(但限制极多。。)
flash-linear-attention 注意力算子CUDA实现
2023-10-23 18:07:45
453
原创 python 替换字符串中 windows非法字符 到对应的 全角合法字符
替换后,就能保留原意,不需要损失信息了。windows中,非法文件字符有以下。简易python代码如下。对应的合法全角字符为。
2023-09-22 17:05:31
422
原创 python 为 网易云下载的 本地音乐文件增加 序号
网易云下载的音乐文件,信息挺全的,但是缺少序号,用本地播放器听是乱序的,就很头疼。遂写一个python脚本解决问题本python会把基于音乐文件的元信息,重命名文件 到 以下格式序号 标题.后缀。
2023-09-22 15:53:14
436
1
原创 openslide / tiffslide 获得 宏观图macro 和 标签图label
openslide / tiffslide 获得宏观图和标签图
2023-08-17 16:02:53
351
原创 TransnormerLLM 中 FlashLinearAttention 的纯pytorch实现
纯 Pytorch 实现 TransnormerLLM 中快速线性注意力算子
2023-08-06 22:07:40
680
原创 LXD/LXC 命令 报错 /proc/self/attr/current: Permission denied 解决
执行 lxd 和 lxc 命令就会报错 /proc/self/attr/current: Permission denied。仅在方法1无效时使用,降级lxd,然后又升级回来,就修好了。执行这条命令即可,看命令,猜测意思是重新链接 lxd服务。ubuntu突然死机,重启后lxd出毛病了。找了一番,在外面找到了解决方案。
2023-07-31 16:22:03
311
原创 SqueezeLM 的想法,压缩输入句子潜变量,生成下一句子
又研究了一段时间。还是感觉LongNet那种空洞注意力做编码器有搞头。RetNet等AFT方法,直接生成太长的句子感觉有点难度,不过可以一句句生成,每次生成短句,这样感觉比较合适。
2023-07-30 01:00:05
268
原创 记录:自回归 模型在记忆 全随机序列 的潜变量 统计量爆炸现象
然后发现,这个值会在训练初期迅速飙升到1e4 - 1e6 的域,非常巨大,如果使用半精度训练,会直接撑爆然后变成nan,只能使用float32值域训练。一开始,我以为这模型又完蛋了,但后面让他继续训练,发现它居然在缓缓下降,当下降到 1e2 - 1e3 的以内的域时,模型基本记忆正确率已经 90%以上了。但是神奇的是,这个注意层的各个权重是正常的,即权重的标准差均在1以内。写的在全局性能上很好的,在无序序列的模型收敛很快,在自然语言上被普通gpt秒成渣(指验证集分数提升慢,最终分数也差一点)
2023-05-17 15:13:28
408
原创 python3 force-relative-import 强制使用任意父级相对导入,越过python相对导入限制,拒绝 ImportError
写了一个强制相对导入特性,修改了 import 的实现逻辑,从而允许导入任意父级的包,而不会报以下错误。这是一个强制启用python相对导入的库,允许你忽略python的相对导入限制。修改 python3 的 import 函数,从而实现挂钩hook或更改其行为。目录示例,example_N 均为直接启动目标。仅建议用于主程序,不要用于模块或包。修改import逻辑的方法来自这里。使用作用域,以避免意外情况。以下为搬过来的仓库介绍。
2023-04-30 19:14:00
981
原创 torchdata DataPipe 和 DataLoader2 快速入门和使用
pytorch 使用 multiprocess库 让 Dataloader 不再报错 AttributeError: Can‘t pickle local object。torchdata 使用了 dill 替代了 pickle, 从而允许在spawn多进程模式下转移复杂的数据集。以下为使用 torchdata 的示例,SimpleDataset 可以直接替换为你自己的函数。是该博文的另一种解决方法。
2023-04-27 14:59:54
1081
原创 pytorch 使用 multiprocess库 让 Dataloader 不再报错 AttributeError: Can‘t pickle local object
pytorch 的 dataloader 默认使用 python 自带的多进程库 multiprocessing ,它又使用 pickle 作为序列化库。pickle 库只能储存一些简单类型。如果 dataset 中使用 lambda 函数对象,将会导致出现这样的错误 AttributeError: Can’t pickle local objectmultiprocess 的 pip 安装方法。
2023-04-26 16:19:40
2239
1
原创 Google FLASH-QUAD Transformer模型的设计雷点
这个模型用来做无序弱监督分类,效果好,特别是收敛速度比标准多头Attention层快多了,完全没得比。
2023-04-15 16:52:25
541
原创 debian12 系统 开机自动加载 nvidia-uvm
debian 系统不知为何,开机没有自动加载 nvidia-uvm 设备,需要在主机系统手动启动任意一个cuda程序才能加载,非常坑爹。写了一个脚本,配置了一个自动创建 nvidia-uvm 的 systemd 的服务。stackoverflow 上的问题 正确创建 nvidia-uvm 设备。nvidia cuda官方创建 nvidia-uvm 节点的脚本。Debian11 创建 systemd 开机服务。
2023-04-11 17:01:17
707
原创 debian12 全新安装后 LXD/LXC使用 nvidia 容器报错 The NVIDIA container tools couldn‘t be found 解决
报错 The NVIDIA container tools couldn’t be found 原因是 nvidia-container-runtime 包没有安装,需要手动安装。ubuntu 直接安装 lxd 就能直接使用,原因可能是 ubuntu 使用的是snap包,它的snap包里已经包含 nvidia-container-runtime 相关工具。这里可以找到报该错误的 LXD 的 go 源代码,lxd 会寻找一个命令 nvidia-container-cli ,如果没有找到就会报该错误。
2023-04-10 16:27:02
813
原创 kali系统下 python 安装包报错 unknown type [0x13] section `.relr.dyn‘ 解决
conda 内置的 ld 程序与系统的lib包不兼容。删除 conda 的 ld 程序即可。
2023-04-06 10:08:22
2357
1
原创 pytorch weighted_and_neg_topk_cross_entropy 加权的负权重topk交叉熵损失
相比上面文章里改的的loss,加入topk 负类型测试,当负权重的类别在预测类别前 K 的高概率类别时,才会传递梯度,否则会跳过。一种 用于GPT模型 训练的 包含加权 和 数据增强 和 损失方法 的设计。根据这段时间的NLG经验,继续改进损失函数。主要用于以下文章所写的 NLP 增强管道。
2023-03-23 15:36:02
342
原创 一种 用于GPT模型 训练的 包含加权 和 数据增强 和 损失方法 的设计
根据之前训练的字模型+PALM效果和经验。真是胡言乱语,牛头不搭马嘴。观察了模型的在各种条件下的输出。看大佬的各种的增强方法,搞了2周写完了新的增强管道。换了新方案,继续训练了一晚上,马上就有不错的生成效果了,泪目。在老的增强方法和损失函数上,T5 模型不太行,8+8 层的情况下生成效果不如12层相似参数量的PALM连贯,准确度也不如PALM,训练速度也比PALM慢2倍。训练语料是质量较好的,但比较少,而且生僻字略多,所以使用字模型。训练模型:GPT模型(参数量44M)训练任务:翻译;
2023-03-22 00:31:09
520
原创 不同C++标准生成DLL链接库,如果接口使用了STL类,则会产生很难检出的Bug
:GetCurImage 为C++20写的DLL的函数,在语句 return true 后,tmp_image_data 变量进行释放,破坏了内存,导致UE5直接闪退。我的DLL使用的标准是 C++20。接口使用了 vector 类用来数据交互。报错是析构 tmp_image_data 时出现了空指针异常。查了很久,终于定位到这个坑爹错误了。UE5 的使用的标准是 C++17。
2023-03-11 22:49:48
250
原创 UE5 LiveCoding 乱码,变通的解决方法(非修改区域设置utf8)
编译UE C++ 项目,乱码直接就不知道怎么改错了。非常坑爹按照其他大佬的说法,在区域设置里面把 系统的 utf8支持 开启了,LiveCoding 确实不乱码了,当我的其他软件很多都乱码了,这个就更加不能忍受了。
2023-03-11 16:38:55
2410
3
原创 记录 UE5 完全重新构建 UE C++项目
不知道搞了什么,C++项目的实时代码编译罢工了,搞了半天都修不好,只能又重建了UE5 版本为 v5.1.1删除以下文件夹Binaries 文件夹是编译后的模块Intermediate 文件夹里是中间层的C++代码,完全由ue5生成Saved 是一些编辑器设定和日志。
2023-03-09 12:21:23
3541
原创 pytorch 使用 xformers 库 加速多头注意力计算 和 大幅节省显存
来自 https://facebookresearch.github.io/xformers/components/ops.html#module-xformers.ops。好处:使用 google PALM 架构的小模型做 生成任务,改为 xformers 实现后,加速比为 2倍,显存消耗为原来的 1/3 ,非常给力。xformers 官方文档:https://facebookresearch.github.io/xformers/缺点:相比pytorch的原生实现,误差略大。
2023-02-26 17:25:49
13148
10
原创 pydub AudioSegment 编码 解码 字节流,不通过硬盘文件。
需要把AI生成音频信息通过网络发送,使用 pydub 来完成编码解码。不希望使用临时文件。
2023-02-12 02:10:06
1183
原创 bleu-mp 多进程bleu评估工具
我改的多进程 bleu 评估工具,已发布到 pypi 上Github 仓库:https://github.com/One-sixth/bleu-mpGitee 仓库:https://gitee.com/ONE_SIX_MIX/bleu-mp
2023-02-05 02:41:28
563
原创 python 转换文本从繁体到简体,但保留一切繁体符号
使用 unicodedata 来识别每个字符是属于字集还是符号集,即可获得手动转换表。zhconv 在进行繁简转换时,会顺带着把符号都转换为简体形式。将手动转换表输入为 zhconv.convert 的参数即可。处理简繁混杂的文本。
2023-01-20 04:04:19
372
原创 修改 python3 的 import 函数,从而实现挂钩hook或更改其行为
该文件可以在pycharm的 PyCharm\plugins\python-ce\helpers\pydev_pydev_bundle 目录中找到。方法发现自 pycharm 的python挂钩代码 pydev_import_hook.py。原始想法是突破python对顶层包的限制,从而允许在当前目录或父目录使用相对位置加载模块。下面是一个例子,阻止 collections 模块加载。本修改对整个python程序生效。原理,修改 builtins.
2023-01-17 16:35:59
409
原创 导入 csv, excel 文件或 pandas.DataFrame 到 awkward 数组
pandas 的操作很不习惯,还是喜好 numpy 那种操作方式。awkward 正好符合这个要求。
2022-12-02 21:15:23
177
opencv-4.0.1-vc15-contrib-nonfree-avx2 已编译库
2019-03-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人