- 博客(15)
- 收藏
- 关注
原创 LORA微调RoBerta代码复现
因为新版的datasets中已经移除了'load_metric',因此需要对examples/text-classification/run_glue.py代码中的这行内容进行替换。local-rank 参数应该改成local_rank,在代码中添加这段内容。
2025-01-10 17:23:14
500
原创 【无标题】InstantStyle-Plus: Style Transfer with Content-Preserving in Text-to-Image Generation 论文复现避坑指南
今天复现一篇风格迁移的论文InstantStyle-Plus: Style Transfer with Content-Preserving in Text-to-Image Generation。在配置的过程中出现了很多问题,在此记录,以便大家复现。由于我们转化后的权重是.bin格式的,因此我们需要将代码中的use_safetensors=True设置为False。转换后还要手动修改权重的名称,因为代码默认加载fp16的模型,如果不改会报错,若加载全精度模型会占据大量显存空间。2.再次运行推理代码。
2024-11-13 22:58:44
475
原创 国内服务器无法访问hugging face 加载预训练模型
在跑大模型相关的代码时,经常会遇到从hugging face中加载预训练模型失败的情况,下面记录一下解决的方法。打开后找到constants.py文件,并做以下修改,替换为镜像网站。
2024-11-04 23:04:38
827
原创 大模型量化AutoGPTQ代码配置
针对大语言模型推理性能优化的研究取得了巨大的进展,如今我们不仅能够在高端显卡上完成大语言模型的推理,甚至在 CPU 和边缘设备上都可以轻松运行大语言模型。在此记录我配置大模型量化的代码AutoGPTQ的过程中出现的问题和解决方案。选择合适自己的python、系统、和cuda版本的wheel文件,在这里我选择的第三个,因为我的是cu117。大家也可以根据图示命令查看自己虚拟环境中的cuda版本,选择对应的文件。安装的话得到的很可能是不符合你的环境的包。其实最核心的在于安装auto-gptq这个包,但是直接。
2024-11-04 22:54:51
343
原创 Pycharm配置远程解释器,并在本地连接服务器进行远程Debug
因为最近需要研究一篇论文的代码,但是代码因为是放在服务器上的,一行一行肉眼去看很难懂代码的实际运行逻辑和用到的方法,所以就想尝试在本地使用Pycharm连接服务器进行远程的debug和运行。
2024-10-14 21:39:02
497
原创 论文复现:Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Model
缺乏clip的权重,手动在hugging face上下载’openai/clip-vit-large-patch14’权重,放在目录下。最近需要做一个风格迁移的工作,看到了这篇文章,感觉效果还不错,所以尝试进行复现,记录遇到的问题和解决方法。手动下载taming- transformers,将taming这个包放在文件路径下即可,clip包同理。下载完就可以正常的运行啦。
2024-09-30 23:43:27
568
7
原创 非root管理员用户如何安装tmux
tmux 是一个终端复用工具,可以让用户在一个终端窗口中同时运行多个终端会话。它的名字来源于"终端多路复用器"(Terminal Multiplexer)的缩写。使用 tmux 可以创建、管理和切换多个终端会话,这样你就可以在同一个终端窗口中同时运行多个命令行程序或会话,而无需打开多个终端窗口。这对于在远程服务器上工作或需要同时处理多个任务的情况非常有用。对于需要离线在服务器上跑代码时,tmux是个很方便的工具。但一般的服务器使用用户没有root权限该如何安装tmux呢?
2024-01-27 14:14:43
721
1
原创 LeetCode整数反转问题
题目:解题思路:首先判断输入的数字是否为0,若为0则return0,不为0则进行逆序。对于负数做单独处理,正数将其转化为字符串再转化为列表,进行逆序输出。class Solution: def reverse(self, x: int) -> int: min,max=-2**31,2**31-1 #逆序后的数字范围判断 while x!=0: if x<0: x=x*-1
2021-10-27 21:18:57
231
原创 LeetCode题目2 两数相加(python)
2021-10-24 题目2:给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0 开头。示例 1:输入:l1 = [2,4,3], l2 = [5,6,4]输出:[7,0,8]解释:342 + 465 = 807.示例 2:输入:l1 = [0], l2 = [0]输出:[0]示例 3:输入:l1 = [9,9,
2021-10-24 14:36:24
262
原创 配置openpose python版本的问题总结
unofficial-implement-of-openpose项目源码配置C与python API接口。mac安装siwg原项目中的Reademe中给出以下安装方法:$ sudo apt install swig但在终端运行时给出以下提示:解决方法:尝试使用hombrew安装中科大镜像安装安装Homebrew/bin/zsh -c “$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)
2021-09-27 20:20:56
523
原创 24点卡牌游戏C++实现
问题描述:24点游戏是经典的纸牌益智游戏。常见游戏规则:从扑克中每次取出4张牌。使用加减乘除,第一个能得出24者为赢。(其中,J代表11,Q代表12,K代表13,A代表1),按照要求编程解决24点游戏。基本要求: 随机生成4个代表扑克牌牌面的数字字母,程序自动列出所有可能算出24的表达式,用擅长的语言(C/C++/Java或其他均可)实现程序解决问题。1.程序风格良好(使用自定义注释模板)2.列出表达式无重复。提高要求:用户初始生命值为一给定值(比如3),初始分数为0。随机生成4个代表扑克牌.
2021-05-09 22:08:56
4029
1
原创 模拟XN*2图灵机的运行
对于XN*2图灵机进行模拟,任意给定的十进制数a,转换为收缩扩展二进制的编码,再编程模拟此Turing机的运行过程,输出从开始运行起的每一步骤的结果。算法分析算法思路: 1,输入一个十进制,将十进制转化成二进制; 2,将二进制转化成图灵机扩展的二进制编码;3,通过图灵机XN*2运算指令输出每一步的运算结果。图灵机在扩展二进制位实现(XN*2)的运算指令:00→00R,01→10R,10→01R,11→100R,100→111R,110→01STOP程序流程图1.主函数main.
2021-04-12 22:04:22
296
原创 三天打渔两天晒网(带流程图,及文件读取输出)
国有句俗语叫“三天打鱼两天晒网”。某人从2010年1月1日起开始“三天打鱼两天晒网”,问这个人在以后的某一天中是“打鱼”还是“晒网”。用C或C++语言实现程序解决问题。
2021-03-22 21:47:54
1846
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人