- 博客(408)
- 资源 (6)
- 收藏
- 关注

原创 常见Linux命令
一些常见Linux命令(持续跟新中……)查看当前目录命令:pwd查看当前目录下的所有文件或文件夹命令:ls复制一个文件夹或文件到另一个目录下命令:cp -r 源目录 目标目录 eg:cp -r /data1/qtxu/Pre_train /home/qtxu (/data1/qtxu/Pre_train:源目录 /home/qtxu:目标目录 )注意:要-r表示递归,如果没有则只能传递文件,不能传递文件夹移动一个文件夹或文件到另一个目录下(源文件仍在原处,只不过,多了一个复制)命令:mv -r
2021-09-01 10:18:53
5341
1

原创 NLP一些常见的专有名词
NLP一些常见的专有名词词性是词语在句子中扮演的语法角色,也被称为词类(Part-Of-Speech,POS)词性标注(POS Taging)任务是给定一个句子,输出句子中每个词相应的词性。句法分析(Syntatic Parsing)的主要目标是给定一个句子,分子句子的句法成分信息,例如主谓宾定状补等成分。最终的目标是将词序列表示的句子转换成树状结构,从而有助于更准确地理解句子的含义,并辅助下游自然语言处理任务。词义消歧(Word Sense Disambiguation,WSD),一词多义(如,
2021-07-30 12:37:06
1218

原创 服务器怎样查看显存状态
1.nvidia-smi:可以看到服务器节点的使用情况,但是,不能查看具体的使用百分比2.gpustat:可以查看当前所在的服务器节点,每块占用百分比。也可以查看到是谁在使用当前节点
2021-07-14 10:46:32
2719
原创 COLING论文(acl模版)怎样添加作者信息
2. 在提交camera-ready的时候,需要将“review”修改成“final”(这个十分重要‼️)ACL系列的论文,在投稿的时候,是匿名。中稿之后,需要添加作者信息,如何添加相关作者信息呢?⚠️:如果不执行步骤2,只有步骤3,编译pdf之后,是不会可视化显示的。1. 在投稿的时候,模版固定住了匿名,在main.tex中是\usepackage[
2024-12-09 15:45:23
501
原创 python如何实现缩放画图
在画图的时候,性能提升幅度不一样,如何通过画图,体现性能提升的幅度均比较明显?则需要通过按照不同比例进行缩放,从而实现目的。
2024-11-26 15:30:11
389
原创 latex中,两个相邻的表格,怎样留一定的空白
在使用latex写论文时,经常表格需要置顶写,则会出现两个表格连在一起的情况。下一个表名容易与上面的横线相连,如何通过明令,留出一定的空白。在第二个表格的 \centering命令之后,\caption之前加\vspace{12pt}
2024-11-17 19:52:35
263
原创 MAC 电脑Office power point编辑的时候,显示“某些字体无法随演示文稿一起保存,仍然要保存演示文稿吗?”
在使用mac电脑的power point打开别人的.ppt文件之后,在保存的时候,弹出““某些字体无法随演示文稿一起保存,仍然要保存演示文稿吗?”,每次只要保存就需要重新嵌入字体很麻烦,如何解决这个问题呢?1. 使用power point打开.ppt文件,找到“PowerPoint”之后,选择“偏好设置”,如下图。3. 在“保存”界面,将“将字体嵌入文件”前面的☑️,去掉即可。4. 再次编辑该文件的时候,便不会出现之前的问题。
2024-10-17 22:06:57
3049
原创 解决Mac 默认设置 wps不能双面打印的问题
1. 在搜索框输入,“系统设置”,在左侧找到“打印机与扫描仪”,然后点击对应打印机的“>”符号,如下图2。使用mac电脑的时候,发现wps找不到双面打印的按钮,导致使用wps打开的所有文件都不能自动双面打印。mac的wps也是有双面打印的选项,只是默认被关闭了,因此需要开启。3. 点进去之后,找到“选项”按钮,将双面打印单位后面的按钮,打开即可。2. 点进去之后,找到“选项与耗材”
2024-09-24 22:31:14
4788
原创 latex源码如何快速注释掉大段文字
直接选择想要注释的文字,使用快捷键command+"/"(mac系统)注释。会发现该段文字变成绿色。在编辑latex源码的时候,有时候会出现大段的文字不需要的情况,如何快速注释该段文字,且有区分?即可将两行命令之间的文字,全部注释。即编辑pdf文件的时候,该段文字不再显示。在想要注释文字的开头部分,输入。
2024-08-30 17:38:19
1591
原创 如何解决Elsevier和IEEE期刊之间参考文献的转换问题
Elsevier期刊和IEEE旗下的期刊两者模版互相转换的时候,会发现Elsevier模版的参考文献是存放在.bib文件下的,然后在.tex文件中直接引用即可。3. 在IEEE的.tex文件中的\end{document}命令行之前,添加下面的这句话(ps:\bibliography{**}中的**名称即为.bib文件的名称)如何将Elsevier的参考文献快速的转成IEEE期刊可用的格式,是本博客需要解决的问题。2. 将下载好的.bib文件,上传到IEEE的latex文件中。
2024-08-30 17:29:54
756
原创 mac系统,怎样给压缩包加密
输入命令“zip -er 文件名.zip 文件名”开始压缩文件,例如“zip -er test.zip test”,表示将“test”这个文件夹压缩成“test.zip”,并存放在当前文件夹。(执行压缩+加密命令)在终端中用“cd”切换到需要压缩文件的位置,或者把要压缩的文件夹直接拖入终端然后回退一步。(进入当前需要压缩的文件夹的上一级目录)通过“command + 空格键”聚焦搜索“终端”,然后回车进入电脑终端。使用mac系统的时候,因特殊情况需求,需要将文件放进压缩包,并加密。
2024-04-22 20:13:42
3095
原创 AttributeError: ‘ChatGLMTokenizer‘ object has no attribute ‘sp_tokenizer‘
再结合自己原本的虚拟环境中有trl和vllm,也对transformers有一定的限定,因此安装transformers 4.33.1解决该问题。如果没有trl和vllm的限制,只需要安装transformers<4.34即可。在使用ChatGLM+lora微调的时候,报错“AttributeError: 'ChatGLMTokenizer' object has no attribute 'sp_tokenizer'“导致该问题的主要原因是transformers版本的问题。
2024-03-07 20:00:03
4852
5
原创 vscode 无法远程连接waiting the server log
code-->关于Visual Studio Code, 查看当前vscode版本号。使用vscode软件,远程连接曙光,一段时间没连接,再次连接发现使用vscode连接不上,但是网页版可以正常连接。可先将当前的版本卸载,重新安装低版本的vscode即可解决问题。⚠️:如果想要避免此类的问题,再次出现,可以将vscode的自动更新去掉。, 下载符合自己电脑版本的vs code,mac的点击红框链接即可。需要先将当前版本的vscode卸载。1) code-->首选项-->设置-->输入“update"
2024-02-20 21:20:23
565
原创 ModuleNotFoundError: No module named ‘torch.utils‘
【代码】ModuleNotFoundError: No module named ‘torch.utils‘
2024-01-29 21:16:47
788
原创 python实现给定两个列表,“求同存异”
给定两个列表,list1和list2。python实现求list1和list中重复的元素,以及在list1中,不在list2的元素。
2024-01-05 14:46:02
489
原创 python bad case边界不准确问题
因此想要通过jieba分词,然后调用GPT4的api判断当前的新span是否符合条件。针对bad case中,错误的主要原因是边界定位不准确问题,sub,obj抽取过短。
2024-01-04 21:02:54
452
原创 just recode for myself 统计大模型SFT的结果与version2中text的结果bad case
利用Qwen大模型进行SFT (lora)。将生成的结果与version2版本下的中文test.txt进行bad case分析。
2024-01-01 19:04:36
483
原创 just recod for myself--将.txt格式修改成.json格式
脑子不太好使,经常写过的代码,后面需要找的时候,又找不到了,just记录下。
2024-01-01 15:30:30
533
原创 MAC 系统在vs code中,如何实现自动换行
在vscode中,有些时候,一行内容过多,如果不能自动换行,就需要拖动页面,才能看到完整的内容。若当前行,不能自动换行,按快捷键。若当前行,可以自动换行,按。, 则可实现取消自动换行。mac系统的快捷键是", 则可实现自动换行。
2023-12-06 20:45:07
1729
原创 python 如何调用GPT系列的api接口,实现想要的功能
随着各种LLMs (Large Language Models)的出现,如何调用各种LLMs的api成为了经常会遇见的问题。⚠️: 只能在本地运行,不可以在服务器上运行,并且,🪜要打开。下面仅以生成给定sentence的复述句为例,说明如何应用。data: 存放在.txt文件中,按行存放,每一行是一个句子。
2023-11-25 10:38:04
3853
原创 如何解决两个不同服务器,不同账户下的虚拟环境的克隆问题
又不想重新配置完全一样的虚拟环境(或者忘记之前的虚拟环境中的具体参数),该如何办呢?⚠️:如果不使用这一步骤,只是第一步的话,可能会存在虚拟环境中的某些“关系”并未被建立。1. 首先使用scp命令,将old服务器的虚拟环境,上传到新的服务器上。env2 # env1为新环境名称 # env2为被克隆的环境名称。2. 虚拟环境传输完毕之后,可以使用clone命令,进行创建。其中,** ** 中,表示是原有创建好的虚拟环境的路径。&& &&中,表示的当前存放新虚拟环境的路径地址。
2023-11-13 10:29:36
918
原创 曙光如何kill当前的进程
通过上面的查找父类的方式,找到父类的PID,使用kill命令即可(kill结束之后,可能会有几秒钟的延迟,程序才会真的歇菜~)使用上面的命令,可以查找到所有的PID,但是一个一个kill比较麻烦,可以使用查找父类进程,直接kill父类进程的方法。在使用曙光的时候,使用kkgpu(自己的缩写)命令的时候,并不能显示当前进程的PID,因此没法杀死当前的进程。若使用分布式训练的时候,会存在一个**.py对应多个进程。如一个**.py文件在三块GPU上训练。使用下面的命令,可以找到当前进程的PID。
2023-10-30 23:23:33
181
原创 多GPU训练的命令
1). 若要使用多GPU训练,使用torchrun --nproc_per_node=8 train.py指令,nproc_per_node参数为使用GPU数量。2). 如果想指定使用哪些GPU设备可在指令前加上CUDA_VISIBLE_DEVICES=0,3(例如我只要使用设备中的第1块和第4块GPU设备)⚠️:如果在脚本文件中已经写明了第二种方式,则不支持第一种方式的指定。e.g., 在GPU的id为0和1的两张显卡上运行***.py程序。则使用下面的命令执行:(加上。
2023-10-30 21:57:10
1052
原创 latex如何对.pdf格式的图片实现裁剪
注意在裁剪的时候,不建议把width=1\textwidth,这个去掉,这个去掉可能会影响图片的居中摆放效果,可能会出现左倾或者右斜。在导入latex的时候,会因为两侧的留白导致整张图片缩小。如果直接进行裁剪.pdf,可能需要开通会员。不得不感慨latex的强大,可以直接使用命令进行裁剪。即下面的方式不可取!
2023-10-12 11:20:18
3549
原创 一致性检验-简单Kappa
Kappa统计量(κ)用于度量分类的一致性,即两名或多名评估者之间、或一个评估者在不同时间或条件下对相同事物进行的多次分类之间的一致性。Cohen's Kappa统计量一种分类变量的定性指标,其可以评估N个受试者在k个类别上的两个评分者之间一致性;: 这是一个二维矩阵,其中行通常代表一个评估者的分类,列代表另一个评估者的分类。Kappa<0,一致性强度极差(实际情况下发生可能性较低,Poor);0.81-1.00,极强(Almost perfect)。0-0.20,微弱(Slight);
2023-09-20 16:42:58
1012
Fudanchinese_text_classification.rar
2019-12-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人