- 博客(11)
- 收藏
- 关注
原创 2021-InferCode: Self-Supervised Learning of Code Representations by Predicting Subtrees论文笔记
1)论文题目解读:用自监督学习的方式来进行代码表征的学习,自监督的子任务是预测子树2)论文思想:InferCode模型类似于bert也是一个预训练模型,可以运用在许多下游任务例如:无监督任务:Code Clustering、Code Clone Detection…;有监督任务:Code Classification,Method Name Prediction…3)前期准备:使用tree_sitter工具将每个代码片段生成AST(抽象语法树)并从AST中将节点类型为{exper,decl,exper_
2021-08-21 21:02:56
625
原创 将项目托管到github上
git status 查看项目代码情况(修改过的文件)git add . 将修改后的文件添加的缓冲区git commit -m “你想写的文本信息”(将缓存区里的代码提交到本地仓库)git branch (查看当前所处的分支)git checkout master (切换到master分支)从master分支 git merge login(将login分支合并到master分支)git push (将本地master分支的代码提交到云端)git checkout login(切换到logi
2021-01-16 16:25:05
113
原创 使用git命令将代码托管到github上小白教学
git init :在本地上创建一个仓库git status :查看项目的状态,看是否有更新的内容git add .:将更新的内容先放在一个临时的缓存区git commit -m “可以自己命名”:将临时缓冲区中的内容提交到本地仓库中git remote add origin https://github仓库的地址:将本地仓库与GitHub仓库进行关联git push -u origin main:将本地仓库的内容添加到GitHub仓库中去...
2021-01-01 19:50:58
185
原创 统计学习方法-SVM学习笔记(一)
1.线性可分支持向量机定义:通过给出的线性可分的训练集,通过间隔最大化的求解凸二次规划问题学习得到分割超平面 w*x+b=0以及相应的分类决策函数 f(x)=sign(w*x+b)预备知识介绍:如图所示,图中的实线就是一个分割超平面,在图中可以把两类分开的超平面有无数个,我们要做的就是寻找一个间隔最大的超平面(具有容错性)函数间隔: ri=y_i(wx_i+b) (只能判断划分的置信度即是否划分正确,当w和b同时扩大相同的倍数时,r增大,其实超平面没有变)几何间隔:Ri=y
2020-12-02 14:24:59
181
原创 情感分类步骤简述(使用朴素贝叶斯模型)
最近在学习关于情感分类的知识,以下是最近学习的一些知识总结一.主要步骤1.选定数据集及对数据集的处理这里我选用的是大众点评的数据集,数据集中包含了对菜品的打分,分数超过3的我规定为认可,小于3的为不认可,这样就给数据集加上了标签。import pandas as padata=pa.read_csv("E:\\data.csv")#定义添加标签的函数def lable(scores): if scores>3: return 1 else: ret
2020-10-16 11:05:04
1510
3
原创 运用os库对文件名进行批量的修改需注意的一些问题
主要代码如下import osfor filename in os.listdir("E://A"): newname=filename.replace('+','-') os.rename("E://A//"+filename,'E://A//'+newname) 这里需要注意的几点1.文件的路径名"E://A"要用双斜杠2.“E://A//”+filename这里A的后面也要加上双斜杠...
2020-10-13 15:24:36
155
原创 机器学习中对训练模型的保存
这里主要介绍sklearn方法from sklearn.externals import joblibjoblib.dump(model, 'model.pkl') model是你的训练模型,‘model.pkl’是保存模型的名字,这个可以自己随便取LR=joblib.load('model.pkl')这里是对保存的模型的使用,LR就相当于你的模型。这里可以查看保存模型的官方文档...
2020-10-11 10:27:18
672
原创 每天掌握一条Linux常用命令(1)
Ls命令ls 命令是列出当前所在位置的所有目录ls -l 如下例子总用量 8drwxrwxr-x 2 yu yu 4096 9月 8 11:38 File总用量8 即8k表示的是占用的空间详细的ls -l命令参考此链接ls -a显示目录中的所有文件包括隐藏文件(以 .开头的文件)ls -R显示当前所在位置的所有文件以及子文件更多的ls命令可以在这里寻找...
2020-10-09 10:20:34
122
原创 对os.mkdir和os.path方法的简单使用
os.mkdir方法是python中一种生成文件的方法,用法如下:os.mkdir(‘f:\abc’)–这样会在f盘下建立一个abc文件.os.mkdir方法中还可以携带一些参数。。。os.path是python中对文件夹的一组操作,包括os.path.exists(‘文件夹的路径’)可以验证文件夹是否存在,返回 true 或 false...
2020-09-22 19:15:32
1074
原创 python中的列表推导式
列表推导式[表达式 for i in range()]例如编写一个从一到十每个数平方的列表[x*x for x in range(1,11)]
2020-09-17 21:44:10
150
原创 关于python 中的__repr__与__str__一些总结(1)
关于python 中的__repr__与__str__一些总结(1)__repr__与__str__都称为魔法方法,即可以对他们进行重写, class timers(): def __str__(self): return self.prompt这里就是的__str__方法进行了重写,使它可以输出self.prompt你想输出的内容。但是你这样输出t=timers()t他会显示self.prompt的地址(这里我也不太明白为什么会这样)解决方法1pri
2020-09-16 20:52:13
174
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人