- 博客(34)
- 问答 (2)
- 收藏
- 关注
原创 torch 单机多卡训练
最近在尝试用torch单机多卡进行训练。 网上有很多方法,有的讲的也很详细,但是torch版本更新的还是很快的。所以自己也踩了很多坑。在这里记录下来,希望对大家有帮助。本文适用torch版本:1.10torch单机多gpu训练有两种方式torch.nn.DataParalleltorch.nn.DataParallel( module, device_ids=None, output_device=None, dim=0)这一种方式是比较老的,官方现在也不太推荐,相对来说,这种方式
2022-03-11 20:57:07
6486
1
原创 RNN与torch DataParallel的爱恨情仇
torch.nn.DataParallel是通常用来多gpu加速的一个torch包。在我的实验过程中,发现了很多很多的bug。在训练RNN模型时,由于RNN模型一般将batch_size放在第二个维度(输入、state)。DataParallel会将一个batch的数据切分开来,然后放到多个gpu上,默认按照第一维度进行切分(可以通过dim进行更换)。这里的问题就在于:输入X是我们自己定义的,所以维度可以进行控制。state向量一般是由RNN layer自己生成,所以batch_size必然在第二个
2022-03-11 20:40:07
1686
原创 bad interpreter: No such file or directory解决办法
之前用conda创建了一个新环境,但是名字取错了,要改的话只能删了环境重新创。于是我就偷了个懒,直接修改了conda/env/下的文件夹名。结果使用pip、jupyter lab等等的时候出现了bad interpreter: No such file or directory这个问题。结果查询,解决方案如下:pipwhich pip# 修改环境名之前的文件# opt/conda/envs/pythondgnn/bin/pipwhich python# opt/conda/envs/dgnn/b
2022-03-02 20:42:20
3098
原创 Linux利用`tzselect`修改时区
查看时区date结果为:Wed Dec 22 12:16:26 UTC 2021其中的UTC表示协调世界时,又称世界统一时间、世界标准时间、国际协调时间,也是格林尼治时间。那我们使用tzselect进行时区的修改(修改为东八区,北京时间),终端输入:tzselect输入4:输入9:输入1:再次输入1:此时查看时间,依然显示时区为UTC,这是什么意思?难道我们的修改没有用?其实是我们的修改还没完成,请注意看上图的文字,我们还需要修改.profile文件才行。于是继.
2021-12-22 20:45:28
2697
原创 【论文笔记】U-BERT: Pre-training User Representations for Improved Recommendation
原文作者:Zhaopeng Qiu, Xian Wu, Jingyue Gao, Wei Fan原文标题:U-BERT: Pre-training User Representations for Improved Recommendation原文来源:AAAI 2021原文链接:https://www.aaai.org/AAAI21Papers/AAAI-2116.QiuZ.pdfU-BERT: Pre-training User Representations for Improved Reco
2021-12-02 09:27:59
2296
原创 【论文笔记】Recommending Third-party Library Updates with LSTM Neural Networks
原文作者:Phuong T.Nguyen,JuriDi Rocco,RiccardoRubei,ClaudioDi Sipio,DavideDi Ruscio原文标题:Recommending Third-party Library Updates with LSTM Neural Networks原文来源:IIR 2021(Proceedings of the 11th Italian Information Retrieval Workshop 2021)原文链接:http://ceur-ws.o
2021-12-01 09:50:16
732
原创 【论文笔记】Diversified Third-Party Library Prediction for Mobile App Development
原文作者:Qiang He, Bo Li, Feifei Chen, John Grundy, Xin Xia, Yun Yang原文标题:Diversified Third-Party Library Prediction for Mobile App Development原文来源:IEEE TSE 2020原文链接:https://ieeexplore.ieee.org/abstract/document/9043686Diversified Third-Party Library Predi
2021-11-30 17:38:40
1064
原创 【论文笔记】Attention is all you need
原文作者:Ashish Vaswani,Noam Shazeer,Niki Parmar,Jakob Uszkoreit原文标题:Attention is all you need原文来源:NIPS 2017原文链接:https://papers.nips.cc/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdfAttention is all you need主流序列转导模型基于复杂的CNN或RNN,包括编码器和解码器。有的模型使
2021-11-23 16:43:33
3798
4
原创 【论文笔记】KGAT: Knowledge Graph Attention Network for Recommendation
原文作者:Xiang Wang,Xiangnan He,Yixin Cao,Meng Liu,Tat-Seng Chua原文标题:KGAT: Knowledge Graph Attention Network for Recommendation原文来源:KDD 2019原文链接:https://arxiv.org/abs/1905.07854本文提出了一种新的推荐方法KGAT,能够根据实体间的高阶关系特征建模,并具有一定的可解释性。以端到端方式对KG的高阶连通性进行了显式建模。递归地从节点的邻居(
2021-11-23 16:32:02
1091
原创 【论文笔记】THE SURVEY of REAL TIME OPERATING SYSTEM: RTOS
原文作者:Prasanna Hambarde, Rachit Varma,Shivani Jha原文标题:THE SURVEY of REAL TIME OPERATING SYSTEM: RTOS原文来源:ICESC 2014原文链接:https://ieeexplore.ieee.org/document/6745342THE SURVEY of REAL TIME OPERATING SYSTEM: RTOS操作系统通常由两部分组成:内核态和用户态。最基础的就是内核。内核可以分为几类:单内核
2021-11-11 11:30:40
591
原创 【论文笔记】Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks
原文作者:Suchin Gururangan,Ana Marasović,Swabha Swayamdipta,Kyle Lo,Iz Beltagy,Doug Downey,Noah A. Smith原文标题:Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks原文来源:ACL2020原文链接:https://www.aclweb.org/anthology/2020.acl-main.740.pdfDon’t Stop
2021-11-10 09:44:42
1076
原创 【论文笔记】Bert:Pre-training of Deep Bidirectional Transformers for Language Understanding
原文作者:Jacob Devlin,Ming-Wei Chang,Kenton Lee,Kristina Toutanova原文标题:Bert:Pre-training of Deep Bidirectional Transformers forLanguage Understanding原文来源:谷歌AI团队原文链接:https://arxiv.org/pdf/1810.04805.pdf3.2 Bert:Pre-training of Deep Bidirectional Transforme
2021-11-08 10:50:11
2668
原创 【论文笔记】Explainable Reasoning over Knowledge Graphs for Recommendation
笔记作者:刘泽鑫原文作者:Xiang Wang,Dingxian Wang,Canran Xu, Xiangnan He, Yixin Cao,Tat-Seng Chua原文标题:Explainable Reasoning over Knowledge Graphs for Recommendation原文来源:AAAI 2019原文链接:https://ojs.aaai.org//index.php/AAAI/article/view/4470Explainable Reasoning ove
2021-11-04 10:35:02
1157
原创 【论文笔记】SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions
SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions摘要知识图谱嵌入将知识图谱中的实体和关系表示为低维的,连续的向量,从而使知识图谱能够与机器学习模型兼容。尽管有很多知识图谱嵌入的模型,但大多数只涉及事实三元组,实体和关系的补充文字说明并未得到充分利用。本文提出了SSP方法, 联合学习事实三元组和文本描述,建立了二者之间的交互,使用文本描述发现实体、关系的语义相关,提高嵌入的准确性。大量的实
2021-10-29 18:08:32
715
1
原创 【论文笔记】Unsupervised Embedding Enhancements of Knowledge Graphs using Textual Associations
Unsupervised Embedding Enhancements of Knowledge Graphs using Textual Associations摘要知识图谱嵌入对于表示和学习多关系数据是有帮助的,最近嵌入模型表现出从现有的数据库推断新事实的高效性。然而,这些精确的结构数据通常在数量上和范围上有限。因此,为了为了完整优化嵌入,考虑更广泛可用的信息源是重要的,比如文本。这篇文章描述了一个无监督的方法来兼容文本信息通过关联单词的嵌入来增强实体嵌入。该方法并不修改知识图谱嵌入的优化目标,允许
2021-10-29 14:33:50
433
翻译 TransH-Knowledge Graph Embedding by Translating on Hyperplanes 翻译
Knowledge Graph Embedding by Translating on Hyperplanes摘要处理把一个大规模的由实体和关系组成的知识图谱嵌入到连续的向量空间中。TransE是最近提出来的一个很有希望的方法,是非常高效的,实现了最先进的预测性能。我们讨论了一些应该在嵌入中考虑到关系的映射属性,比如自反,一对多,多对一和多对多。我们注意到TransE在处理这些属性时做的并不好。一些复杂的模型有足够的能力保持这些映射属性,但在这个过程中牺牲了效率。为了在模型容量和效率中做很好的权衡,我们
2021-09-10 10:07:25
433
原创 python浅拷贝的父对象与子对象
dict_a = {"a": 1,"b": 2,"c":{3, 4}}dict_b = dict_adict_c = dict_a.copy()在上述代码中,修改dict_b会影响dict_a的值,修改dict_a也会影响dict_b的值。对于dict_c,如果修改的是a或者b的值,不会影响dict_c,这里的a,b就是所谓的“父对象”,即第一层键值对;如果修改c的值,则会影响dict_c,因为这里的c属于子对象,也就是第二层的键值对。...
2021-09-06 20:50:13
1871
原创 CSS中多个class设置的区别
在css中,我们区分以下写法:/* 第一种① */.classA .classB{ font-size: 28px; color: red;}/* 第二种② */.classA, .classB{ font-size: 28px; color: red;}/* 第三种 ③*/.classB{ font-size: 18px; color: blue;}其中,第一种是为A下的B设置属性。第二种是分别为两个类设置属性。第三种是单独为B设置属性。第一种和第三种的区别是:第
2021-05-17 20:42:09
1541
原创 使用VS Code配置Python环境
注意:本文适用版本VS Code:1.55.2Python:3.7Anaconda:Anaconda3安装Python从文件夹中打开VS Code命令行操作纯python环境打开命令行转到你项进行开发的文件夹执行命令mkdir pythonTestcd pythonTestcode .Anaconda请使用Anaconda Prompt完成上述操作IDE操作File > Open Folder打开工作文件夹设置Python解释器Ctrl+Sh
2021-04-26 20:17:40
186
原创 MySQL client 8.0 输入密码闪退问题
在网上查了很多解决办法,发现我的直接按回车就可以进入数据库了。进入数据库后修改密码就可以了。mysql>use mysql;mysql>ALTER USER 'root'@'localhost' IDENTIFIED WITH MYSQL_NATIVE_PASSWORD BY '新密码';mysql>flush privileges;mysql>quit;重新打开client,输入新密码后,成功进入。(此时不输入密码按回车不能进入)。...
2020-06-22 16:24:49
1240
1
原创 操作系统学习笔记
操作系统学习笔记死锁与饥饿相同点都是由于竞争资源引起不同点1.死锁是由于两个或以上的进程在竞争资源的过程中,二者互相等待永远不会被释放的资源;而饥饿则是等待会被释放但是永远不会分配给自己的资源。2.死锁是系统循环等待产生的,而饥饿是由于系统调度的策略问题导致(比如在进程调度的短作业优先算法中,长作业可能永远都会被调度,故发生饥饿)。3.在饥饿的情况下,系统仍然可以继续运行,只是有进程永远得不到执行机会;而在死锁的情况下, 如果不及时处理的话,系统会陷入死锁甚至崩溃。4.死锁进程至少有两个或以
2020-05-26 09:47:19
1107
原创 整数二分模板
整数二分模板//把区间划分为[l, mid] [mid + 1, r]void binary_1(int l, int r){ while(l < r){ int mid = l + r >> 1; if(check(mid)){ r = mid; }else{ l = m...
2020-02-26 16:56:17
236
原创 数据结构之——排序
#include<stdio.h>#include<stdlib.h>#include<algorithm> using namespace std;/*DataStruct ——Sort 直接插入排序 1 插入排序: 折半插入排序 1 希尔排序 1 冒泡排序 1 交换排序: 快速...
2019-07-16 21:46:24
210
原创 Android EventBus 3.1.1简单使用
EventBus介绍eventbus是一款针对Android优化的发布/订阅事件总线,主要功能是替代Intent,Handler,BroadCast在Fragment,Activity,Service,线程之间传递消息,有点事开销小,代码更优雅,以及将发送者和接收者解耦。EventBus使用1.依赖在build.gradle文件中添加依赖 implementation 'org.gree...
2019-06-24 16:39:19
598
原创 博弈论SG函数入门(HDOJ Java)
通过近几天的学习,对博弈论的入门有一个基本的认识,这里附上做的两道题以及相应的Java AC代码,供读者参考。另外还有一篇非常值得参考的帖子 非常详细的说明SG函数的相应求法:https://blog.youkuaiyun.com/strangedbly/article/details/51137432第一题hdoj 1847非常简单的SG函数求解Good Luck in CET-4 E...
2019-05-16 12:49:16
487
原创 PAT 乙 1005(Java)
1005继续(3n+1)猜想(25分)卡拉兹(Callatz)猜想已经在1001中给出了描述。在这个题目里,情况稍微有些复杂。当我们验证卡拉兹猜想的时候,为了避免重复计算,可以记录下递推过程中遇到的每一个数。例如对n=3进行验证的时候,我们需要计算 3、5、8、4、2、1,则当我们对n=5、8、4...
2019-05-02 22:07:59
473
原创 codeup 1132 最长公共子序列(Java实现)
问题 A: 最长公共子序列时间限制:1 Sec内存限制:32 MB提交:370解决:211[提交][状态][讨论版][命题人:外部导入]题目描述给你一个序列X和另一个序列Z,当Z中的所有元素都在X中存在,并且在X中的下标顺序是严格递增的,那么就把Z叫做X的子序列。例如:Z=<a,b,f,c>是序列X=<a,b,c,f,b,c>的一个子序列,...
2019-04-10 20:39:38
274
原创 最长上升子序列(Java实现)
问题 A: 最长上升子序列时间限制:2 Sec内存限制:64 MB提交:447解决:228[提交][状态][讨论版][命题人:外部导入]题目描述一个数列ai如果满足条件a1<a2< ... <aN,那么它是一个有序的上升数列。我们取数列(a1,a2, ...,aN)的任一子序列(ai1,ai2, ...,aiK)使得1 <=...
2019-04-08 20:46:53
4715
原创 最大连续子序列(Java实现)
题目描述给定K个整数的序列{N1,N2,...,NK},其任意连续子序列可表示为{Ni,Ni+1,...,Nj},其中1<=i<=j<=K。最大连续子序列是所有连续子序列中元素和最大的一个,例如给定序列{-2,11,-4,13,-5,-2},其最大连续子序列为{11,-4,13},最大和为20。现在增加一个要求,即还需要...
2019-04-07 21:00:35
3240
原创 n皇后 问题(原始的8皇后问题)
题目描述 会下国际象棋的人都很清楚:皇后可以在横、竖、斜线上不限步数地吃掉其他棋子。如何将8个皇后放在棋盘上(有8 * 8个方格),使它们谁也不能被吃掉!这就是著名的八皇后问题。输入一个整数n( 1 < = n < = 10 )输出每行输出对应一种方案,按字典序输出所有方案。每种方案顺序输出皇后所在的列号,相邻两数之间用空格隔开。如果一组可行方案...
2019-03-23 22:38:52
501
原创 组合+判断素数
题目描述已知 n 个整数b1,b2,…,bn以及一个整数 k(k<n)。从 n 个整数中任选 k 个整数相加,可分别得到一系列的和。例如当 n=4,k=3,4 个整数分别为 3,7,12,19 时,可得全部的组合与它们的和为: 3+7+12=22 3+7+19=29 7+12+19=38 3+12+19=34。 现在,要求你计算出和为素数共有多少种。例如上例,...
2019-03-23 18:09:04
625
原创 算法笔记学习 BFS(Java)
题目及解析(利用BFS解决背包问题) import java.util.Scanner;public class dfsbeibao { static final int maxn = 30; static int n, V, maxValue = 0;//物品件数是n,背包容量是v,最大价值maxValue static int[] w = new int[max...
2019-03-22 15:25:51
421
空空如也
Android端vr全景图的热点触碰问题
2020-03-29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人