- 博客(11)
- 收藏
- 关注
原创 分类模型的评估指标(2)---ROC曲线与AUC简介
首先,我们需要了解一下,什么是ROC曲线?ROC曲线,即受试者工作特征曲线(Receiver Operating Characteristic curve,简称ROC曲线,是根据一系列不同的二分类方式,以真阳性率(TPR)为纵坐标,假阳性率(FPR)为横坐标绘制成的曲线,描述的是一个模型的性能。依旧是以之前的图片为例子:对于ROC曲线,我们可以首先求出TPR和FPR两个指标:以下图为例,哪条ROC曲线对应的分类器效果好?我们将曲线与x轴的面积定义为AUC(Area..
2022-05-19 22:05:43
1353
1
转载 GraphSAGE的四个聚合函数
Mean Aggregator Mean 聚合近似等价 GCN 中的卷积传播操作。具体来说就是对中心节点的邻居节点的特征向量求均值,然后和中心节点特征向量拼接,中间有两次非线性变换。 GCN Aggregator GCN的归纳式学习版本 Pooling Aggregator 先对中心节点的邻居节点表示向量进行一次非线性变换,然后对变换后的邻居表示向量进行池化操作(mean pooling 或者 max pooling),最后将 pooling 所得结果与...
2022-05-09 14:25:54
1095
转载 什么是one-hot?
转载自知乎https://www.jianshu.com/p/9948c5764302作者:Crush_sunone-hot是最为简单也是比较常用的文本特征表示方法。在词语特征表示上,其本质直接将词语在词语集合中的下标作为该词的表示。例如存在词语集合:【i,you,see,world],则这几个单词的one-hot表示为:i: [1, 0, 0, 0]you: [0, 1, 0, 0]see: [0, 0, 1, 0]world: [0, 0, 0, 1]one-.
2022-04-30 16:44:46
7600
原创 论文分析与讲解思路(2)--PGCN
题目:PGCN:Disease gene prioritization by disease and gene embedding throughgraph convolutional neural networksAbstract:包括动机和结果说明。---动机:候选基因的适当优先排序对于一系列遗传病的基于基因组的诊断至关重要。---结果:本文提出--PGCN--通过系统嵌入由基因、疾病和他们的个体特征绘制成的异构网络 。其性能对比于现有的方法有显著提升。1,Introduction
2022-04-24 16:57:22
2210
原创 GCN项目的笔录
项目流程:总体概括为几大步:1.数据集的准备工作-->2.构建生物分子网络-->3.构建图神经网络模型-->4.数据预测与模型训练1)在列表中,选取了110种疾病类型;16156种蛋白质节点; 在创建的异构图bghg中,存在307156条蛋白质和蛋白质相互作用PPI的边;882条蛋白质和疾病关联(pdr)的边。2)构造特征矩阵①matrix:共16156行128列;对应蛋白质;每一行代表一个蛋白质的128维特征值。②mm:共110行,128列; 对应疾病;每...
2022-04-12 22:05:28
295
原创 论文分析与讲解思路(1)--L3链路预测
之前总是把所有的科研想法和过程随手记录 感觉那样既耗费时间又效率太低。直到今天上完课,看到吴老师(我的研究生导师)发了一个朋友圈,分享了之前研究生组会上的一篇论文。我想着,我也创建一个专门的账户来记录一下所学所想吧。没错,这里说的就是我。看了吴老师今天发的朋友圈,结合里面的内容,我又重新整理了一下论文的思路,感觉受益匪浅。这篇文章确实写得非常妙!它是发表于Nature上的一篇文章。蛋白质相互作用网络(PPI)的数据量越来越大,因此,如何高效挖掘潜在的PPI是一个难题。过去人们使用的是
2022-04-12 11:16:46
453
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人