- 博客(84)
- 收藏
- 关注
原创 【医疗影像】THE BEER-LAMBERT LAW
如果 I 小于 Io,则显然样品吸收了一些光。然后在计算机中进行一些简单的数学计算,将其转换为样品的吸光度(给定符号 A)。如果您了解光谱仪如何工作,您就会知道它使一系列波长的光穿过物质溶液(样品cell),同样地,也会穿过溶剂(参考cell)这些方程中的希腊字母 epsilon 称为摩尔吸收率 - 有时也称为摩尔吸收系数。对于穿过光谱仪的每个波长的光,测量穿过参考cell的光的强度。还可以测量该波长穿过样品池的光强度 - 给出符号。吸光度范围从 0 到 1,但也可以高于此值。
2024-09-15 14:35:09
469
原创 【论文阅读】LLM4GCL: CAN LARGE LANGUAGE MODEL EMPOWER GRAPH CONTRASTIVE LEARNING?
图对比学习的重点就是图数据的增强,针对图中节点的表示或者图的结构进行扰动,通过对比学习得到对应的节点表示,以便于进行节点分类、连接预测等。这个工作用LLM提升特征增强和结构增强。
2024-07-15 00:30:49
453
1
原创 【论文阅读笔记】Graph Invariant Learning with Subgraph Co-mixup for Out-Of-Distribution Generalization
现有的图神经网络依赖训练集和测试集是同分布的假设,现实世界存在各种形式的分布偏移,测试集就是分布外数据,将在训练数据上表现良好的gnn,用在测试集上会显著失败。所以需要捕获预测模式与标签之间的不变关系。基于不变准则:存在一定比例的数据能够捕获不同环境中数据与标签之间的不变关系。然而,现有的DIR、GIL依赖环境的划分。2.提升mixup方法使得尽可能多得保存不变信息同时排除掉环境相关的有欺骗性的相关关系。使得不变子图决定标签的类别,而削弱环境子图的影响。根据p的伯努利分布在图中采样边得到不变子图。
2024-07-07 17:43:14
474
1
原创 vscode编辑ipynb文件时候tab键冲突
点击Tab Moves Focus即可,可能是之前不小心按到了ctrl+M。突然发现tab无法补全代码,而是退出代码块编辑。
2024-05-30 12:03:45
212
原创 树状数组笔记
对于区间修改的话,我们只需要对差分数组进行操作即可,例如对区间[L,R]+k,那么我们只需要更新差分数组add(L,k),add(R+1,-k),这是差分数组的性质.对于单点查询操作,求出b数组的前缀和即可,因为a[x]=差分数组b[1]+b[2]+…+b[x]的前缀和,这是差分数组的性质之一.找到当前节点的父亲节点:i += i&(-i),修改数组的值。查询在区间[1, i]的加和。
2024-03-04 16:03:08
308
原创 统计分析笔记3
当一个分布的偏度为零时,它是对称的。它的左右两侧是镜像的。正态分布具有零偏度,但它们并不是唯一具有零偏度的分布。任何对称分布,如均匀分布或一些双峰(两个顶点)分布,也将具有零偏度。检查一个变量是否有偏斜分布的最简单方法是将其绘制在直方图中。该分布大致对称,观测值在其峰值的左右两侧分布相似。因此,该分布的偏度大约为零。在偏度为零的分布中,均值和中位数相等。零偏度:均值 = 中位数。
2024-02-27 23:48:28
799
原创 统计分析笔记2
P值是从统计检验中计算出的一个数值,描述了如果零假设为真,你发现一组特定观察结果的可能性有多大。P值在假设检验中被用来帮助决定是否拒绝零假设。P值越小,拒绝零假设的可能性就越大。所有的统计检验都有一个零假设。对于大多数检验来说,零假设是你感兴趣的变量之间没有关系,或者不同组之间没有差异。例如,在双尾t检验中,零假设是两个组之间的差异为零。示例:零假设和备择假设你想知道采用不同饮食的两组老鼠,饮食A和饮食B,其寿命是否存在差异。你可以使用双尾t检验来统计这两种饮食之间的差异。
2024-02-27 18:25:38
800
原创 统计分析笔记1
统计分析使用定量数据来研究趋势、模式和关系,是科学家、政府、企业和其他组织使用的重要研究工具。为了得出有效的结论,统计分析需要从研究过程的一开始就进行仔细的规划。需要明确假设,并对研究设计、样本大小和抽样程序做出决策。下面是两个例子,一个是潜在因果关系、另一个是变量之间的潜在相关性。因果研究问题冥想能提高青少年的考试表现吗?相关性研究问题父母的收入与大学平均绩点之间有关系吗?
2024-02-27 17:21:38
1106
原创 zotero使用gpt
zotero下载:https://www.zotero.org/download/插件下载:https://github.com/MuiseDestiny/zotero-gpt?
2024-01-16 19:11:30
2770
原创 【netstat】
Time_Wait-"TIME_WAIT"是TCP连接的一种状态。当一台计算机主动关闭一个TCP连接时,它会进入TIME_WAIT状态,这是为了确保在网络中的所有数据包都被正确处理。Listen-等待连接,套接字将进入LISTEN状态,等待客户端连接。在LISTEN状态下,套接字处于监听状态,可以接受新的连接。Foreign Address服务器的ip和端口。Send-Q表示网络发送队列,没有ack的数据。Local Address本地ip地址和端口。Established-活跃的连接。
2024-01-08 15:09:20
457
原创 【linux学习笔记】网络
最基本的网络连接命令就是ping命令。ping命令会向指定的网络主机发送特殊网络数据包IMCP ECHO_REQUEST。多数网络设备收到该数据包后会做出回应,通过此法即可验证网络连接是否正常。netstat程序可以查看不同的网络设置及数据。通过使用其丰富的参数选项,我们可以查看网络启动过程的许多特性。示例如下,使用-ie选项,我们可以检查系统中的网络接口信息。验证网站http://www.linuxcommand.org/显示文件通过网络从本地系统传输到指定主机过程中所有停靠点的列表。
2024-01-07 22:38:00
790
原创 【linux学习】重定向
命令从标准输入到读取数据,并将数据发送到标准输出的能力,是使用了名为管道的shell特性。使用管道操作符“|”可以把一个命令的标准输出传送到另一个命令的标准输入中。文件流的前三个分别对应标准输入文件、标准输出文件和标准错误文件,那么在shell将在内部用文件描述符分别索引为0,1,和2.I/O是输入和输出的缩写。这个功能可以把命令行的输入重定向为从文件中获取的内容,也可以把命令行的输出结果重定向到文件中。其中dev是device的缩写,这个文件是一个称为位桶的系统设备,它接受输入但是不对输入进行任何处理。
2024-01-07 21:15:41
442
原创 【C++】upper_bound和lower_bound
一个是返回第一个大于等于val的element的iter,另一个是返回第一个大于val的element的iter。
2024-01-07 15:22:57
367
原创 【linux学习笔记】目录与文件
cat 是在类 Unix 系统中最常使用的命令之一。它提供了三个与文本文件相关的功能:显示一个文件的内容、组合多个文件的内容到一个输出以及创建一个新的文件。(LCTT 译注:如果 cat 命令后如果不带任何文件的话,下面的命令在回车后也不会立刻结束,回车后的操作可以按 Ctrl-C 或 Ctrl-D 来结束。在 Linux 经常用于读取一个文件中的数据。如果你想向同一个文件中添加其他内容,使用两个连接的重定向符(>>)。可以用一个重定向符在创建文件的过程中加入内容。文件里面的内容是输入的内容;
2024-01-07 13:09:56
418
原创 【linux笔记】top、ps
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA,“RES” 是 “Resident Size”(常驻内存大小)的缩写。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程。VIRT — 进程使用的虚拟内存总量,单位kb。TIME+ — 进程使用的CPU时间总计,单位1/100秒。%CPU — 上次更新到现在的CPU时间占用百分比。COMMAND — 进程名称(命令名/命令行)%MEM — 进程使用的物理内存百分比。USER — 进程所有者。
2024-01-06 22:50:52
644
原创 【linux笔记1】
etc/passwd存储用户信息,它有七个字段:依次为用户名、密码、用户标识号UID、用户所属的主要群组标识号GID、用户名全称、用户主目录、用户所使用的shell类型。/etc/shadow是passwd的影子文件,用于存储用户密码或者其他/etc/passwd不能包含的信息,比如用户账号的有效期,该文件只有root用户可以读取和操作。etc文件夹:etc是拉丁语"et cetera"的缩写,意思是“和其他的”或“等等”。普通用户可以使用系统资源、运行程序,但通常不能更改系统设置或访问其他用户的文件。
2024-01-06 22:28:39
681
原创 【linux踩雷】Ubuntu中su root密码无法使用
在ubuntu的安装过程中,没有出现设置root密码,以为密码为空,但是却不能使用。先用sudo passwd更改密码,再去su root就可以了。
2024-01-06 21:24:25
1227
翻译 【论文阅读】Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network
以前的跨语言知识图谱(KG)对齐研究依赖于仅从单语KG结构信息中派生的实体嵌入,这可能在匹配两个KG中具有不同事实的实体时失败。在本文中,我们引入了主题实体图,即实体的局部子图,以在KG中表示实体及其上下文信息。从这个视角来看,KB对齐任务可以被形式化为一个图匹配问题;我们进一步提出了一种基于图注意力的解决方案,该解决方案首先匹配两个主题实体图中的所有实体,然后联合建模局部匹配信息以导出一个图级匹配向量。实验证明,我们的模型在性能上大幅优于以往的技术方法。
2024-01-04 21:16:35
225
1
原创 FID score
Frechet Inception Distance 是FID的缩写,是评估生成图像质量的指标。FID score 是作为对Inception Score 的改进提出的。inception score是根据表现很好的图片分类模型Inception v3分类生成图片集合的分类结果好坏得到的。这个分数结合了每个合成图像的条件类预测的置信度(quality)和预测类的边际概率的积分(diversity)。
2024-01-02 23:43:14
2438
原创 【neo4j】简单使用
需要建立一个symmap中医数据集的节点,从csv中读取数据下面是herb的数据将该文件放在import中将xlsx文件转换为csv但是节点乱码转换为utf-8问题解决同样的,将其他的节点也导入到数据库中其他节点相同。
2023-12-31 13:15:47
428
原创 解决长尾效应的相似度(用于推荐)
其中,Ui是浏览商品i的用户集合,如果Wu1,那么就是标准的余弦函数。一般取Wulog23qu1,其中qu是用户浏览的商品数,也就是说用户越活跃贡献越小。但是只是打压了热门用户,没有改变热门商品。
2023-12-27 00:44:29
1027
原创 【刷题】前缀树
boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true;Trie(发音类似 “try”)或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);
2023-12-25 17:11:30
456
原创 【图神经网络】在节点分类任务中无特征节点的特征表示
是满足三类性质的子图1:pattern:是(node induced)小型子图2:Recurring:有一个高的频率3:Significant:比期望的频率高,也就是说比随机生成的图中motif频率高。
2023-12-21 00:16:30
1717
原创 【图神经网络】社区检测
社区是许多网络的特性,一个特定的网络可能有多个社区,社区内的节点之间连接紧密。网络节点在社区内部形成紧密的连接,而在社区之间则形成松散连接。社区检测技术对于社交媒体算法来说非常有用,可以发现具有共同兴趣的人并将他们紧密连接在一起。社区检测也可以应用于机器学习中,用于检测具有相似属性的群组,并出于各种原因提取这些群组。例如,这种技术可以用于发现社交网络或股票市场中的操纵性群体。
2023-12-19 01:44:03
1539
原创 【torch】rsample与sample的区别
sample():从概率分布中随机采样。所以,我们不能反向传播,因为它是随机的!(计算图被截断)。torch.normal 返回随机数张量。此外,torch.no_grad() 上下文可以防止计算图进一步增长。你看,我们不能反向传播。Sample() 返回的张量仅包含一些数字,而不是整个计算图。
2023-12-13 18:54:12
1035
翻译 【gymnasium】Env
用于实现强化学习智能体环境的主要Gymnasium类。通过step()和reset()函数,这个类封装了一个具有任意幕后动态的环境。环境能被一个智能体部分或者全部观察。对于多智能体环境,请看PettingZoo。环境有额外的属性供用户了解实现−∞∞要修改或扩展环境,请使用gymnasium.Wrapper 类为了获得可重复的动作采样,可以使用 env.action_space.seed(123) 设置种子。
2023-12-13 15:08:39
397
原创 接触huggingface
按照https://github.com/samlhuillier/code-llama-fine-tune-notebook/tree/main中的教程一步一步了解。
2023-12-10 00:57:53
280
原创 【hugging face】bitsandbytes中8 bit量化的理解
因此,本质上,我们执行矩阵乘法以节省精度,然后将非异常值结果拉回到 FP16,而非异常值的初始值和按比例缩小后的值之间没有太大差异。8 位量化使数十亿参数规模的模型能够适应更小的硬件,而不会降低性能。3.改变非异常值结果以将值拉回到 FP16,并将它们添加到 FP16 中的异常值结果中。2.对 FP16 中的离群值和 int8 中的非离群值执行矩阵乘法。1.从输入隐藏状态中按列提取较大值(离群值)。
2023-12-09 01:55:24
1400
Introduction to Graph Signal Processing
2023-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人