自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(640)
  • 收藏
  • 关注

原创 学习日记-0407(Inductive Matrix Completion Using Graph Autoencoder)

这部分内容讲解了 IMC-GAE 模型中 GNN 编码器的构造流程,包括三个主要组件:整个过程将异构图中不同类型的评分信息有效整合,并为后续的链接重构(例如通过 bilinear decoder)提供高质量的节点表示。这个 xt0[i]就是节点 i 在评分子图 t 中的嵌入向量,作为后续消息传递层的输入。局部信息聚合:利用图卷积网络(GCN)的消息传递机制,在每个评分子图中聚合节点邻居的信息,捕捉局部图结构特征。多层特征融合:经过多层消息传递后,节点会有来自不同层的信息。

2025-04-07 19:40:27 462

原创 学习日记-250402

在这项工作中,我们的目标是通过从上下文构造显式的图结构来探索与图的推理。以前的提示方法基于llm的思想构造树或图,我们的图推理(RWG)方法直接从上下文构造显式图,其中节点是上下文中的实体。蓝色节点表示在上下文中明确提及并包含在初始图中的实体,而红色节点表示在生成和验证过程中添加的推断实体。最后,在知识追踪中,考虑到KCs与问题之间的一对多的关系,我们将遗忘现象归因于特定的KCs而不是问题,从而可以更有效地更新学生的知识状态。根据学生的答题情况以及所回答问题的具体特征,进一步优化和更新学生的知识状态。

2025-04-03 00:22:27 249

原创 学习日记-250329

在该模型中,我们首先从学生的非情感导向行为数据中提取情感因素,然后使用聚类和时空序列建模来准确模拟学生在处理不同问题时的动态情感变化。|sm|是训练集中所有学生的集合,ˆAF是对|sm|的情感因素的总结。2.为了模拟学生的动态情感变化,我们采用了基于时间序列的情感计算模型,对其生成的情感状态进行深度空间状态捕获,以获得情感的时空连续性特征。本任务旨在根据学生的历史回答情况,判断其在情感影响下对KC的掌握程度,并进一步预测学生在下一个KC中的表现。2.其次,我们需要模拟学生基于这些情感因素的情感变化。

2025-03-31 16:20:52 232

原创 学习日记-0328

通过。

2025-03-28 16:55:33 627

原创 学习日记0327

除了进行域间对齐之外还要进行域内对齐,域内对齐的动机是确保在同一领域内表现出相似知识掌握水平的学生在嵌入空间中更接近,从而形成更全面和互补的表征。通过这种对齐,同一领域内的节点嵌入的一致性得到了增强,允许更准确地捕获学生在不同知识概念之间的表现。wc i,j表示这两个知识概念之间的共同掌握率,即在这两个概念的练习中表现出高于平均水平的学生的比例。此外,为了进一步关注来自多个向量子空间的有价值的信息,我们引入了GAT的多头注意机制来独立地执行转换,并平均其分层的潜在表示。我们使用gnn来学习这些节点的特征。

2025-03-27 19:35:39 782

原创 学习日记-0316

1.阅读论文LLM-KT传统模型和llm在知识追踪方面的优势。传统的模型擅长学习交互行为的序列,而llm则擅长利用丰富的世界知识进行推理。Sun等人[29]通过发展渐进式知识追踪模型,在KT领域提供了一个新的视角。该模型强调学生顺序思维过程的学习过程,并将其分为三个相对独立但逐步推进的阶段:概念掌握、解决问题和回答行为,有效地模拟了从抽象推理到具体反应的过渡。llm只能处理语言序列问题,对id序列的问题处理并不好,用传统dkt方法进行qid和cid的编码,然后于llm进行对齐,解决这一问题。

2025-03-19 21:36:58 549

原创 学习日记-250305

【代码】学习日记-250305。

2025-03-05 22:41:24 390

原创 学习日记-250302

3) 作业知识是一个图,它影响学生知识状态的更新:如果一个学生正确或错误地回答了一个概念,那么他/她的知识状态不仅会受到回答概念的影响,而且还会影响到其他相关概念,这些概念在图中表示为相邻的节点。(b)时间越多,忘记的知识就越多。一般来说,从早期的工作,如DKT使用一个隐藏的状态模型知识状态在基于单个KC上,后来通过记忆增强KT模型(例如,DKVMN和SKVMN)和文本感知KT模型(例如,EKT)使用矩阵模型知识状态,基于多个KC,深度学习KT模型的趋势,表达动态捕捉知识状态表示在复杂的KC上。

2025-03-03 18:10:49 769

原创 学习笔记-250222

这些向量初始时是随机的,但随着模型的训练,它们将根据任务需求进行调整,以更好地捕捉每个用户的独特偏好或特性。其中:torch.randn 函数用于生成一个形状为 (self.user_num, self.pp_dim) 的张量,其中的元素是从标准正态分布(均值为0,标准差为1)中随机抽取的。:通过上述机制,模型不仅能够理解单个词或短语的意义,还能捕捉整个句子或段落内部以及跨句子、跨段落之间的复杂关系,从而提升对文本深层次含义的理解能力。它通过结合高层次和全局级别的提示,能够捕捉长程依赖性和复杂的语义联系。

2025-02-24 19:21:41 717

原创 学习日记-250221

虽然这不是一个正式定义的术语,但在某些上下文中,“梯度冲突”可以用来描述不同任务或目标之间的梯度相互干扰的情况,特别是在多任务学习或多目标优化场景下。例如,在一个多任务学习框架中,如果两个任务的目标函数对同一组参数的最优解方向相反,那么这两个任务产生的梯度可能会相互抵消或削弱对方的影响,这种现象可以被视为一种“梯度冲突”。与传统的微调(Fine-tuning)方法不同,它不直接调整预训练模型的所有参数,而是通过在输入序列前添加一个可训练的前缀向量集合来实现对特定任务的适应。不过上边的是2022年的。

2025-02-22 14:54:02 331

原创 学习日记-250210

看了半师兄论文,找错误。

2025-02-11 07:40:30 94

原创 学习日记-250207

任务不一致(LLM与实际任务)产生prompt提示。三. )——(

2025-02-07 22:01:48 333

原创 学习日记250205

明天认真学习了,不能再打这么久的星露谷了!三. )——(理一下微调相关的文章。

2025-02-05 22:52:20 187

原创 学习日记-250204

然后理解了一下prompt作为提示的训练机制。就扒了下师兄写的文章。

2025-02-04 21:43:37 132

原创 学习日记-250208

这篇文章主要就是通过不同的方法构建Prompt,然后提出了几种Prompt的策略来触发LLM感知行为顺序的能力。最后引入了Bootstrap来缓解位置偏差和流行度偏差。才知道四月中旬要开题......脑袋空空呜呜┭┮﹏┭┮。扒prompt+推荐代码。三. )——(

2025-02-03 22:06:07 298

原创 学习日记-250202

啥玩意,代码看不明白,怎么就promptembedding就训练出来了.....为重叠实体设计个性化的提示,为非重叠实体设计共享的域自适应提示。现在开始要继续写我的日记了......(也可以当作笔记吧)约束条件......在论文里看不懂,明天再说吧。Target_train那部分,主要是加入prompt提示,拜托真不知道怎么训出来的。二. )——(

2025-02-02 21:38:52 331

转载 迁移学习wa

1.1.1 迁移学习的定义深度学习的迁移学习是一种技术,它允许将一个任务上学到的知识或模型应用到另一个任务中。其核心思想是将一种任务中学习的特征或模型权重用于另一种任务,以实现知识的迁移和模型的优化。迁移学习在深度学习中具有广泛的应用,特别是在数据量较少的情况下。通过利用在源领域(source domain)上学习到的知识,迁移学习可以帮助目标领域(target domain)上的学习任务。迁移学习的主要类型包括特征提取、微调和共享参数。

2024-12-01 17:34:14 76

原创 pycharm远程服务器Linux下解决cannot connect to X server问题

准备就绪后:输入 xclock看下有没有可爱的闹钟弹出,或者xeyes,此时会发现可爱的小眼睛跟着鼠标走。ok,这样就是xming安装成功了,在你本机有效果了。用MobaXterm连接远程服务器的时候注意最上端:• X11-forwarding : ✓。2.在MobaXterm下输入: echo $DISPLAY。最后一行加入DISPLAY=localhost:11.0。看下localhost是多少,假设是11.0。右上角有三个点,点击进去,点击edit,在。然后run,大功告成!

2024-10-27 12:32:52 414 1

原创 conda中activate环境报错,亲测可行

http://t.csdnimg.cn/VvfxK

2024-07-01 20:27:45 158

原创 论文研读笔记2

3.在每个用户标题集中,我们按时间顺序对标题进行排序,并进一步计算平均标题相似度w.r.t.两个标题之间的位置间隔数。图1中的结果描述了一个有趣的现象,即随着位置间隔的增大,标题相似度变小,在前几个位置间隔中,标题相似度急剧下降。我们的目标是利用id来学习静态用户表示,以捕获他们在图像标题中的长期文字偏好。具体来说,利用用户id来学习长期用户文字偏好,使用用户最近生成的标题来编码短期用户文字偏好。输入数据:目标图像、用户最近的标题中的单词和用户id的编码。1.标题内容生成应该是动态的而非静态的。

2024-03-14 21:33:21 978

原创 论文研读笔记1:

1.1本篇论文提出了一种名为深度对抗性互学习(Deep Adversarial Mutual Learning, DAML)的新方法,用于改进领域适应性情感分类。通过采用两个网络联合训练来提升深度神经网络的泛化性能。该算法不仅可以用于训练高效的小网络,也可以进一步提升大网络性能,且容易扩展到多网络学习及半监督学习场景中。最后,我们认为网络在训练过程中会参考同伴网络的经验来调整自己的学习过程,最终能够收敛到一个更平缓的极小值点,从而具备更好的泛化性能。首先我们认为类别概率估计蕴含了网络挖掘到的数据本质规律。

2024-03-08 20:34:26 451

原创 jupyter内核错误

如:python -m ipykernel install --user --name py37 --display-name py37(可以和环境名一样,也可以不一样。python -m ipykernel install --user --name 【环境名称】 --display-name 【在jupyter中显示名字】2、在虚拟环境py37下安装jupyter notebook,命令:pip install jupyter notebook。

2024-01-08 23:46:40 743

原创 【无标题】CV第一步

这篇文章开始要记录我的CV学习啦~开森。

2023-09-16 22:41:04 131

原创 C. Peaceful Rooks

C. Peaceful Rookstime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputYou are given an×nn×nchessboard. Rows and columns of the board are numbered from11tonn. Cell(x,y)(x,y)lies on the...

2020-12-29 20:58:18 383

原创 linux shell 定时1s,循环语句

linux shell循环语句:i=0while(true)do date ip neigh let i++ if [ $i -eq 10000 ]; then break; fi sleep 1done

2020-11-26 17:03:52 2837

原创 shell定时脚本

shell定时脚本:1.linux下安装cron2.新建shell脚本3.在root目录下执行crontab -l 查看当前定时进程任务4.crontab -e 编辑5. */1 * * * * sh/root/hello.sh 1min前五个系数分别是min/hour/daily/weekly/monthly中间是执行脚本;后面是注释6.shell脚本用>>进行追加到文件开头:#!/bin/bashdate >>...

2020-11-25 15:25:18 396

转载 Linux access函数讲解

参数介绍:pathname 是文件的路径名+文件名mode:指定access的作用,取值如下F_OK 值为0,判断文件是否存在X_OK 值为1,判断对文件是可执行权限W_OK 值为2,判断对文件是否有写权限R_OK 值为4,判断对文件是否有读权限注:后三种可以使用或“|”的方式,一起使用,如W_OK|R_OK返回值:成功0,失败-1#include"stdio.h"#include"unistd.h"#include "string.h"...

2020-07-21 10:22:33 1505

原创 B树和B+树总结

1.B树与B+树简介:1 B树1.1 B树概念1.2 B树插入1.3 B树的删除操作2 B+树2.1 B+树概述2.2 插入操作2.3 删除操作3 B树和B+树总结1.B树与B+树简介:1 B树在介绍B+树之前, 先简单的介绍一下B树,这两种数据结构既有相似之处,也有他们的区别,最后,我们也会对比一下这两种数据结构的区别。1.1 B树概念B树也称B-树,它是一颗多路平衡查找树。二叉树我想大家都不陌生,其实,B树和后面讲到的B+树也是从最简单的二叉树变换

2020-05-29 09:24:01 485

转载 HashMap相关

一、HashMap的实现原理?1.你看过HashMap源码+原理针对这个问题,嗯,当然是必须看过HashMap源码。至于原理,下面那张图很清楚了:HashMap采用Entry数组来存储key-value对,每一个键值对组成了一个Entry实体,Entry类实际上是一个单向的链表结构,它具有Next指针,可以连接下一个Entry实体。只是在JDK1.8中,链表长度大于8的时候,链表会转成红黑树!2.为什么用数组+链表?数组是用来确定桶的位置,利用元素的key的hash值对数组长度取

2020-05-22 10:04:54 339

原创 什么是POP3、SMTP及IMAP? 

POP3POP3是Post Office Protocol 3的简称,即邮局协议的第3个版本,它规定怎样将个人计算机连接到Internet的邮件服务器和下载电子邮件的电子协议。它是因特网电子邮件的第一个离线协议标准,POP3允许用户从服务器上把邮件存储到本地主机(即自己的计算机)上,同时删除保存在邮件服务器上的邮件,而POP3服务器则是遵循POP3协议的接收邮件服务器,用来接收电子邮件的。SMTPSMTP 的全称是“Simple Mail Transfer Protocol”,即简单邮件传输..

2020-05-22 08:53:15 1580

原创 https加密解密过程

继文章https加密后,https://blog.youkuaiyun.com/xianpingping/article/details/104972717现在聊下解密流程:我们都知道HTTPS能够加密信息,以免敏感信息被第三方获取。所以很多银行网站或电子邮箱等等安全级别较高的服务都会采用HTTPS协议。  HTTPS简介  HTTPS其实是有两部分组成:HTTP + SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加

2020-05-22 08:25:35 298

转载 函数可导但是导函数不一定连续

节选自 汪林《实分析中的反例》在[0,1]上定义函数g(x)=x2sin1x,x≠0,补充定义g(0)=0, 则函数g(x)为连续函数,图形如下。导函数可求得g′(x)=2xsin1x−cos1x,x≠0并且g′(0)=0, 所以g′(x)在x=0处并不连续。导函数存在但并非R上连续函数。设{rn}为闭区间[0,1]之间所有的有理数,则函数f(x)=∑n=0∞12ng(x−rn)在[0,1]一致收敛f′(x)=∑n=0∞12ng′(x−rn)。在[0,1]上的有理数点rn上不连续

2020-05-21 16:55:55 11701 2

转载 为什么(n-1)s2/σ2服从自由度为n-1的卡方分布

卡方=((n-1)S方)/(σ方)~ 卡方(n-1)

2020-05-08 13:24:15 41675 13

转载 样本方差为何除以n-1

设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式: 很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。无偏估计 以例...

2020-05-08 13:12:41 684

原创 网页内容生成二维码图片

网页内容生成二维码形式方便手机上查看,在采用thymeleaf模板情况下的方法:js: var serurl="127.0.0.1:8080"; var url=/*[[@{/blog/{id}(id=${blog.id} ) } ]]*/"" var qrcode = new QRCode("qrcode", { text: serurl+url, ...

2020-04-22 17:57:06 668

原创 将Markdown文本转化为html文本

1.在pom中加包 <dependency> <groupId>com.atlassian.commonmark</groupId> <artifactId>commonmark</artifactId> <version>0.10.0</version> ...

2020-04-22 16:47:49 1026

原创 Sort和PageRequest方法过时问题的解决办法

1.'Sort(org.springframework.data.domain.Sort.Direction, java.util.List<java.lang.String>)' has private access in 'org.springframework.data.domain.Sort'springboot2.2.1(含)以上的版本Sort已经不能再实例化了,构...

2020-04-22 10:10:21 6291 4

原创 idea自带数据库的连接方式+时区错误的解决办法

1.开始告诉我没有Driver驱动:解决办法:在pom配置文件中加入mysql版本号。 <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> &...

2020-04-12 09:24:28 1708

转载 malloc()和free()的基本概念以及基本用法:

一、malloc()和free()的基本概念以及基本用法:1、函数原型及说明:void *malloc(long NumBytes):该函数分配了NumBytes个字节,并返回了指向这块内存的指针。如果分配失败,则返回一个空指针(NULL)。关于分配失败的原因,应该有多种,比如说空间不足就是一种。void free(void *FirstByte): 该函数是将之前用malloc分配的...

2020-04-08 16:30:04 628

原创 如果new 一个对象,用free去释放,会有什么问题?

关于C++里面的NEW/DELETE和maclloc/free。昨天面试的时候被问到这个问题,如果new 一个对象,用free去释放,会有什么问题?一时被问到这个陌生,于是就感觉来说,应该会报错。因为new与FREE不是配对的内存操作API。后转念一想,delete也是清除分配的内存,free也是同样的功能,可能不会报错,再加上因为delete处理过程中比free多一步就是调用析构函数。...

2020-04-08 11:46:07 2944 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除