- 博客(39)
- 收藏
- 关注
原创 水果批发发
尘歌壶你发的什么呀哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈好想了吗哈哈哈哈真的离谱啊哈哈哈哈哈哈哈哈好的时候了哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈笑死了哈哈哈哈哈笑死了2⃣️2⃣️2⃣️2⃣️2⃣️2⃣️2⃣️2⃣️2⃣️2⃣️。
2024-12-19 23:22:34
117
原创 【字符串匹配】KMP算法
数组记录这个记忆辅助信息, 帮助算法在匹配失败时,快速跳过一些已经匹配过的部分,减少重复计算。的前两个字符串一样,因此可以直接通过这里两个字符的比较,直接进行第三个字符的比较.思想与记忆化搜索类似,记录已经访问过的过程,保存为。,当匹配到第五个字符失败时,可以得知。开始,字符串逐一匹配,若失效则。,使用 KMP 算法来进行匹配。字符串的第一个匹配项的下标。题目要求:给定两个字符串。记忆辅助信息记录了模式串。. 假设我们要在字符串。. 在KMP算法中,通过。数组,增加时间效率.
2024-12-19 14:10:52
428
原创 【代码复现】Face X-ray for More General Face Forgery Detection
这篇文章记录了本人复现Face X-ray代码的过程以及参考的代码。由于这篇文章是笔者在完成复现完编写的,可能会有一些bug或者问题遗漏。在实现过程中,在关键点检测和混合人脸的过程推荐使用3.6版本的python环境。
2024-12-14 21:53:52
623
原创 【推荐算法】单目标精排模型——Wide & Deep
Google应用商店作者认为一个好的推荐模型需要包含和。主要负责记忆法频繁出现的特征项;主要负责挖掘新的特征组合;截至2016年,作者认为目前的基于神经网络的推荐模型会过度泛化并推荐相关性较低的物品(因此,作者提出,在原来的深度神经网络模型中加入线性部分(利用特征之间的简单交互而生成的交互特征是可记忆的、有效的以及可解释的。
2024-12-12 14:18:37
820
原创 【推荐算法】单目标精排模型——DIEN
阿里巴巴广告点击率预测截至2018年,还没有相关的推荐算法考虑到用户兴趣的趋势。作者认为大多数的模型是直接将行为视为兴趣,无法直接提取用户真正的潜在兴趣特征。因此,作者提出了DIEN模型,利用通过用户历史行为序列捕捉用户的兴趣序列特征,通过处理目标的兴趣演变过程。: 笔者认为这篇文章的模型创新关键点在于关注了RNN的隐藏状态,通过一个辅助损失训练每一个隐藏状态,每一个隐藏状态对应一个行为序列的子兴趣,并基于这些子兴趣结合注意力机制进一步学习兴趣的演化发展。
2024-12-11 17:03:38
792
原创 【推荐算法】单目标精排模型——FiBiNET
学术论文***Motivation:***传统的算法是通过内积和Hadamard product实现特征交互的,这篇文章的作者提出了采用SENET实现动态学习特征的重要性;作者认为简单的内积和Hadamard product无法有效对稀疏特征进行特征交互,因此提出实现特征交互,提出了FIBINET: 笔者认为这篇文章没有多大的模型创新点,本质上就是使用了SENET和内积与Hadamard product的融合实现。
2024-12-10 22:06:18
1255
原创 【推荐算法】单目标精排模型——DIN
阿里巴巴广告推荐***Motivation:***传统的算法会在用户的不同兴趣上产生瓶颈,这些算法是通过模型输出的用户不同行为序列的特征向量,做一个池化操作最后预测点击率,这种固定的特征往往不能够反应用户不同的兴趣特征,池化操作会损失特征信息。例如在广告推荐系统中:一名游泳运动员会点击推荐的护目镜,主要是因为他买了泳衣,而不是他上周购物清单上的鞋子。因此在这篇文章中,提出了自适应计算用户的兴趣Embedding。
2024-12-09 16:09:59
1313
原创 【推荐算法】推荐系统中的单目标精排模型
推荐系统中模型发展较快,初学者【也就是笔者】很难对模型进行一个系统的学习。因此,这篇文章总结了王树森中的视频以及《深度学习推荐系统》中的单目标精排模型,绘制了一个单目标精排模型的思维导图来帮助初学者【笔者】更好的学习。在后面的学习过程中,会加入更多的单目标精排论文的学习过程以及丰富思维导图。
2024-12-07 20:30:10
914
原创 【词向量表示】Word2Vec原理及实现
语料库十分巨大,每个单词都采用one-hot输入训练会大大增加存储和计算开销,因此,在输入的过程,仅仅输入单词的索引值,例如在上述例子中,直接采用索引4进行输入,同样也可以得到相同的词向量。:表示输入层到隐藏层的权重矩阵,是从one-hot向量到Embedding向量的关键,[7, 3]表示训练完成的每一个embedding向量维度为3;激活函数判断哪一个单词的概率最大,因此需要计算所有单词的概率大小。单词与单词之间的向量往往不在同一个向量空间,例如,传统的编码方式:one-hot编码,不同单词。
2024-12-05 11:13:51
854
原创 【频域后门攻击】An Invisible Black-box Backdoor Attack through Frequency Domain
An Invisible Black-box Backdoor Attack through Frequency Domain》生成扰动的方式较为简单但有效,通过对中、高频的幅值加入一定的扰动来生成中毒样本了。
2024-12-05 08:04:03
364
原创 【词向量表示】Item2Vec、DeepWalk、Node2vec、EGES词向量生成算法
语料库十分巨大,每个单词都采用one-hot输入训练会大大增加存储和计算开销,因此,在输入的过程,仅仅输入单词的索引值,例如在上述例子中,直接采用索引4进行输入,同样也可以得到相同的词向量。:表示输入层到隐藏层的权重矩阵,是从one-hot向量到Embedding向量的关键,[7, 3]表示训练完成的每一个embedding向量维度为3;激活函数判断哪一个单词的概率最大,因此需要计算所有单词的概率大小。单词与单词之间的向量往往不在同一个向量空间,例如,传统的编码方式:one-hot编码,不同单词。
2024-12-04 15:34:27
539
原创 【推荐算法】推荐系统的评估
这篇文章是笔者阅读《深度学习推荐系统》第五章推荐系统的评估的学习笔记,在原文的基础上增加了自己的理解以及内容的补充,在未来的日子里会不断完善这篇文章的相关工作。
2024-12-03 23:16:57
1240
原创 【机器学习算法】XGBoost原理
的方式:选取一定的特征分裂,每一个弱学习器选取子特征集,例如从原有特征选择80%的特征,而弱学习器的每一个结点也可以在当前树下的子特征集重新随机选取,也可以全部使用进行遍历。的方式:对特征的值进行分桶,例如某一特征的值为0-9,分为五个桶只需要遍历五次,大大增加运算效率,桶数越大,与精确贪心算法的越接近,当每个桶只有一个样本时,即为精确贪心算法。,进一步划分的叶子节点数目为2,假设划分后的左子结点的样本二阶导之和为。 损失减少,则表明当前分裂work,记录当前分裂特征和阈值,表示当前弱学习器的叶子节点。
2024-11-30 20:33:56
1869
原创 【评价指标】ROC曲线与AUC
的变换后的输出结果,对应的TPR、FPR如表示所示,可以发现不同阈值的结果不同。如图所示,x轴表示最后模型的输出概率,y轴表示经过。 不同阈值的设置会造成大量的参数和结果,为此,ROC曲线以。:正样本被正确分类个数与所有正样本的总数的比值。:负样本被错误分类个数与所有负样本的总数的比值。在机器学习与深度学习模型中,模型输出阈值。的设置会直接影响到结果的判断。表示正确分类的正样本,表示正确分类的负样本,表示错误分类的负样本, 在二分类中一般采用。表示错误分类的负样本。
2024-11-29 23:02:27
953
原创 【机器学习算法】GBDT原理及实现
与Adaboost模型不同, GBDT是基于梯度优化的,而Adaboost是基于权重优化的,重点训练了错分类的样本,对异常值较为敏感,GBDT通过优化损失函数的负梯度作为近似残差,指导每棵树的生长。梯度提供了方向和幅度信息,能更精确地找到优化路径。 针对不同的问题,不同的损失函数有不同的优化方式,GBDT提出了一般决策优化问题。 对于最后的回归输出进行。
2024-11-29 17:26:36
1339
原创 【机器学习算法】Adaboost原理及实现
在模型优化更新权重的过程中,并不是与传统模型一样采用梯度下降法,因为弱分类器的数量多,更新的参数多,难以实现,在Adaboost模型中采用的。【错误\正确】分类的样本,在加入新的弱学习器中【提高\降低】分类【错误\正确】样本的。 可以发现,指数损失函数在【正确\错误】分类的样本的值【小于\大于】1,正好符合。在加入新的弱学习器中【提高\降低】分类【错误\正确】样本的权值。,对应正确样本的权值会减少,同理当错误分类时,求导的结果,表示损失最小的。加法模型的实现思路,,对应样本的权值增加。
2024-11-28 21:27:52
949
原创 【算法】欧拉函数、快速幂、容斥原理
一个数可以被质因子表示,而除了质因子及其倍数,剩下的个数都是与n互质。注:如果能够整除的话是不可能会mod == 1的。 1-N总共有N个数,首先将质因子。思路:将k分解成2的指数幂相加,例如。的5可以转换为2进制形式101,因此。等质数至少一个整除的整数有多少个。的结果,一般做法的时间复杂度是。:表示1-n中与n互质的个数。,最后只需利用快速幂求出。要求:求出1-n中可以被。,快速幂的时间复杂度是。要求:已知b,求使得。
2024-11-27 09:14:39
832
原创 【数论】Acwing质数与约数
只需要对质数的倍数进行删除,合数的倍数在质数的处理过程也会被删除(唯一分解定理)以360为例,可以分解为2 * 2 * 2 * 3 * 3 * 5,可以写为。核心思想:a, b 的最大公约数就是 b, a mod b 的最大公约数。线性筛法:本质上一个合数只会被最小质因子筛掉,减少了埃氏筛法的重复计算。:一个合数可能被多个数筛掉,存在重复计算。除了开方的数,其他因数都是成对出现的。的约数又可以组成一个新的约数,例如。个,而$2^3 $和$3^2。:从1~n的数字将倍数都删除。
2024-11-23 09:42:43
1085
原创 【人脸伪造检测】Self-Supervised Video Forensics by Audio-Visual Anomaly Detection
虽然离散时间延迟(Discrete time delays)特征很容易表示出来,但是作为特征会损失很多信息,例如当前的延迟信息存在着歧义,因此,文章提出了预测完整的时间延迟分布作为同步特征,即每个帧的延迟时间的概率。 基于上述模型提取的同步特征,进一步的需要对视频的同步特征异常进行检测。 从原视频中直接学习视听特征是困难的,为了能够更好的从真实视频中学习到视听特征,文章提出从。:提出在视听特征中实现异常检测,该特征包含了视听特征的一致性。该特征表示当前帧相对于听觉信号的延迟(提前)的帧数, 特征为。
2024-11-18 09:16:20
814
7
原创 【伪造检测】Noise Based Deepfake Detection via Multi-Head Relative-Interaction
实现的,这是一种由于相机感光传感器而造成的缺陷噪声,主要用图像的源识别,在伪造检测的任务中并没有很好的表现。 伪造人脸图像只会对人脸进行操作,为了能够防止在背景信息中也提取到被操作的像素,在选取背景区域时选择离人脸最远的区域。:传统算法基本都是采用余弦计算相似度的,然而,由于输出的图像的噪声数据,只采用单一的余弦值作为相似度判断会导致。① Siamese网络结构在两个分支中的可学习的权重是共享的,用于噪声特征的提取,在该结构中采用预训练的。学习人脸和背景的噪声特征的相似度,从多个维度学习相似度;
2024-11-17 21:58:14
1200
原创 【算法】二分查找
可以发现,针对①、②两种情况,可以有不同的问法,例如在②情况中,也可以适用于找到4的最后一个元素,只需要在找到的索引上。① 有多种情况满足条件,找到满足条件的最右索引,例如找到值为4的最右索引(也可以换为小于5的最后一个元素) ② 有多种情况满足条件,找到满足条件的最左索引,例如找到大于4的第一个元素…查找有序数列中值为4的最后一个元素,[1,3,4,4,4,4,6,8,9]二分查找往往需要和其他类型的算法结合,所以题目所需涉及的内容不只是二分查找。 ③ 仅存在一种满足条件的情况,①、②代码都适用。
2024-11-15 14:12:52
763
原创 【算法】状态压缩DP
相对于上面的状态转移,这种情况较好分析,只需要满足当前行玉米田的坏田状态与当前状态是否有同时为1的列即可,若有则当前状态不满足,若无则满足,该条件判断与判断相邻行是否同时种植一致。的玉米田中种玉米,有一些坏掉的土地是不能种玉米的,另外相邻的两个田也不可以种,一共有多少种种植方案(荒地也算一种),如图所示,由于相邻的土地不能种植,此时一号土地已经不能种植。题目与玉米田的思路基本一致,多了一个判断问题,即对角的国王也会相互攻击,为了加入此情况,在状态转移的判断条件上需要加入对角判断的处理。
2024-11-09 22:40:09
1128
原创 【人脸伪造检测】Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in Frequency Domain
利用相位谱实现伪造检测,并且证明了卷积模型可以提取隐性特征。是伪造模型的关键步骤,这篇论文通过相位信息检测上采样的伪影。:通过离散余弦变换后的统计特征实现伪造检测。
2024-11-09 09:48:28
254
原创 【人脸伪造检测后门攻击】 Exploring Frequency Adversarial Attacks for Face Forgery Detection
现有的后门攻击方法生成的对抗样本容易被识别,只是在空间域增加了扰动。为此,作者提出了一种频率对抗性攻击的方法,在频域中增加了对抗性的扰动。由于Eff b4和Xcep之间结构的明显差异,两个网络之间的对抗性攻击相互之间的可转移性有限。:空间域和频率域混合攻击,元学习实现交替式的混合攻击学习。:从四种算法中选取 560张假图(140。,最终通过逆变换生成对抗样本。:隐藏在频带中,不易于被发现。: 黑盒攻击存在过拟合现象。
2024-11-07 22:50:59
1909
原创 【客户投诉系统】 Sringboot+vue+soap+activiti+mybatis+element-ui
NOTE]分享课程系统,SpringbootmybatisActivitisoapElement-UIVue:用户可以对不同的平台,例如美团、学习通、饿了么等进行投诉(Springbootmybatis),工作管理员会对该投诉信息进行审批(Activiti),若审批通过,通过soap服务传递给对应平台提供的接口,对不同的平台设置了处理投诉的变量,模拟处理时间,当默认有工作人员在处理,当处理时间为0时,表示投诉处理完成,通过请求将对应ID的投诉信息返回。
2024-11-07 21:20:35
738
原创 Go语言基础语法学习
init函数 执行顺序:全局变量 → init函数 → main函数,若有包导入则先执行其他包的。字符类型用byte保存,保存ASCII的字符,但是汉字不行(需要三个字节),Go的字符串是由。golang 仍然有继承封装多态的特性,但是没有extends关键字,通过匿名字段实现。字段在内存中是连续的,指针的地址是连续的,但是指向的地址不连续。默认变量名,小写开头是私有的,大写字母开头是公有的。切片,指针类型(数组第一个的地址,长度,容量)new,存储的不是值而是地址,是指针类型。
2024-11-04 08:10:26
568
原创 【人脸伪造检测后门攻击】 Is It Possible to Backdoor Face Forgery Detection with Natural Triggers?
CAUTION]本篇论文主要是关于AIGC生成人脸的后门攻击,与换脸技术的后门攻击有差异,因此本篇文章主要研究trigger的生成部分,后面的实验部分不加以研究。
2024-11-02 15:14:57
1173
原创 【人脸伪造检测后门攻击】 POISONED FORGERY FACE: TOWARDS BACKDOOR ATTACKS ON FACE FORGERY DETECTION
存在原因:对真实图像嵌入trigger时,在混合生成负样本时也会同时嵌入trigger,模型在训练时无法直接将trigger图像和正样本联系在一起,还会和负样本联系在一起。在研究动机中提到了人脸混合检测模型在训练过程中只使用真实样本,模型在训练时不会只将trigger和正样本联系在一起,还会与负样本(由正样本混合而成)联系在一起。是再现边界的关键步骤,并且是可以处理微分计算的,因此,作者在训练时在平移变换操作下优化trigger。:最大化正样本和负样本之间的trigger差异,如公式所示,最终的目标是。
2024-11-02 09:49:06
945
原创 【算法】DP问题——状态机模型
在没理解到使用状态压缩DP时,我尝试用一维数组建立,遍历可能存在的不同状态:① 继续喝同样的饮料;小时内选择饮用这两种饮料中的一种,以最大化总能量。但是,如果你从一个饮料切换到另一个,你需要等待一个小时才能开始获得能量。,分别代表两种能量饮料每小时提供的能量,在接下来的。,每一个状态都可能来自于不同的状态,切换状态的第。家房屋的状态划分为偷与没偷,对应了入门例子的第。的二维DP数组,若题目有三种饮料就是。,以入门例子为例,第一个状态是第。题目简述:有两个数组。
2024-11-01 17:22:50
439
原创 【数据结构】前缀树(Trie 树)
例如在{“911”, “91140”,“20”,“912”}中,“911”是“91140”的前缀。要求:在一组数找到两个数的最大异或值,以长度为3的数字为例子,当与“001”配对的能达到最大异或值的数字为“110”,即为反码。将字符串的每一个元素视为一个节点,例如“911”中将“9”,“1”,“1”视为不同的节点。例子:在[“001”,“101”,“100”,“111”] 中找到与 “111” 最大的异或对,从最高位开始,存在依次与。:二维数组,son[N] [10],记录所有节的子节点的索引号。
2024-10-30 15:34:25
650
原创 NICE: NON-LINEAR INDEPENDENT COMPONENTS ESTIMATION
为了实现该想法,需要保证在变换过程中的雅可比行列式计算和逆运算方便,NICE提出了。 为了实现不同的通道参与变换,在实现过程中通过交替变换的方式,例如第 i + 1 层是。容易计算,如下所示,可以发现,无论m变换多么复杂,该变换的雅可比矩阵值行列式的值都为1.可以发现每一次的变换相对于在原来公式的基础上在乘以一个雅可比矩阵的行列式。的雅可比矩阵行列式是1,因此取对数后为0,因此为了丰富权重,还加入了。的雅可比矩阵始终为 I,因此最后得到的输出结果为。时,通过逆变换可以生成新图像,可以记为。
2024-10-29 15:05:35
804
原创 【数据结构】单调队列
在窗口大小上限为k的数组窗口中,始终保持该窗口的第一个值为该窗口的最大(小)值,并且窗口内的剩余值单调递减(递增)窗口内存储索引的效率往往会比存储元素值的效率要高,不同存储方式判断窗口是否满了的方式不同;用数组存储窗口的效率不如双端队列,因为有删除第一个元素的操作;每日一题, 与单调队列相似,也可以看作是维护一个窗口的最大值。题目要求:依次输出在数组中以k为大小的滑动窗口的最大值。一种维护数组窗口最大值或者最小值的方法。该题目前采用动态规划的变形解决。
2024-10-27 22:21:09
851
原创 为什么hanlp安装不了?我通过以下方法解决啦
(1)安装Microsoft Visual C++插件conda install -c conda-forge jpype1(2)利用清华源安装hanlp就成功啦pip install -i https://pypi.tuna.tsinghua.edu.cn/simple hanpl
2022-05-09 16:50:22
972
原创 java数据库连接——(不听课也能连)
一、前言在刚接触数据库连接的时候会有很多人连接失败,包括我在初学的时候也不知道应该怎么去连接数据库,包括怎么去找连接数据库的jar包,连接mysql的时候为什么要用navicat...这篇文章是为了让初学者更好的完成数据库连接。 二、前置知识1.为什么连接mysql数据库要用到navicat软件,可以不用吗?答:是可以的,navicat软件类似于一个前端窗口,可以使得我们对mysql进行图形化操作,但是如果没有navicat我们要对mysql进行...
2022-04-12 20:04:03
1219
1
原创 lingo学习
day1 上午求获利最大有目标函数以及约束函数:max = 72*x1+64*x2;x1+x2<50;12*x1+8*x2<480;3*x1<100;在lingo中,①默认变量为>=0,若需要变成实数则需要@free(x1)②<与<=是等价的运行所得到的结果:做灵敏度分析(只能用在连续型,不能离散型)的话还需要调整选项:然后点击range才会出现。回到最初的问题:1.最大获利为:3360,x1为20.
2021-06-28 20:42:12
3238
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人